婷婷开心六月久久综合丁香,免费大片黄在线观看,黄片中文字幕免费大全110,国产69久久精品成人看,美女免费黄色av网站在线观看,91精品国产91久久久久久,在线观看黄片欧洲

 
當前位置: 首頁 > 出行資訊 > 全國 > 正文

WPK官網(wǎng):特斯拉披露百萬核心Dojo超算故障檢測技術,失誤一次數(shù)周訓練白費

發(fā)布時間:2025-06-22  來源:

wpk撲克提供德?lián)淙PP官網(wǎng)最新版本下載鏈接地址,正規(guī)德州APP安卓IOS蘋果正版安裝,推薦加入德?lián)淙ε判星笆?lián)盟wpk俱樂部,24小時營業(yè)百桌同開、微級別、大級別優(yōu)質牌局隨心挑選。

為每個核心分配 0.5MB 隨機指令專屬負載,利用訓練模塊內部高帶寬通信(而非主機通信)實現(xiàn)核心間負載傳遞與順序執(zhí)行,將指令測試量提升至 4.4GB 且大幅縮短時間使核心在不重置狀態(tài)下多次運行負載,增加執(zhí)行環(huán)境隨機性以暴露潛在錯誤。公司稱執(zhí)行次數(shù)增加帶來的速度損失遠低于檢測可靠性提升通過 XOR 操作周期性整合寄存器值至指定 SRAM 區(qū)域,使缺陷計算單元識別概率提升 10 倍(經缺陷核心實測),且性能損耗可控

WPK官網(wǎng)

特斯拉將晶圓級 Dojo 處理器稱為“訓練模塊”,每個模塊包含 25 個 645mm2 的 D1 Chip,采用臺積電 InFO_SoW 技術封裝,集成 354 個定制的 64 位 RISC-V 核心(含 1.25MB SRAM 用于存儲數(shù)據(jù)和指令),以 5×5 集群排列并通過機械網(wǎng)絡互聯(lián),可提供 10TB/s 帶寬。每個 D1 還支持 4TB/s 片外帶寬,因此單個“訓練模塊”總共具備 8,850 核心,支持 8/16/32/64 位整數(shù)及多種數(shù)據(jù)格式。

WPK官網(wǎng)

IT之家 6 月 7 日消息,特斯拉昨日發(fā)文,向用戶介紹了其百萬核心級 Dojo 超算系統(tǒng)的故障核心檢測技術。

據(jù)介紹,該公司開發(fā)的 Stress 工具能夠在不停機的狀態(tài)下,跨處理器乃至跨集群檢測易引發(fā)靜默數(shù)據(jù)錯誤(SDC)的核心。

由于 Dojo 大芯片的超高復雜性,即使在制造過程中也難以 100% 檢測缺陷晶粒,而靜默數(shù)據(jù)錯誤的檢測更困難。

特斯拉報告顯示,經優(yōu)化配置的 Stress 監(jiān)測系統(tǒng)在 Dojo 集群中檢出大量故障核心。檢測耗時分布呈現(xiàn)兩極分化:多數(shù)缺陷在執(zhí)行 1GB-100GB 負載指令(數(shù)秒至數(shù)分鐘)時被發(fā)現(xiàn);難檢測缺陷需執(zhí)行 1000GB 以上指令(數(shù)小時)。

為應對核心故障風險,特斯拉最初采用差分模糊測試技術:生成隨機指令集并同步發(fā)送至所有核心,通過比對輸出結果識別差異。但因為主機與訓練模塊間通信開銷過大,該過程耗時明顯過長。

雖然 SDC 在所有硬件上都難以避免,但 Dojo 處理器有著8,850 個核心、18000A 電流及 15000W 的超高功耗,這會嚴重放大其影響,因此所有核心必須按設計運行,否則單個數(shù)據(jù)錯誤便可毀掉整個耗時數(shù)周才能完成 AI 訓練成果。

特斯拉表示,該技術不僅適用于訓練模塊層級或集成 12 個模塊的機柜層級,更可在集群層級運作,實現(xiàn)百萬級運行核心中的故障定位。

特斯拉表示,Dojo 是當前全球唯二現(xiàn)存的最大處理器之一。這種晶圓級芯片采用整片 300mm 晶圓制成,單芯片尺寸已達物理極限。

為了提高效率,特斯拉想辦法改進了其檢測技術,這個過程主要通過三項創(chuàng)新來完成:

特斯拉透露,Stress 工具除檢測故障核心外,還能發(fā)現(xiàn)罕見設計級缺陷并通過軟件調整修復。在監(jiān)測系統(tǒng)廣泛部署期間,多個底層軟件問題也被發(fā)現(xiàn)并修正。IT之家從官方獲悉,目前 Stress 工具已全面集成至運行中的 Dojo 集群,在 AI 訓練期間實施硬件健康監(jiān)測。特斯拉表示,通過該監(jiān)測觀察到的故障率與谷歌和 Meta 公布的數(shù)據(jù)相當,表明監(jiān)測工具與硬件水準達到行業(yè)同等水平。

需強調的是,Stress 工具測試負載輕量且核心自包含,支持后臺測試無需離線。最終僅故障核心會被禁用,且每個 D1 芯片可容忍數(shù)個核心失效而不影響整體功能。

 
相關閱讀
 
推薦圖文
最新信息
推薦信息
Copyright © 2012 - 2020 交通出行網(wǎng) 版權所有
京公網(wǎng)安備 11010702001433號 京ICP備11022796號

電腦版 | 手機版