IBM官宣全新光學技術,用光也能訓練AI?
近日,IBM宣布了一項重大的光學技術突破,該技術可以以光速訓練AI模型,同時節省大量能源。 這篇IBM發布的技術論文顯示,這...
近日,IBM宣布了一項重大的光學技術突破,該技術可以以光速訓練AI模型,同時節省大量能源。
這篇IBM發布的技術論文顯示,這項技術是一種新型的共封裝光學技術(co-packaged optics),可以利用光速實現數據中心內部的連接,從而替代目前使用的銅電纜。
盡管光纖技術已在全球商業和通信中廣泛應用,但大多數數據中心內部仍依賴于銅電纜進行短距離通訊。這導致 GPU 加速器在訓練過程中常常處于閑置狀態,浪費大量的時間和能源。因此IBM的研究團隊展示了如何將光的速度和容量引入數據中心,顯著提高數據中心的通信帶寬,減少 GPU 的閑置時間,從而加速 AI 模型的處理速度。
IBM高級副總裁兼研究總監Dario Gil在評論這一技術時表示:
“由于生成式AI需要更多的能源和處理能力,數據中心必須不斷發展——而同封裝光學器件可以使這些數據中心面向未來。有了這一突破,未來的芯片將像光纖電纜將數據傳入和傳出數據中心一樣進行通信,開啟一個更快、更可持續的通信新時代,可以處理未來的 AI 工作負載。”
至于效果如何,根據IBM計算出的結論表示,大型語言模型 (LLM) 的訓練時間可以從三個月縮短到三周。同時,提高能源效率將減少能源使用量并降低與訓練 LLM 相關的成本。換算成發電量的話,訓練 AI 模型時節省的能源相當于5000個美國家庭的年度能源使用量。
事實上,CPO并不是最近才有的新技術。早在一年前,臺積電就攜手博通、英偉達等大客戶共同推進這項技術的研發進度,制程技術從45nm延伸到7nm,原計劃2024年就開始迎來大單,并在2025年左右達到放量階段。
這種所謂的“硅光芯片”,是在硅的平臺上,將傳統芯片中的電晶體替換成光電元件,進行電與光訊號的傳導。對比傳統芯片會出現電訊號的丟失與耗損的情況,光訊號不僅損耗少,還實現更高頻寬和更快速度的數據處理。
原理上很簡單,但實際推廣上難度并不小。
首先,硅光產品并沒有到大規模需求階段。雖說有自動駕駛和數據中心兩大領域的需求,但目前還沒有主流芯片廠商推出高性能芯片。
其次,硅光產品需要考慮相對高昂的成本問題。受限于大量光學器件,一個硅光器件需要采用各種材料,在缺乏大規模需求的情況下,硅光產品成為一種“高價、低性價比”的產品。同時,器件的性能與良品率難以得到保障。
最后,硅光芯片在打通各個環節還需要努力。例如設計環節,雖然已經有EDA工具支持,但算不上專用;而在制造與封裝環節,類似臺積電、三星等大型晶圓代工廠都沒有提供硅光工藝晶圓代工服務。即便是已經推出COUPE技術的臺積電,短時間內會專注于封裝方案,很難勻出產能提供給硅光芯片。
另外,不同廠商對于硅光產品的理解也各不相同。目前作為硅光賽道真正的老大哥英特爾已經陷入了低谷,很難抽出精力繼續硅光子技術。
因為這次IBM推出CPO技術,大概率只是儲備新技術,距離商用還有段時間。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
