高端GPU瘋狂缺貨,誰有機會挑戰英偉達?

jh 2年前 (2023-08-16)

AI生產力的爆炸還在繼續。

AI時代,但凡廠商涉及到AI相關業務,都或多或少分得這個萬億級市場的一杯羹。

但喧鬧之下,真正能算得上“AI贏家”的廠商屈指可數。其中,手握核心算力的英偉達可謂一騎絕塵,在業務、營收等方面都遙遙領先于競爭對手。

受大模型和生成式AI需求暴增影響,英偉達借助著出色的GPU硬件瘋狂吸金,慢慢打造起自己的“AI壁壘”。

不過壟斷之下必有勇夫,在想象力無限的“錢景”面前,硅谷巨頭和初創公司們顯然不會甘心英偉達獨吞市場。

有缺口,就有機會

英偉達能在AI行業率先領跑,靠的是黃仁勛敏銳的市場觀察力。

早在“AI寒冬”時,英偉達就開始逆勢投資,全力押注AI,布局了“CPU+GPU+DPU”產品矩陣。因此,英偉達的AI壁壘其實早早就已經建好,不僅搶跑了AMD、英特爾等競爭者,同時也震懾了后來者。

隨著AI浪潮的到來,英偉達的產品迅速搶占了市場,在“訓練”和“推理”兩大環節,英偉達GPU已經做到了一家獨大,包括AWS、Azure、谷歌云、一眾國內主流云廠商,以及微軟、谷歌旗下的大模型產品,都極度依賴英偉達的高端GPU來訓練。

一方面,英偉達的高端GPU產品足夠優秀,支撐得起廠商們的AI算力需求;另一方面,以CUDA為代表的英偉達并行計算和編程平臺是目前市面上能找到最好產品,AMD、英特爾都沒有替代品。

最終,英偉達幾乎成了AI芯片的唯一選擇,獨享市場也并不奇怪。

不過壟斷之下,英偉達高端GPU逐漸成了一種稀有資源,尤其是最頂尖的H100顯卡,只有少數科技巨頭才有渠道購入,就連馬斯克旗下AI初創公司xAI 都得排隊才能購入。

據媒體報道,H100在今年8月的市場總需求可能在43.2萬張左右,排期則到了2024年第一季度到第二季度。在瞬息萬變的AI競賽場,半年時間的窗口期足夠一輪洗牌。

面對這樣的缺口,英偉達的對手們自然不會錯過這個機會。

同為GPU巨頭的AMD,最初并沒有將AI列為第一戰略。比起英偉達,他們的AI產品更專注于傳統路線,盡可能優化產生大量數據時的工作負載,以此實現性能的提升。

因此,雖然AMD的EPYC Milan處理器在數據中心有非常高的采購率,但并不適配AI訓練,同時由于AMD的ROCM生態剛剛起步,并不適合一些AI場景,這就導致AMD的GPU產品雖然出色,但很少被科技公司采購。

不過,當下市場急需一個“平價版”的英偉達,AMD無疑是最好的選擇。

就在今年6月,AMD推出MI300X,這款新芯片預計Q4開始出貨,在英偉達GPU極度缺貨的情況下,在HBM容量和帶寬上瘋狂堆料的AMD MI300X或許成為一款很好的替代品。

至于英特爾,雖然在GPU市場很難取得突破,但憑借多年來的“人脈關系”,英特爾在中國市場與合作伙伴推出了特供版深度學習加速器——Habana Gaudi 2。

這款產品最大的特點就是在符合美國工業與安全局出口規定的前提下,性能沒有縮水。英特爾聲稱,目前Gaudi 2比英偉達A100價格更有競爭力,且性能更高。

對于中國AI廠商來說,在H100、A100芯片無法供應中國市場的情況下,英特爾聯合合作伙伴推動Gaudi 2 AI加速器在中國市場的布局,無疑會給整個市場帶來變革,這是中國市場對于AI算力的強大需求所決定的。

不同路線層出不窮,初創企業看向差異化

大模型瘋狂索取算力,除了消耗著GPU產品的性能,同時還吞噬著大量的能源。

根據斯坦福人工智能研究所(HAI)發布的《2023年人工智能指數報告》,OpenAI的GPT-3單次訓練耗電量高達1287兆瓦時。有專家推算,這個耗電量相當于3000輛特斯拉,每輛跑滿20萬英里(32.2萬公里)。而這還只是ChatGPT一個大模型的耗電量,其他大模型全部運作的耗電量,更是難以估量。

在龐大的功耗下,H100芯片成了AI廠商的一個“負擔”,同時也為一些新興的初創芯片廠商提供了利好消息。包括存算一體、Chiplet、HBM等解決方案紛紛被廠商挖掘出來,目的是實現AI芯片的降本增效。

例如在Chiplet賽道,加拿大AI芯片初創公司Tenstorrent就是目前比較亮眼的獨角獸之一,他們在2021年吸引了傳奇芯片專家Jim Keller作為公司總裁兼CTO,并在此后拿下多筆巨額融資。

據報道,他們計劃以異構和Chiplet設計的形式來開發RISC-V和AI芯片,目前已經開發出基于12nm工藝的Grayskull和Wormhole兩款芯片,FP8算力高達328TFlops,在進度上非???。

而在高性能AI芯片方面,Tenstorrent計劃于2024年推出可對標英偉達最新發布的GH200 Grace Hopper平臺,其最大特點就是相比類似性能的GPU系統便宜5到10倍。

靠著完善的產品規劃和技術骨干團隊,Tenstorrent在最近一次是從現代汽車集團和三星的投資基金籌集到1億美元用于產品開發,其估值也提升到14億美元以上。

還有一些初創企業并沒有直接從芯片角度出發,例如初創公司Modulal就是從英偉達壟斷的AI軟件領域入手,希望通過其軟件為企業提供了另一種選擇,使開發者可以更簡單地在其他公司設計的芯片上訓練和運行機器學習模型,包括英特爾、AMD的GPU以及谷歌的TPU等等。

這家公司的來頭同樣不小,其聯合創始人兼首席執行官Chris Lattner在蘋果公司任職期間,參與創建了Swift編程語言。而Modular的種子輪融資名單里包括了知名天使投資公司SV Angel。

除了前面提到的方向以外,硅谷還有不少初創企業從其他賽道入手,并與巨頭抱團共建生態,希望借此搶下一些市場份額。

當然,不單是國外芯片企業大秀肌肉開始了芯片競爭,國內半導體公司也開始了對AI芯片的研發。包括摩爾線程、天數智芯、沐曦在內的多家國產GPU芯片都得到了金額較大的融資,產品研發進度也非???。

寫在最后

大模型時代,算力作為最重要的基礎設施,目前已經成為一種稀缺資源??梢哉f,誰掌握了算力,就手握了競爭的資本。這其中,擁有GPU核心技術的英偉達更是提前建好了“AI壁壘”,讓競爭者們羨慕不已。

不過AI市場非常大,同時半導體行業又具備復雜性,英偉達GPU在一卡難求的情況下,市場必然尋找替代品,這為后來者們提供了難得的機遇。

當然,英偉達的護城河足夠深,并且保持著可持續競爭優勢。除了H100以外,英偉達近期拋出新一代GH200 Grace Hopper超級芯片、AI Workbench、AI Enterprise 4.0,以及Hugging Face等重磅武器。既然數量供不上,那就以質換量。

當然,這些產品的門檻非常高,目前來看仍只是少數科技巨頭才有機會采購。

隨著賽道越來越激烈,英偉達絲毫沒有松懈,AI生產力的爆炸還在繼續。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到