頂配12999元的RTX 40系列、算力2000 TOPS的自動駕駛芯片……英偉達「狂秀肌肉」
“親兒子”背刺,汽車客戶著手自研,以太坊合并……面對諸多外部因素,英偉達之后會如何呢?
昨日夜間11點,依舊一身皮衣的黃仁勛亮相發布會,一連發布多款新產品,帶來了兩年一大升級的GeForce RTX 40系列,也帶來了自動駕駛領域的最新之作。
其中,如同此前網上所傳聞的,RTX 40系列首發產品包含GeForce RTX 4090和GeForce RTX 4080兩個型號三款產品,至于其性能如何,我們接下來慢慢看。
RTX 4090:新架構、DLSS 3與臺積電4nm工藝
在首發的三款產品中,RTX 4090 GPU為旗艦產品,采用了臺積電4nm工藝,擁有760億個晶體管、超18000個CUDA核心和美光24GB GDDR6X顯存,能夠在4K分辨率的游戲中持續以超過100 FPS運行。
而取代過往的Ampere架構,此次RTX 40系列首次采用了新架構——Ada Lovelace,這是一位女性的名字,她被許多人認為是世界上第一個計算機程序員。
依據黃仁勛介紹,基于Ada Lovelace架構,RTX 40系列在SM多單元處理器等方面都進行了換代升級。
比如SM多單元處理器,性能最高達到90 TFLOPS,吞吐量是上一代Ampere架構的2倍。其中英偉達全新引入了Shader Execution Reordering(著色器執行重排序技術),通過即時重新安排著色器負載來提高執行效率,從而更好地利用GPU資源。依據老黃現場介紹,基于這一改變,RTX 40系列可獲得2-3倍的光線追蹤性能提升,整體游戲性能提升可高達25%。
再來看RT Core,其擁有了兩個全新硬件單元,分別是Opacity Micromap和Micro-Mesh引擎,前者將光線追蹤的Alpha-Test幾何性能提升2倍,后者可動態生成微網格,在不犧牲性能和存儲的前提下產生額外的幾何圖形以提升豐富度?;谶@一升級,RTX 40系列擁有2倍的射線三角形相交吞吐量,有效光線追蹤計算能力達到191 TFLOPS,是上一代產品的2.8倍。
此外,黃仁勛還重點介紹了RTX 40系列新引入的DLSS 3.0技術,它包含四項組件,其中最為關鍵的是新加入的AI幀生成器,可分析兩幀連續的游戲圖像,并計算幀到幀中物體和元素的運動矢量數據。舉個例子,DLSS 3.0可以使原本開啟光線追蹤后僅為23幀/秒的《賽博朋克2077》以101幀/秒呈現(DLSS 2.0的效果為提升到62幀/秒)。
除了RTX 4090,英偉達在這場發布會上還帶來了兩個版本RTX 4080,即RTX 4080 16GB和 RTX 4080 12GB,除了內存不同外,16GB版本擁有9728個CUDA核心,12GB版本則是擁有7680個CUDA核心。
至于發布時間與價格:
RTX 4090將于10月12日上市,售價12999元起;
RTX 4080 16GB將于11月上市,售價9499元起;
RTX 4080 12GB將于11月上市,售價7199元起。
是的,相比上一代,漲價了。
Thor:全新自動駕駛芯片,還身兼多職
RTX 40系列之后,老黃緊接著帶來的是全新自動駕駛旗艦級芯片“Thor(雷神)”,用黃仁勛的話來說:“Atlan不再是第一了……它將被Thor取代”。
依照英偉達原先規劃,單顆算力達到1000 TOPS的Atlan將于2023年向開發者提供樣品,并于2025年大規模量產上車。如今來看,Atlan似乎是被砍了,并且主角也由Atlan換成了Thor。
依據介紹,Thor搭載了770億晶體管,可實現算力2000 TOPS和2000 TFLOPs。而之所以能夠做到這點,黃仁勛歸納為三點升級:CPU(Grace)、GPU(Ada Lovelace)和處理Transformer模型的引擎(Hopper)。
其中,Grace是英偉達首款數據中心CPU,主要面向大型數據密集型HPC和AI應用,擁有非常好的單線程性能;Ada Lovelace是英偉達最新的GPU產品,有助于車載計算資源集中化的同時,也將成本降低數百美元;Hopper則提供了Transformer引擎和Vision Transformer的快速變革,可以將深度神經網絡的推理性能提高9倍。
值得注意的是,除了性能上的提升,Thor更為令人驚嘆的是能夠做到“身兼多職”,基于多域計算,不僅能單獨負責自動駕駛系統的計算需求,還能將2000 TOPS和2000 TFLOPs分開配置使用,一部分用于駕駛艙AI和信息娛樂系統,另一部分用于自動駕駛。這意味著,你可以在一臺計算機上同時運行汽車底層的Linux,輔助駕駛的QNX,智能座艙的安卓等多個操作系統,真正做到了1顆芯片當6顆用。
而為了加快芯片之間的數據傳輸,英偉達也在Thor中集成了最初為數據中心應用開發的NVLINK連接。
Jetson Orin Nano:微型機器人系統級模塊,速度提升80倍
硬件方面,除了最新消費級GPU RTX 40系列、全新自動駕駛芯Thor,英偉達還帶來了一款微型機器人系統級模塊芯片Jetson Orin Nano。
依據介紹,相較于3月份發布的Jetson Nano,Jetson Orin Nano的性能大幅提升了約80倍,但是價格相對較低,很可能成為入門級AI邊緣設備和機器人開發的新標準。
Orin Nano能夠以迄今為止最小的 Jetson 外形尺寸提供高達40 TOPS,采用與英偉達先前宣布的Orin NX兼容的模塊,支持具有Ampere架構GPU的AI應用程序管道。
該產品共提供2個版本,售價199美元起:
Orin Nano 8GB,提供高達 40 TOPS 的功率,功率可配置為 7W 至 15W;
Orin Nano 4GB,提供高達 20 TOPS 的功率選項,功率選項低至 5W 至 10W。
最后
整場發布會,英偉達在產品展示上依舊是穩定輸出,也再一次向外界告知,英偉達已經不僅僅是一家GPU公司,其業務早已遍布多個領域,并在其中的多個站到了頭部的位置。
只不過近一段時間以來,圍繞英偉達也是壞消息不斷,比如自動駕駛頭部企業Cruise宣布著手自研自動駕駛芯片,更是一口氣開發四種,背后原因,則是為了降低外購芯片的成本。對于英偉達來說,這并不是一個好消息。
與此同時,曾經親密的合作伙伴、被外界視為英偉達“親兒子”的EVGA宣布與其終止合作,不再生產新顯卡,又比如以太坊合并,終結了大規模顯卡挖礦時代,這一波攻勢下,新顯卡的銷量有待后面市場的考驗。其漲價的背后,不知是不是也有著想消耗舊顯卡庫存的考量。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
