后摩爾時代,異構計算會是通用系統的唯一解決方案嗎?

Lynn 6年前 (2019-10-16)

應用倒逼異構計算發展,產業落實卻又困難重重。

說起異構計算,它起源于上世紀80年代,其在技術層面的定義很簡單:不同類型指令集和體系架構的計算單元組成系統的計算方式,以區別于同構計算。不過從商用角度來看,僅看硬件,其涉及到的計算單元就包括CPU、GPU、ASIC、FPGA等,類型之多和搭配之豐富讓其成為了一件讓人“望而卻步”的事情。

但是現在,華為、阿里等在人工智能領域有深入布局的公司均在異構計算技術上有不同程度的探索和戰略規劃,特別是在移動應用領域,三星、蘋果等公司更是主要的參與者。繼云計算之后,異構計算也逐漸發展成為了另一個具有更為廣泛含義的產業發展方向代名詞。

在《鯤鵬計算產業發展白皮書》(下文簡稱“白皮書”)中,華為這樣闡釋計算產業創新發展的必要性:“面對新興應用對計算平臺提出的端—邊—云協同、海量多樣化數據智能處理、實時分析等需求,IT基礎設施需要在計算體系架構、芯片架構、業務部署架構等諸多方面進行創新來適配該需求,從而找到最優解決方案。”

這里面所提到的架構和技術創新最優方案,在不斷發展的過程中,已經逐步形成了大家的共識,也就是我們所熟知的異構計算產業。

后摩爾時代,異構計算帶來效率提升

說起催生異構計算產業發展起來的重要因素,應用需求的增長是主要推動力,深度學習算法的發展和快速普及則是關鍵的導火索,而摩爾定律的失效恰好成為最后推手。

進入后摩爾時代,整個計算機產業都從“重硬件”觀念中走了出來,軟件的地位隨著深度學習算法的出現逐步走高。

不同于傳統算法,深度學習算法的出現讓處理海量數據成為可能,它對應用的滲透也讓單一功能之間可以產生聯動,場景中數據(如語音、文本、圖片、視頻等)和功能的處理因此變得復雜起來,隨之而來的是整個市場中沒有一種滿足所有業務訴求的通用計算架構,這也成為所有企業不得不直面的困難。

以阿里巴巴的在線交易OLTP數據庫系統為例來看,根據統計,OLTP每天的記錄寫入量達到了幾十億。從2011年開始參戰雙十一到2017年的雙十一,系統的峰值吞吐達到了千萬級TPS (transactions per second),呈倍數增長。

迅速的業務增長對服務器數量和系統存儲都是一個嚴峻的考驗,盲目加裝服務器顯然不符合成本預期,因此為了滿足業務對性能和成本近乎苛刻的要求——在功耗和成本不做過多提升的基礎上完成對邏輯復雜調度任務的執行和海量數據的高效并發處理,整個系統架構都需要改變和創新。

未來通用系統的唯一出路,異構計算難進退

面對多樣的處理需求,選擇異構處理器、異構體系結構組成的異構系統成為企業自然而然的選擇。異構計算能夠充分發揮CPU/GPU在通用計算上的靈活性,及時響應數據處理需求,搭配上FPGA/ASIC等特殊能力,來充分發揮協處理器的效能,根據特定需求合理地分配計算資源。這樣做的好處顯而易見,在處理速度和功耗之間找到平衡,達到高效又省電的效果。

事實是它確實提升了企業處理高速并行任務的效率。華為實驗室曾給出數據公開力證了“異構”設計的好處:以大數據應用為例,相比于傳統處理器,鯤鵬處理器(異構處理器)的綜合性能提升30%,并在同等性能條件下,功耗降低20%。

在異構計算的帶動下,HSA(異構系統體系結構)逐步代替了傳統的ISA(本機指令集體系結構),SoC(復雜的片上系統)、3D異構封裝也成為芯片設計廠商主流的選擇,而非遵從摩爾定律的約束。

可以說,異構計算切實走進了技術商用發展的舞臺。

從鯤鵬看未來發展

目前,隨著異構計算的商用,配合改變最大的仍然是底層芯片架構,因此芯片廠商的動作也最為頻繁,除了國內幾家以異構設計為關鍵業務的芯片設計公司,老牌廠商也紛紛迎合市場需求在異構計算技術上進行布局。如英特爾最新推出的AI平臺,就包含了CPU、GPU、DSP、NNP、FPGA等一系列不同的處理核心,英偉達的機器人平臺Jetson Xavier也包含了6種處理器——GPU/CPU/NPU/NVDLA等。

不過縱觀整個商用市場,將異構計算盤面鋪得最大的非華為莫屬。通過鯤鵬生態的建設,華為首次將計算業務直接推出并落實,因此去看異構計算產業商業化的發展,從鯤鵬生態的布局可以窺得一二。

未來通用系統的唯一出路,異構計算難進退

據白皮書上介紹,華為將鯤鵬計算產業定義為基于鯤鵬處理器構建的全棧IT基礎設施、行業應用及服務,其中包括PC、服務器、存儲、操作系統、中間件、虛擬化、數據庫、云服務、行業應用以及咨詢管理服務等各個細分環節。

自上個月發布白皮書以來,華為迅速在四川、河北等多地落戶研發中心,發布了“華為鯤鵬”培訓認證體系并與Arm、金山云等超過150家廠商建立合作??梢哉f,從人才、政策到上下游廠商生態建設,華為進行了非常全面的布局。

從它的動作來看,目前華為選擇了政府、金融、電信和互聯網等行業的主要場景。而對于未來,它是這樣設想的,“隨著鯤鵬計算產業向縱深發展,將逐步實現全行業、全場景覆蓋,基于鯤鵬處理器的算力將會像水像電一樣無所不及,為政府、運營商、金融、互聯網、能源、交通、教育、醫療等各個行業帶來產業變革的新機遇。”

但不難發現,鯤鵬生態的建設免不了一場浩大工程,除了要與海內外生態廠家合作,它還要投入到操作系統、編譯器、工具鏈、算法優化庫等的開發和維護,同時針對數據中心大數據、分布式存儲、云原生應用等場景,開發基于鯤鵬處理器的各類解決方案產品,這都不是一朝一夕可以達成的。

難啃的骨頭,需合力破生態的局

由上看出,異構系統所涉及的環節十分之多,華為面臨的困難是十分明顯的,整個異構計算商業化進程的推進阻力也是顯而易見:每個環節都要創新意味著上下游廠商均向一處使力,這不僅僅涉及到各廠商自身的創新,上下游的配合、標準的建立都將成為一個浩大的工程。

我們了解到,在硬件領域,整機廠商行業整體的利潤率就比較低,且設計能力參差不齊,在考慮兼容性等性能的條件下做出設計上的改變顯然難如登天;而在基礎軟件領域,由于此前產業的發展,現在已經形成不同芯片不同基礎軟件的“百花齊放”狀態,做好系統之間的兼容顯然也不是容易的事情;至于行業應用領域,也存在著用基于傳統計算架構的行業標準來評估新計算架構,制約行業應用往新計算架構遷移的問題。比如HPC行業普遍采用衡量雙精度浮點計算能力的HPL標準來評估系統性能,但這并不符合內存密集型等應用的業務實際需求。

由此不難發現,雖然異構計算帶來的計算效率提升是指數級的,但是需要配套工具、基礎設施等,帶來的生態問題也是嚴峻的。

針對存在的問題,華為發展鯤鵬計算產業給出了幾大關鍵舉措:為幫助廠商快速開發基于鯤鵬處理器和PC等計算產品,降低系統設計和開發難度,華為自己開發服務器主板和PC主板;支持整機廠商基于鯤鵬處理器主板發展自由品牌;軟件層面的開源。

但是,顯然還不夠。

異構計算生態的建設少不了華為這樣的巨頭去推進,但作為商用個體,華為的號召力難免要弱;同時,幾大舉措雖然指出了大方向,但是關鍵技術至今尚未顯露,如華為盛推的鴻蒙系統,這必然會大大降低上下游廠商的士氣和興趣。而且從短短32頁的白皮書來看,華為對于鯤鵬計算產業的設想細則不夠明晰,這難免會讓人產生質疑。此外,未來計算產業創新多少有些傷經動骨,生態重建難度之大可想而知。

異構計算是一塊難啃的“骨頭”。

不過由需求推動,市場里不同領域內也涌現出了成功案例,它們提醒我們,從更長遠的角度去看,也許需要給異構計算自然發展更多的時間。

目前,在硬件層面,高通、Intel等紛紛在各個領域做起了異構平臺,寒武紀、谷歌等公司也為云或端側真正的異構處理器的設計貢獻了思路;同時在基礎軟件層面,為了發展異構系統,2012年HSA基金會就已經成立,并取得了一定進展:簡化了異構編程,推出了免版稅的開放規范、創建了標準和可全面運行的生產系統,允許使用許多常見的編程語言(包括C / C ++、Python、OpenCL、Java等)對不同類型的處理器進行編程??梢哉f星星之火已然點起。

未來通用系統的唯一出路,異構計算難進退

最后

今年,從各個公司的動作和各大報道上可以察覺出,“異構計算”來勢洶洶。在華為的白皮書中我們可以看出,異構計算的提出源于需求催生的架構創新,但是在尋求技術與架構創新的路上,如何落實異構計算成為最大的難題。

在技術發展歷史上,無論是人工智能還是半導體領域,其發展都超過了一個甲子,相比較來看,誕生于上世紀80年代的異構計算確實顯得年輕了許多,因為所涉環節之多,它很容易讓人提出質疑:現在過多談論異構計算生態是否為時過早?

不得不說,異構計算產業的落實,必然是一件需要技術和生態兩方面支撐的事情,道阻且長。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到