推理芯片蓄勢待發,瀚博半導體發布首款高性能超低延時通用云端推理AI芯片 | WAIC 2021

IM2Maker 4年前 (2021-07-07)

瀚博半導體于今日在2021世界人工智能大會期間發布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。

今年上半年國家發布“十四五規劃”,特別指出要“瞄準人工智能、量子信息、集成電路等前沿領域。作為新一輪產業變革的核心驅動力,人工智能相關技術和應用正呈現快速發展的趨勢。

聚焦到人工智能芯片,數據顯示,2021年開始,數據中心對于人工智能推理芯片的需求逐漸超越對于訓練芯片的需求,整個推理市場蓄勢待發。而且,隨著模型訓練逐漸成熟,AI應用逐漸落地,市場差距還會越來越大。

在此背景之下,瀚博半導體于今日在2021世界人工智能大會期間發布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,可實現深度學習應用超高性能、超低延時的推理性能,可顯著降低數據中心與邊緣智能應用的部署成本。

云端通用AI推理芯片SV100系列

據介紹,此次發布的瀚博SV100系列芯片,單芯片INT8峰值算力超200 TOPS,深度學習推理性能指標數倍于現有主流數據中心GPU,具有超高吞吐率、超低延時的特性。

SV100系列芯片支持FP16, BF16和INT8等數據格式,并可以實現眾多主流神經網絡的快速部署及計算機視覺、視頻處理、自然語言處理和搜索推薦等多樣化推理應用場景。

同時集成高達64路以上H.264/H.265/AVS2的1080p視頻解碼,廣泛適用于云端與邊緣智能應用場景,提升客戶的設備資產效益、降低運營成本。

VA1推理加速卡

與此同時,瀚博同步推出的基于SV100系列芯片的VA1推理加速卡,為單寬半高半長75瓦PCIe x16卡,支持32GB內存和PCIe 4.0高速接口協議,無需額外供電,即可適用于所有廠商的人工智能服務器,實現數據中心高密度高算力部署。

關于為什么要聚焦于視頻方向,瀚博半導體創始人兼CEO錢軍表示:“計算機視覺占了AI市場的大半壁的江山,視頻流占整個數據流的70%,對于視頻提供的龐大數據,需要強大的AI算力支持。”

如何判斷AI的性能?可以從LTE三個方面來看,分別是指Latency延時、Throughput吞吐量和Energy Efficiency低功耗。

對此,錢軍表示:“瀚博通過前期核心技術積累和前瞻性布局,正式發布我們性能優異的SV100系列云端通用AI推理芯片和VA1推理卡,可有效應對低延時、通用性和視頻處理等方面的行業痛點,推進云端與邊緣的智能應用落地。”

據悉,SV100系列及VA1通用推理加速卡預計將于今年四季度量產上市。

關于瀚博半導體

瀚博半導體2018年12月成立于上海,在北京、深圳和多倫多均有研發分部。公司核心員工來自世界頂級的高科技公司,平均擁有15年以上的相關芯片與軟件設計經驗。公司目前擁有200人以上的資深團隊,且規模還在快速增長中。瀚博半導體致力于成為驅動云邊計算的算力源泉、中國芯片設計企業的標桿和世界芯片設計的領導者之一。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到