AI+機器人!當機器人碰上大模型,將帶來哪些變革? | 研報推薦
疊加AI大模型(特別是多模態AI大模型)的賦能,移動機器人的能力有望大幅提升。
進入2024年,機器人領域迎來了一場大爆發,科技巨頭們紛紛帶來驚艷的演示視頻,展示出令人瞠目結舌的產品。
這其中,大部分視頻展示的是外表酷似人形的“具身智能體”,它們可以完成各類復雜任務。
然而,這些演示視頻也引發了不少的爭議,有人懷疑這些機器人是否真的在自主執行任務。
例如斯坦福大學推出的Mobile ALOHA系統機器人,就被曝出是真人遠程操作,在自主模式下曾多次“翻車”,可見AI機器人離落地應用還有很大差距。
不過在工業制造、倉儲物流等場景里,工業機器人已經在大模型(LLM)的加持下展現出一定的智能性與自主性。
在近期國投證券發布的報告《人工智能行業專題:大模型帶來機器人變革》一文里,分析師以“AMR機器人”為例,介紹了大模型給工業機器人帶來的影響與變革。
以下內容為報告重點內容精選:
AMR行業快速增長,軟件和算法是核心
(鎂客網注:在此部分,分析師介紹了AMR機器人的定義、技術路徑、技術核心等內容,并介紹了英偉達等海外大廠的AMR機器人方案。)
移動機器人,指在復雜環境下工作,具有自行組織、自主運行、自主規劃的智能機器人,主要可以分為自主移動機器人(AMR)、關節型機器人、人機協作機器人等。
根據GGII數據,從全球維度來看,22年全球移動機器人市場規模約292億,預計27年增長至1874億元,對應22-27年CAGR為45.07%;
從國內維度來看,22年中國移動機器人市場規模約97億元,預計27年增長至462億元,對應22-27年CAGR為36.74%,市場規??焖僭鲩L。
其中,自主移動機器人(AMR)是一種能夠獨立理解環境并在環境中移動的機器人。
AMR與其前身自動導引車 (AGV) 不同,后者依賴于軌道或預定義路徑,并且通常需要操作員監督。而AMR使用一組復雜的傳感器、人工智能、機器學習和計算來進行路徑規劃,以解釋和導航其環境,不受有線電源的束縛。
AMR的背后有兩大關鍵技術路徑:
1、容器化的SDK工具集——包含感知、導航軟件堆棧;好用的開發環境,模擬工具;后續優化升級Containers;
2、邊緣微服務器支撐——包括無線通信,安全設備,協作SLAM Fleet管理。
AMR技術核心:
1、架構
(1)AMR本體能力:具備傳感和智能路徑規劃,運動控制、安全和人機交互HMI,機器視覺和智能導航等能力, 賦能制造業向柔性化、智能化發展。
(2)云端交互任務處理:AMR本體通過網絡(WIFI/以太)與云端計算中心交互,在云端完成數據分析,推理,模擬等工作,需要云端AI芯片支持(例如英偉達H100等)。
(3)架構組成:目前主要由控制系統、導航傳感系統、驅動模塊、安全監測模塊、交互模塊、通訊模塊、動力模塊(電池等)、執行機構(機械裝置)組成,不同場景品類的機器人對配置要求不同。
2、硬件
硬件部分主要包括TMT零部件(控制系統相關硬件、導航傳感器、驅動模塊、通訊模塊等)、電池(動力模塊)、機械裝置(執行機構等),隨著定位導航、機器視覺、規劃執行等環節對芯片需求的增長,以及激光雷達等新型傳感器的應用,機器人中TMT零部件的價值量持續提升。
未來,AI將走出計算機,進而影響外部世界(物理世界),而機器人是AI最佳載體之一;隨著智能機器人的發展,機器人傳感器、執行器將同AI相結合,具備模擬(用于仿真的虛擬空間)、映射(實時地圖創建能力)、自主(獨立運行)等能力,需要強大的端側算力支撐,移動GPU嵌入AMR本體是發展趨勢。
3、軟件、算法
在實際應用中,移動機器人通常以集群的方式系統完成特定任務;
未來,成百上千臺機器人規劃化集群作業是發展的必然趨勢,即逐步從單體智能向群體智能演進,軟件和算法成為構筑核心競爭力的壁壘,例如統一環境下完成作業調度、找到全局最優方案提升集群機器人工作總效率等。
因此分析師認為,隨著行業應用場景的豐富和技術的發展,產品模塊化、軟件模塊化將成為AMR發展的必然趨勢。
目前,端側(即機器人本體)軟件、算法主要有ROS 2、地圖規劃算法、AI算法、樣點算法等,支撐路徑規劃、障礙躲避、運動控制等功能;
而云側(及邊緣)軟件、算法主要有集群管理算法、訓練、遠端推理、遠端SLAM、數據分析算法等,支撐算力調度、機器人集群協作、數據分析等功能。
目前,各頭部廠商擁有自己的解決方案,技術路徑隨大模型的發展,快速迭代。
以Intel為例,其提供相應的開發工具和平臺,使開發者可以快速、低成本地搭建、管理AMR機器人。
除此以外,英偉達旗下的ISAAC集成式端到端解決方案、Jetson系列產品以及特斯拉的FSD+Dojo都是目前業內比較領先的解決方案。
值得一提的是,當前機器人價值鏈劃分里面沒有智能系統。
分析師認為,機器人是典型的機電軟一體化產品,軟件與硬件是相互限制又相互促進的矛盾體;邊緣算力硬件將會制約機器人相關應用的發展,邊緣算力硬件的突破使得機器人可以承載更強大的AI,同時機器人應用的發展會倒逼邊緣算力硬件的提升。
當下的機器人智能停留在視覺(vision)階段,機器人缺乏智能系統(即機器人的大腦);在未來,在AI對機器人賦能的大背景下,機器人可以逐步理解物理世界,未來有可能向具身智能方向發展,智能系統對機器人的重要性愈發凸顯。
巨變:多模態大模型賦能機器人
(鎂客網注:在此部分,分析師介紹了多模態大模型如何賦能機器人。)
多模態大模型賦能機器人,主要體現為多模態感知和多模態交互。
• 多模態感知:通過多類型傳感器的配合,機器人處理多個模態接收的信息,從而實現對文本、圖像、視頻、音頻等模態信息的學習和理解。
• 多模態交互:用戶可以同時使用語音、手勢、文本等與機器人交互,同單模態交互相比,多模態交互具有減輕用戶認知負擔(交互更自然)、消除任 務歧義(交互更準確)、降低環境干擾(交互更加魯棒)等優勢,使交互更加靈活和高效。
此外,大語言模型(LLM)賦能機器人語義理解,從傳統的關鍵詞語義識別,進化到可以理解人類復雜的語音命令;同時,通過預訓練大模型將“記憶”移植到智能機器人終端,機器人具備理解任務的能力。
由于機器人本體計算能力有限,需要通過強大的云端計算能力給機器人賦能。由此構成了“云-網-端”架構
“端”:是機器人本體及本體自身的控制系統,嵌入式AI芯片逐步替代傳統嵌入式芯片,機器人本體的智能性快速提升;
“網”:主要指通過Wifi、5G及其他無線通信網絡將機器人連接起來,實現機器人本體和云端大腦的連接;
“云”:通過機器學習,不斷進化,進而使前端機器人本體的智能隨之提升。
未來,隨著模型植入機器人本體。云端大模型泛化出基本能力,并把這部分“記憶”植入機器人邊緣端(通過蒸餾等方式壓縮模型大?。?,進 而機器人本體可以將識別到的視覺、雷達、語音交互數據進行處理,并規劃動作,完成反饋。
在該部分,分析師以Google RT2 為例,介紹了新模型如何賦能機器人執行各項任務。這是一個視覺-語言-動作(VLA)模型,符號理解、推理、人類識別等領域能力大幅提升,且泛化能力大幅提升。
國內機器人產業蓬勃發展
(鎂客網注:在此部分,分析師介紹了國內機器人產業的最新情況。)
國內機器人產業:機器人產業鏈上游包括核心零部件、配套零部件和軟件系統開發,中游為機器人本體的生產及系統集成,目前主要集 中在工業機器人和服務機器人領域,下游主要包括工業應用(汽車制造、家電制造、航空航天等)和服務應用(餐飲服務、酒店服務、
醫療服務、物流服務等);近兩年一些做算法的軟件公司借助海外大模型的風,開始自研垂直小模型,并供給下游終端廠。
創業公司情況:根據中國機器人網統計數據,2023年中國機器人行業共發生134起融資事件,其中近億/過億元級融資事件52起,2023年融資金額總計為200億元左右;2023年融資事件主要發生在工業機器人相關(37起左右)、醫療機器人(29起左右)、服務機器人(24起左右)、人形機器人(12起左右)等領域。
上市公司情況:目前上市公司以提供終端硬件為主,并逐步優化機器人軟件(模型、算法等),提升機器人性能表現。
在此部分,研報列舉了??禉C器人等國內多家優秀機器人企業,這里就不詳細展開介紹。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
