人工智能的盡頭,是“具身智能”?

jh 2年前 (2023-05-25)

黃仁勛、比爾·蓋茨相繼押注,這個新概念不簡單。

未來的AI會是什么樣?

在知名科技富豪比爾·蓋茨的設想里:AI將成為人類的數字助理,它不會取代人類的工作,反倒是取代谷歌、亞馬遜這類“老舊”的互聯網平臺。

巧的是,就在本周,微軟聯手OpenAI在一年一度的開發者大會Build上,拋出了類似的產品——Copilot、Bing和ChatGPT等一系列產品被集成到Windows上,打造出一個無所不能的“AI助手”。

比爾·蓋茨把這種AI個人助理看成一種不同于ChatGPT的新物種,而微軟CEO納德拉也將其稱之為一次變革。

那么所謂的“AI個人助理”究竟是不是下一個科技風口?它又有何底氣能取代谷歌、亞馬遜?

AI私人管家,蓋茨的科技暢想

面對AI浪潮,你是對它的強大能力充滿期待?還是對它會隨時取代你產生惶恐?

在見識了AI的威力后,一度有上千名科技人士發表公開聯名信,要求暫停大型AI技術的開發至少六個月的時間,并希望在此期間由頂尖專家與政策制定者合作,制定出有關AI的治理規范。

但顯然各大巨頭廠商并不情愿在這場AI競賽中停下腳步,唯一能做的只是盡可能避免AI干壞事。

那么AI真的發展到威脅人類的階段嗎?

在比爾·蓋茨看來,AI是一項“改變游戲規則的技術”,但這項技術仍然“處于早期,頗具革命性”。

而他所提到的革命性階段,正是在本周AI Forward 2023活動上重點介紹的“AI個人助理”。

比爾蓋茨在大會上預測到——

未來的AI個人助理將影響深遠,能夠了解一個人的需求和習慣,并幫助他們“閱讀你沒有時間閱讀的內容”

這款強大的未來數字代理還需要一段時間的進化才能在主流社會中投入使用,在此之前,各大企業將繼續在自己的產品中嵌入所謂的生成式AI,類似于OpenAI的ChatGPT。

未來公司使用的人形機器人會比人類員工更便宜,這也將對藍領工人造成巨大影響。

如果看到這里還是無法理解“AI個人助理”的含義,那么可以參考下早已耳熟能詳的特斯拉人形機器人,其最終目的幾乎可以與人類助理劃等號。

事實上在行業內,這類AI有它的專屬名稱——具身智能(Embodied Intelligence),它們是有身體并支持物理交互的智能體。

與之相對,ChatGPT則是“沒有物理身體,只能被動接受人類數據”的非具身智能(Internet AI)。

也就在前不久的ITF World 2023半導體大會上,英偉達CEO黃仁勛高調表示AI下一個浪潮正是“具身智能”

在這場活動上,他公布了一套多模態具身智能系統——Nvidia VIMA,據介紹稱,該系統能夠在視覺文本提示的指導下執行復雜任務的全新AI模型,遠比現有的大模型產品功能強大。

那么比爾蓋茨口中的革命性階段,是否可以理解為“AI+機器人”?

機器人,AI的最終解決方案?

早在1950年,圖靈在他的知名論文《Computing Machinery and Intelligence》中探討了人、機、智能三者關系。

這是一篇帶有哲學意味的論證文,但圖靈對于“學習機器”與“機器學習”的討論,仍然值得當下AI行業深思。

例如,圖靈認為機器可以“模仿”人的思維活動,但其所謂創造性能力,前提仍是“編程”,即機器可以模仿程序員的行為。

有分析機構指出,之所以機器人難以產生與人、與環境的交互,其主要障礙在于目前控制機器人的手段仍是手寫代碼。

而進入AIGC時代,AI大模型為機器人提供了新的解決方案,自動生成的代碼可以幫助機器人實時解決現實世界出現的各類問題。

如今,已經有不少研究人員嘗試將多模態的大語言模型接入機器人系統,從而幫助機器人實現推理任務。

在圖片、聲音、文字、視頻等多模態輸入下,大模型增強了對現實中對象的理解,讓機器人也有了像人類一樣的思考能力。

相比之下,ChatGPT這類非具身智能,由于無法產生與人類的交互能力,最終還是依賴人類已經采集好的數據,因此存在一定上限。

讓我們回頭再看看比爾蓋茨的未來設想——

AI個人助理將能夠理解用戶的需求,并提供相關的信息和服務,這將使傳統的搜索引擎變得多余。

AI個人助理將能夠理解用戶的購物需求,自動尋找最佳的產品和價格,并處理購物和付款的過程。

AI個人助理會自動安排會議,管理電子郵件,甚至幫助用戶編寫報告或演示文稿。

從上述描述來看,AI個人助理獲取信息的來源都是源于真實的物理世界,這一點正與“具身智能”的定義十分吻合。

既然機器人可以不需要人類輸入數據就能自我學習,那顯然比ChatGPT這類生成式AI更具有“噱頭”。

人形機器人,依舊遙遠

在特斯拉2023年股東大會上,馬斯克通過視頻展示了Optimus人形機器人的最新進展,包括撿起物品、模仿人類動作,完成分類物品等等。

相比于初次登場時晃晃悠悠走了一圈就匆匆離場,這次Optimus可謂取得全方位進展,AI能力大幅提升。

相比之下,科技圈老熟人波士頓動力的人形機器人更是無所不能,空翻、跳躍樣樣精通。

既然人形機器人是“具身智能”最好的表現,那么是否預示著AI的下一個科技風口已經不遠?

這里不得不潑一盆冷,從中短期來看,人形機器人尚且難成風口,要實現“具身智能”則難度更大。

從人形機器人的角度看,市場需求并不像我們想象地龐大。

工業領域,功能各異的專業機器人已經占據著大部分使用場景,人形機器人顯得十分雞肋。在服務領域,人形機器人并不如人們想象地智能,市場需求仍待進一步開發。

至于人形機器人的成本問題,尤其是三大核心零部件——減速器、伺服電機及控制器的成本,仍需等待產業鏈進一步發展。

而從AI發展的角度來看,科技巨頭們真的愿意將巨額的AI訓練成本投入放在機器人上嗎?并非如此。

除了幾家財大氣粗的頭部廠商以外,大部分廠商當下最重要的工作還是提升基礎模型的能力,而ChatGPT等所謂的“非具身智能”更具商業價值。

更何況還有人形機器人還要涉及的倫理、AI覺醒等問題,遠比ChatGPT這類“聊天機器人”要嚴重。

總的來說,“具身智能”這樣的概念更像是一次炒作,離我們仍然十分遙遠。

XR才是最終贏家?

雖然人形機器人還是過于超前,但是在AI時代,硬件廠商還是能夠發揮各自優勢,挖掘“智能助理”的價值。

例如,手機終端始終是個人助理最大載體,而隨著未來AR/VR等技術的發展,頭顯設備將有較大機會實現軟硬一體結合,例如曾經的音箱、耳機等硬件一樣,成為“智能助理”未來的載體。

有分析師認為,OpenAI已經于3月宣布解除ChatGPT無法聯網的限制,為ChatGPT添加對插件的支持,其目的就是為“智能助理”這樣的超級應用做準備。

而近期微軟嘗試將Copilot接入集成到Windows,其目的也是希望AI可以重新定義其所有業務,并實現多平臺運行。

AI的下一步,仍有無窮的可能性。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到