唱跳全能的「擎天柱」Optimus,背后其實是真人遙控?
留給Optimus的算力不多了。 跌麻了!特斯拉“We, Robot”發布會完第二天,投資者們集體用腳投票,最終股價大...
留給Optimus的算力不多了。
跌麻了!特斯拉“We, Robot”發布會完第二天,投資者們集體用腳投票,最終股價大跌8.78%,創下兩個月來的最大跌幅。
有分析師表示,這次發布會雖有驚喜,但馬斯克并沒有給出細節,再結合此前多次承諾都無法實現,投資者的失望情緒可以理解。
當然,大多數人的關注點都放在無人駕駛車上面,其實這次推出的新款Optimus在靈活性上的進步其實值得拿出來講一講。
從多家媒體現場拍攝的視頻可以看出來,這次的Optimus不僅可以調酒跳舞,甚至可以聊天互動,甚至可以現場指揮大家給當天生日的觀眾唱生日歌,無論是語氣還是邏輯都非常像
事實上,昨天展示的Optimus就是由真人遠程遙控而不是自主AI,這是一種類似VR眼鏡的設備,人類訓練員可以進行遠程實時操控。
這種利用VR技術訓練的路徑其實已經在多家機器人平臺上被應用,比較成熟的包括Optimus以及英偉達Project GR00T,國內一些具身智能企業也開始選擇使用真人動捕提高機器人的靈活性。
VR遙控機器人,已成主流
如果單就人形機器人這一形態來說,該路徑已經成為仿人機器人AI訓練的主流方法。
作為VR訓練機器人的帶頭人,特斯拉在今年5月的一段公開的視頻里揭露了訓練的大致流程。
從視頻里可以看到,Optimus的訓練數據都是來自穿戴VR頭顯的人類訓練員,這套完整的系統集成了 VR 頭顯、傳感器、手套、動捕服和相關軟件。
通過VR頭顯,Optimus可以1: 1地復刻映射人類操作員的動作,而軟件可以以實現第一人稱視頻的實時傳輸和精確控制輸出,并保持極低的延遲。
在最近,特斯拉進一步加大了數據采集操作員(Data Collection Operator)的招募力度,這些操作員通過佩戴 VR 頭顯和使用高精度傳感器及動作捕捉服,為機器人提供高質量的訓練數據。
據招聘公告內容,這些操作員需要長時間佩戴 VR 頭顯,每天步行超過7小時,攜帶重達30磅(約 13.61千克)的設備,根據要求執行站立、行走等特定動作。
雖然累,但特斯拉的待遇給得是真的多,薪酬大約每小時25.25-48美元,另外還有股票獎勵以及福利。
當然,如此誘人的報酬,硬性要求非常高,首先就是身高、體力以及操作經驗的三重考驗,其次長時間操作VR設備并不是一件簡單的事情。
最后,從這次發布會的視頻可以看出來,機器人背后的操作人員需要極快的反應能力,這一點能力也很難替代。當然從效果來看,由真人訓練的Optimus確實效果明顯。
不僅是特斯拉,英偉達也將Vision Pro 納入其人形機器人平臺的訓練體系中,研究員將仿真訓練框架整合到英偉達 Omniverse 平臺和 Isaac 機器人開發平臺,同時開發人員能夠使蘋果 Vision Pro 來遠程操控人形機器人來執行任務。
不只是人形機器人,四足機器人也可以使用此方法。騰訊 Robotics X此前發布了基于真狗的動捕思路,可以看到四足機器人明顯的運動能力提升。
AI難堪大任?做好硬件更重要
你以為的Optimus代表了最先進的AI,實際上的Optimus其實是真人遙控,而不是AI自驅的行為(autonomous)。
而這也不是什么秘密,現場的科技媒體和機器人行業從業者都認可這一行為,也難怪投資者不感興趣。
除此以外,對比仿真、模仿等訓練方式,VR訓練在數據采集成本上非常高,并且不見得可以完全離開人類操作員。
因此,目前各家具身智能項目真正比拼的其實是硬件。
以此次發布的新版Optimus為例,目前特斯拉已經做到了22個自由度,操作上可以像真人一樣彈鋼琴,這個程度目前可以說是領先全球絕大多數非實驗室企業。而特斯拉的目標是將執行器從手部完全移至前臂,最終實現像人類那樣的工作方式。
當然,提高自由度的同時,研發的成本也隨之提高。
據大摩人形機器人報告對上一代Optimus 的拆解,一雙機器手接近1萬美元,整體BOM更是高達50-60k美元,距離馬斯克計劃的 1 萬美元還有很長的路,而這次的22自由度的新款機器人成本只會更高,那么所謂2-3萬美元的成本又是在畫餅?
當然作為控制成本狂魔,馬斯克在降成本的實力有目共睹。
可以猜測一下,未來Optimus還是以硬件優勢+人工控制為主,自主AI大概率不要指望了。
值得一提的,特斯拉的訓練算力很大一部分都放在FSD以及自家AI公司Grok,能留給Optimus的,還剩多少呢?
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
