生成AI不如狗聰明?Meta把AI的路走窄了呀……

jh 2年前 (2023-06-16)

搞商業化,還是搞研究?Meta的兩難選擇。

生成AI不如狗聰明?Meta把AI的路走窄了呀……

“你以為的商戰勾心斗角,真實的商戰其實樸素無華。”

這句調侃的話,放在當下科技巨頭們的AI競賽上,竟然也能對得上。

當地時間周三,在巴黎舉行的Viva科技大會上,Facebook母公司Meta首席人工智能科學家Yann LeCun(楊立昆)在談到生成式AI時口出金句:“AI還缺失了一些真正重要的東西…別說是趕上人類的智力水平了,現在是連狗都不如。

為何無所不能的ChatGPT,在LeCun口中仿佛一無是處?

為新模型打廣告,科技大佬惹爭議

Yann LeCun,世界深度學習三巨頭之一,“CNN之父”。

自從2013年加入Facebook后,LeCun一直為這家科技巨頭搭建AI體系。

生成AI不如狗聰明?Meta把AI的路走窄了呀……

同時,他一直在打造自己理想中的AI——一種能夠學習世界如何運作的內部模型,可以快速學習,并且隨時應對不熟悉的新情況。

這種機器被LeCun稱為“世界模型”,光從名字就看得出來,這不是什么簡單能搗鼓出來的東西。

相比之下,基于文本訓練的GPT大模型就簡單地多,并搶先引起了AI革命。

LeCun始終認為,GPT大模型根本不是所謂的“人工智能”,因此完全不會威脅人類。

在最近一次演講中,LeCun再次批評GPT大模型所使用的方法(根據概率生成自回歸的大模型),根本無法破除幻覺難題,直接發出斷言:GPT模型活不過5年。

而在這次大會上,LeCun在被問到AI 當前的局限性時,他又一次借機“嘲諷”了GPT大模型:“那些 AI 系統仍然非常有限,它們對現實世界的基本現狀沒有任何理解,只是純粹基于大量的文本進行訓練。但大部分人類知識與語言無關,所以這部分人類經驗不會被AI捕捉到。”

LeCun舉例稱,AI現在可以通過美國的律師資格考試,卻不會安裝一臺洗碗機,但一個10歲的孩子可以“在10分鐘內學會”,因此“生成AI的智商甚至不如狗”。

雖然這是一種詭辯,但LeCun確實有點底氣這么說——就在會議前一天,Meta震撼發布人工智能模型 I-JEPA,報道稱它可以比現有模型更準確地分析和完成缺失的圖像,而這正是“世界模型”的雛形。

生成AI不如狗聰明?Meta把AI的路走窄了呀……

這里我們就不仔細介紹該模型的細節,只要知道該模型可以通過自監督學習獲取常識,不需要依賴人工數據進行增強預訓練(總之就是,真的很強)。

在評價完GPT大模型后,LeCun趕緊接上話稱,Meta正致力于基于視頻內容訓練 AI,這比語言訓練更為艱難。

“就好比五個月大的嬰兒看到一個漂浮在空中的物體不會想太多,但九個月大的嬰兒就已經會對此感到驚訝,因為他已經能意識到通常情況下物體不應該處于漂浮狀態。”

I-JEPA之所以強悍,就是因為它可以像人一樣,在成長中不斷學習,而不依賴人類去預設數據。

趁著新品發布宣布一波,順便提一嘴友商的AI產品,Meta在AI競賽里要彎道超車了?

模型雖好,仍需商業化

很不幸,I-JEPA雖然很強大,但終究還是一款偏向研究的產品,而當下的Meta急需一款商業化AI產品給外界再次畫出一個大餅。

此前,Meta被元宇宙狠狠拖累了一把,股價在去年11月跌至谷底,扎克伯格趕緊宣布裁員。

不可否認,在采取一系列降本增效的措施后,Meta實現了觸底反彈。

截止本月初,Meta股價已經從88美元/股一路漲回到了281美元/股。

生成AI不如狗聰明?Meta把AI的路走窄了呀……

結合美股其他公司的強勁表現來看,Meta或多或少也沾了AI的光,因此趁著AI的風口仍未散退,扎格伯格也希望借助這個長賽道來為業績和資本注入一劑強心針。

生成AI不如狗聰明?Meta把AI的路走窄了呀……

事實上,Meta的AI實力并不弱,靠著LeCun這類大佬自研多年,Meta的AI產品并不輸于其他幾家科技巨頭,I-JEPA就是最好的例證。

但問題在于,Meta在商業化路線上出現了大問題——自研的生成式AI技術都被用在自家產品層面,而LeCun主推的下一代AI在商業化進度上又遠遠落后生成式AI。

今年2月,Meta發布了全新大模型系列LLaMA,據稱其13B版本可以與GPT-3相媲美。

最初該模型并沒有開源,但在發布一周后,它突然在匿名論壇4chan上泄露,引發大量下載,這下不得不成為無需付費的“開源”大模型。

此后,基于LLaMA構建的模型雨后春筍般冒出,包括斯坦福大學推出的Alpaca大模型,僅需52k數據、花費600美元、訓練3小時,就能對標GPT-3.5。

這樣的開源神器,誰不愛呢?

有人認為,Meta是故意泄露,目的是跟ChatGPT形成競爭,但從近期扎格伯格接受采訪時的回答來看,Meta高層內部一直把LLaMA定義為“供研究人員使用”,因此LLaMA更多還是無意中泄露。

在采訪中,扎格伯格表示,會在LLaMAV2版本上考慮商業化進程,其目的還是希望于為微軟、谷歌們扳扳手腕。

顯然,與GPT大模型屬于同類型的LLaMA,與LeCun主導的I-JEPA互相矛盾。

是堅持研究,還是想辦法實現商業化,Meta需要做選擇了。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到