揭秘Facebook的人工智能實驗室
Facebook是一個非常成功的社交網絡公司,而它在人工智能領域的成就同樣不能小看。
最近,中美互聯網論壇在西雅圖召開,對于Facebook是否能入華再次成為焦點。如今的Facebook已經不僅僅是一個成功的社交網絡公司,近年來,它用無人機提供互聯網服務、收購Oculus發展虛擬現實、不斷探索人工智能,可以說Facebook已經成為了世界上最先進的科技研究中心之一。
當然現在包括谷歌、IBM等公司都對人工智能有強烈的興趣,而Facebook也加大了對這個領域的投入,希望解決模擬一般智力的問題——即讓計算機日漸脫離線性邏輯的機器的思考方式,而像我們自由形態的人類以多管齊下的方式來思考。下面我們就來深度解析下關于Facebook人工智能的那些事。
Facebook人工智能研究室
一切始于2013年,Facebook的巨大成功并沒有阻止創始人兼CEO Mark Zuckerberg對未來十年、二十年發展的探索。當然,Facebook其實也已經將機器學習運用到其流行的社交網絡中,比如說決定用戶會在News Feeds中看到什么內容。不過相比起當時前沿的神經網絡成果,這不過是小兒科。一些Facebook工程師也一直在嘗試卷積神經網絡(CNNs),這是一種非常強大的機器學習,現在普遍被用于圖像識別。 即便人工智能還處于發展初期,Zuckerberg對它的潛力依然非??春?,因此組建一支最好的人工智能研究實驗室的想法就出現了。
他從谷歌大腦(Google Brain)挖了一位叫做Marc Aurelio Ranzato的工程師。然后追本溯源找到了卷積神經網絡的發明者——Yann LeCun作為人工智能實驗室的負責人。Yann LeCun是人工智能界的一個傳奇,卷積神經網絡是他職業生涯的巔峰之作。你是否曾經好奇過ATM怎么能識別你的支票?這就得益于 LeCun負責的「SN」的神經網路模擬器的早期研究,于1996年被采用。
作為人工智能實驗室負責人Yann LeCun被Zuckerberg授予了完全的信任,而他對研究室也有自己的看法,如果你想要吸引頂尖人才,你得有一個雄心勃勃的研究室,和一個雄心勃勃的長期目標。然后你還得給他們工作上的自由權,同時對你的研究你必須持有非常開放的態度。這和Facebook一貫開放到理念也是不謀而合的。
這個肩負著Facebook的未來的團隊規模很小,由大約 30個研究科學家和15名工程師組成。團隊有三個分支:由LeCun管理著一個由20名工程師和研究人員組成的團隊。Menlo Park的是一個同等規模的分支。六月,FAIR又在巴黎設立了一個更小的5人組,還有很多在Facebook其他部門一起合作致力于人工智能發展的團隊。
這些研究人員和工程師來自科技領域的各個層面,同時當中很多人都曾與Lecun合作過。比如負責領導語言研究子群的Leon Bottou,是LeCun的一個老同事,他們曾一同研發了神經網絡模擬器;他們的團隊顧問 Vladimir Vapnik,曾和Lecun一起在貝爾實驗室工作,發表了關于機器學習的形成性研究,其中包括一項測量機器學習能力的技術,他也是統計學習理論之父。
Facebook對人工智能的探索
迄今,最好的人工智能系統也是愚鈍的,因為它們沒有常識?,F在對于機器如何學習簡單的推理能力,人工智能領域的專家知道得并不多。而Facebook也正致力于制造能足夠好地學習已知世界的機器。
「記憶網絡」
LeCun將記憶網絡的工作整合進卷積神經網絡,并使它們獲得記憶保持的能力。LeCun把這個新的記憶模型比作大腦中的分別由海馬體和大腦皮層控制的短期記憶和長期記憶。而記憶單元允許研究者向該「記憶網絡」講說一個故事,隨后使該網絡回答關于這個故事的問題。
比如我們把《指環王》一書的主要情節簡短概述給「記憶網絡」,當被問及在書中某一具體情節中魔戒在哪里,這個「記憶網絡」能做出簡短正確的回答。這意味著它理解書中事物與時間的關系,而不是從全書中做簡單的搜索。
「嵌入世界」
為了能搭建出一個系統,確保讓所有人可以把時間花在他們真正關心的事情上,FAIR團隊開發了一個被稱為「嵌入世界」的項目。
在嵌入世界項目中開發的人工神經網絡能夠根據視覺相似性將在同一地點拍攝的兩張不同照片連接起來,并能指出文字描述是否符合場景。它重建了現實的一種虛擬記憶,并將之在其他地方和事件的背景下進行聚類。它甚至能根據一個人之前的喜好,興趣以及數字經歷「虛擬地表示這個人」。雖然這還只是帶有實驗性質的,但是對Facebook的新聞流呈現具有很大的影響,在跟蹤標簽上也進行了一定的使用。
另外,Facebook的人臉識別技術已達到世界第一,通過DeepFace這項技術,Facebook的人臉識別已達到97%的準確率。
「計算機視覺」
Rob Fergus領導著有關計算機視覺的AI團隊,他們已經在自動標記相片上得到使用,接下來將被用于標記視頻。大量視頻因為缺乏元數據,或者沒有任何描述性文本,而被淹沒于噪聲中。AI將會能夠觀看視頻,并將它們大致分類。
這對Facebook阻止那些不想被上傳到他們服務器上的內容具有巨大的意義—例如色情照片,版權問題或者其他違反他們使用條款的任何內容。它也能鑒別新聞事件,對不同類型的視頻進行管理。Facebook此前一直將這些任務劃分給外包公司,當這項技術穩定后,Facebook就能降低這部分的人工成本。
在目前的測試中,人工智能表現得很有希望。給它播放一段正在進行的體育視頻,比如冰球、籃球或乒乓球,人工智能能夠準確地識別出這個體育項目。并且還可以區分壘球和棒球,漂流和皮劃艇,以及籃球和街球這些類似的運動。
「語言科技」
Facebook本著讓世界更開放更連通的宗旨,因此語言服務是它的重點,因為超過一半以上的Facebook用戶不說英語,然而Facebook上大部分的內容都是通過英語呈現的,因此如何能智能的翻譯也就是語言科技小組成立的原因。
我們知道過去Google翻譯那種直接逐詞翻譯有很大的缺陷,因為一些語法、俚語的原因導致翻譯的不準確,而Facebook在翻譯里面加入了人工智能的元素,讓翻譯更精確。比如:約有三億三千萬用戶經常點擊「見翻譯」按鈕使用這些翻譯服務。如下圖所示:
如果你是第一個點擊翻譯按鈕的人,恭喜,你已經開始操作人工智能了。人工智能本身具有適應性,經過訓練后便可以很快掌握俚語。語言科技小組最近發現法國球迷在用一個新俚語表達「wow」,人工智能在接受那部分公用數據的神經網絡訓練以后,現在能夠可靠地將文本翻譯出來。他們通過每天對人工智能進行新數據的訓練擴展Facebook的詞庫,不過所有語言的詞庫正在按月更新。
「Facebook M」
我們已經習慣于個人數字助理,比如Siri、Cortana,以及Google Now。但Facebook選擇了一條不同的道路,其名為「M」的新型個人AI助理擁有超越手機界限處理復雜事物的能力。比如Siri可以發短信,而M可以預定航班或制定旅行計劃。
Facebook M的主干來自于今年早些時候收購的一家創業公司:Wit.ia。人工智能不僅幫助M更好地完成一般的任務,也能完成有一些特殊情況的任務。并且Facebook設立了「AI訓練者」,主要可以讓M從人類訓練者身上學到應該怎么做,并應用到之后的任務中,這其實更像是人類學習的過程。
Facebook在人工智能團體中的角色
“我們的研究項目都是完全公開的。幾乎我們做的每件事都會發布,大部分的代碼也都是開源的。” LeCun 說道。“你可以在 Facebook 的研究網站上和 ArXiv——一個收納電腦科學、數學及物理研究的圖書館,找到這些出版物。”這其實就能看出Facebook整個團隊的態度,研究固然對他們的用戶很重要,但它的核心價值更佳體現在讓人類對如何更好地用機器來模仿智能的知識。
也是人工智能的研究本來就是最復雜的科學挑戰之一,不可能憑借某個人或者某個公司自己解決,它需要集體的力量,我們也希望Facebook的人工智能會帶給我們更多的驚喜。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
