重磅 | 揭秘IARPA項目:解碼大腦算法或將徹底改變機器學習
聯邦政府情報部門資助了一個非常有野心的新項目,旨在讓人工智能更加符合我們自己的腦力力量(metal powers)。
聯邦政府情報部門資助了一個非常有野心的新項目,旨在讓人工智能更加符合我們自己的腦力力量(metal powers)。由神經學專家和計算機科學專家組成的三支隊伍將試圖搞清楚大腦是如何完成這些視覺識別壯舉,然后讓機器也能完成這樣的任務。如今的機器學習在人類擅長的領域是失敗,通過對大腦算法和計算方式的逆向工程研究,徹底改變機器學習。
帶一個3歲小孩去動物園,當她看到正在吃樹葉的長脖子動物,她就本能的知道這是繪畫書上的長頸鹿。表面看起來非常容易的事情,實際上相當復雜。書上的卡通繪畫只是簡單線條畫出的刻板輪廓,而活生生的動物有顏色、肌理、動作和光線。從不同的角度看,會呈現出不同形狀。
人類非常擅長完成這種任務。只需少量樣本,我們能非常輕松抓住一件事物最重要的特征,并把這些特征應用到不熟悉的樣例中。另一方面,計算機通常需要瀏覽一個完整的長頸鹿(處在許多背景中、不同角度觀察到的長頸鹿)數據庫,從而學習正確的識別這種生物。
視覺識別,是眾多人類強于計算機的領域之一。從數據洪流中尋找關聯信息、解決非結構的難題、無監督學習(比如,小孩玩積木時學習重力知識)這些領域也是我們更加擅長的?!溉祟愂呛玫枚嗟耐ú拧箍突仿〈髮W的計算機科學和神經科學專家Tai Sing Lee說,「我們的思考更加靈活,并能預測、想象甚至創造未來的事件?!?/p>
聯邦政府情報部門資助了一個非常有野心的新項目,旨在讓人工智能更加符合我們自己的腦力力量(metal powers)。由神經學專家和計算機科學專家組成的三支隊伍將試圖搞清楚大腦是如何完成這些視覺識別壯舉,然后讓機器也能完成這樣的任務。牽頭IARPA(Intelligence Advanced Research Projects Activity)項目的Jacob Vogelstein說,「如今的機器學習在人類擅長的領域是失敗的。我們想要通過對大腦算法和計算方式的逆向工程研究,徹底改變機器學習?!?/p>
時間短?,F在,每一團隊正從史無前例的細節上,為一塊皮質建模。與此同時,團隊正在研發算法,部分基于他們所學的內容。到明年夏季,這些算法中的每一個都會被展示一個陌生事物的實例,然后要求算法從未標記數據庫中數以千計的圖片中,選出這一實例的例子。西雅圖艾倫腦科學研究所主席兼首席科學家Christof Kocha也正在與其中一個團隊合作,他說,「時間很緊迫?!?/p>
Koch 和他的同事現在正在給一小塊大腦——一百萬立方微米,總計是罌粟種子體積的 五百分之一——創建完整的連接圖(wiring diagram)。去年六月發表的成果給出了當時最廣闊的完整連接圖,大約花了六年時間才完整,如今正在繪制中的線路圖規模更大。
在為期五年的 IARPA 項目——被稱為來自大腦皮層網絡的機器智能(Machine Intelligence from Cortical Networks (http://www.iarpa.gov/index.php/research-programs/microns),MICrONS)——結束之前,研究員們旨在繪制出一立方毫米大腦皮層。這一極小部分擁有大約 100,000 個神經元,300萬到 1500萬神經元連接,或者說是突觸, 如果將神經線路全部解開,然后首位相連的話,神經連接曼哈頓的之寬足以媲美曼哈頓的寬度。
沒有人嘗試過以這樣的規模重建一部分大腦組織。但是,規模更小一些的努力已經表明,這些繪制圖能為我們提供關于皮質內部運作的洞見。在一篇發表在三月《 Nature 》上的論文中,與 Koch 的團隊合作的哈佛大學神經科學專家 Wei-Chung Allen Lee 與其合作者共同繪制出了 一張50 個神經元以及1000多個神經元伙伴的連接圖。將這份連接圖與大腦中每個神經元如何工作的信息——比如,有些對豎線輸入作出回應——進行比較,他們推導了出皮層該部分神經元解剖學連接的簡單規則。他們發現,有相似功能的神經元更易于連接,而且彼此連接的規模大于與其他類型神經元的連接。
盡管 MICrONS 的暗含目標是技術性的——除了其他方面,IARPA 資助那些最終有可能為智能社區帶來數據分析工具的研究——但是,對大腦的新而深刻的理解將必須放在第一位。貝勒醫學院神經學家 Andreas Tolias 是 Koch 的團隊的共同領導,他將我們目前對皮質的知識比作是一張模糊的照片。他希望 MICrONS 計劃的空前規模將幫助我們讓「這張照片」更清晰,揭示出管理我們神經回路的更復雜的規則。他說,如果不了解所有的組成部分,「也許我們就錯失了這種結構的美?!?/p>
大腦的處理單元
大腦表面覆蓋的復雜褶皺形成了大腦皮質,一片披薩大小的組織揉成一團以適應我們的頭骨大小。它在很多方面都是大腦的微處理器。這片大約厚 3 毫米的組織是由一系列的重復模塊構成的,這些模塊類似于微電路,即計算機芯片中的邏輯門陣列。每一個模塊都由大約 100,000 個神經元排列成復雜的互聯細胞網絡構成。證據表明,在整個皮質中,這些模塊的基本結構是大致相同的。但是,大腦不同區域的模塊有各自不同的特定目的,如視覺、運動或聽覺。
領導一支 MICrONS 團隊的 Andreas Tolias(左)與他的學生 R.J. Cotton。
科學家對這些模塊的樣子和工作方式只有一個大概的認識。要在數十或數百個神經元的更小的尺度上研究大腦,他們受到了很大的限制。而為追蹤數千個神經元的形狀、行為和連接而設計的新技術終于讓研究者可以分析模塊內的細胞彼此交互的方式;系統中一個部分的活動可能會怎樣引發或抑制另一部分的活動?!赣惺芬詠淼谝淮?,我們有能力審查這些模塊,而不只是猜測其中的內容?!筕ogelstein 說,「對于其內部有什么,不同的團隊有不同的猜測?!?/p>
這些研究者的重點是皮質中處理視覺的部分,這是神經科學家已經集中探索過的和計算機科學家長時間來一直在努力模仿的一個感官系統?!敢曈X似乎很容易——只是睜開眼睛而已——但教會計算機做同樣的事情卻很艱難?!构鸫髮W神經科學家 David Cox 說,他也領導著一支 IARPA 研究團隊。
每一個團隊以有關視覺工作方式的相同基本觀念作為開始,一個已有幾十年歷史的被稱為分析-綜合(analysis-by-synthesis)的理論。按照這個思路,大腦做出關于不久的將來即將發生的事情的預測,然后將這些預測和其所見到的內容進行調和。這一方法的力量在于它的效率——它所需的計算比隨時間連續重建每一時刻所需的計算更少。
大腦可能以任何數量的不同方式執行這種分析,所以,每一個團隊都在探索不同的可能。Cox 的團隊將大腦看作是某種物理引擎,帶有已經存在的用于模擬世界應該具有的模樣的物理模型。Tai Sing Lee 與 George Church 聯合領導的團隊的理論是大腦會構建一個組件庫——物體和人的零碎信息——并且學習如何將這些組件組合到一起的規則。例如,樹葉往往出現在樹枝上。Tolias 的研究組研究的是一種更為數據驅動的方法,其中大腦為其所生活的世界創建統計預期。他的團隊將為回路中不同組分學習交流的方式測試各種假說。
這三個研究團隊都將監測目標大腦塊中數萬個神經元的活動。然后,他們會使用不同方法創建這些細胞的連接圖。例如, Cox 的團隊會將大腦組織切割成比頭發絲還薄的切片,然后使用電子顯微鏡分析每一片切片。之后該團隊會通過計算方式將每一個截面縫合到一起,創建一個密密麻麻的包含數百萬個穿過皮質的復雜路徑的神經線路的三維圖。
有了大腦線路圖和活動模式之后,每一個團隊都將嘗試梳理出一些支配大腦回路的基本規則。然后他們會將這些規則編程為一個仿真模型,并檢測該仿真模型和真實大腦的匹配程度。
Tolias 及其合作者已經領略到一些這類方法可以實現的成果。在去年 11 月發表于 Science 的一篇論文中,他們得到了 11,000 個神經元對之間的連接圖,并在這一過程中揭示了五種新類型的神經元?!肝覀內匀粵]有構成皮質的組分的完整清單,也不知道這些單獨的細胞看起來什么樣、它們是什么連接的?!筀och 說,「那就是(Tolias)已經在開始做的事情?!?/p>
Andreas Tolias和合作者繪制出了成對神經元中的連接并記錄下它們的放電活動。五個神經元(上部靠左)的復雜解剖可以被歸結為一個簡單的回路圖標(上部靠右)。將電流注入神經元2,能讓神經元放電,引發兩個下游的細胞發生電子變化,即神經元1 和 5(底部)。
在數以千計的神經連接中,Tolia 的團隊揭開了三條支配細胞如何連接的普遍規則:一些神經元主要與他們自己同類神經元交流;另一些避開自己的同類,主要與其他類別的神經元對話;第三組只與特定少數神經元對話。(Tolia 的團隊是基于神經解剖學而不是功能來定義細胞,Wei Lee 的團隊則用功能來定義細胞。)運用這三條連接規則,研究員們能相當準確地模擬神經回路?!脯F在的挑戰是解決這些連接規則在算法上意味著什么?!筎olia 說,「它們是如何計算的?」
基于真實神經元的神經網絡
類腦人工智能不是新鮮觀點。所謂的神經網絡,也就是模仿大腦基本結構,在二十世紀八十年代紅極一時。但是那時,這一領域缺乏計算能力和訓練數據,而這是算法變得真正有效所需要的。畢竟,當時網上所有標記為貓的數百萬圖片無法得以有效利用。盡管神經網絡已經享受到偉大復興——基于神經網絡算法的語音和面孔識別程序已快速成為我們日常生活的一部分,而且 AlphaGo 最近打敗了世界頂級圍棋選手——但是,人工神經網絡用于更改它們連接的規則,幾乎肯定不同于大腦采用的規則。
當代神經網絡「是基于我們在上世紀六十 年代掌握的腦知識?!惯@是 Terry Sejnowski 的原話。他是圣地亞哥索爾克研究所的計算神經科學家,和多倫多大學計算機科學家Geoffrey Hinton 共同開發了早期神經網絡算法?!赣嘘P大腦如何組織的知識正在爆炸式增長?!?/p>
例如,如今的神經網絡包含一個前饋結構,在這里信息通過一系列層級從輸入流向輸出。每一層被訓練用來識別某種特征,比如,眼睛或胡須。然后,分析結果向前輸送,接下來的每一層對數據進行更加復雜的計算。,電腦程序就是用這樣的辦法最終將一系列彩色像素識別為貓。
但是,這種前饋結構漏掉了生物系統中的關鍵組成部分:反饋,既有單層內的反饋,又有從高級層向低級層的反饋。在真正的大腦里,一層皮質里神經元不僅與它們的鄰近相連,也與位于其上、下層的神經元相連,創建出錯綜復雜的網絡環路?!阜答佭B接是皮層網絡機器極其重要的一部分?!?Sejnowski 說,「反饋和前饋連接一樣多?!?/p>
神經科學家尚未精確理解反饋回路在做什么,雖然他們知道,在我們指揮注意力的能力方面,這些反饋回路很重要。例如,它們幫助我們聽到手機上的聲音,與此同時隔絕讓我們分心的城市噪音。分析-綜合理論的部分吸引力在于,為所有反復出現的連接(recurrent connections)提供了理由。它們幫助大腦比較預期與現實。
Microns 研究員打算破解管理反饋環路的規則——比如,這些環路連接了哪些細胞,什么激發了它們的活動,這些活動又是如何影響環路輸出的——然后將這些規則翻譯成算法。Tai Sing Lee 說,「現在,機器缺乏的是想象力和內省。我相信,反饋回路能讓我們進行許多不同層次的想象和反省的?!?/p>
也許,反饋回路將某天賦予機器一些(我們認為)人類獨有的特質?!溉绻阍谝粋€深度網絡中使用『反饋回路』,你就能從一種具有有某種下意識反應——給出輸入,獲取輸出——的神經網絡,發展到一種更加靈活的網絡,它能開始思考輸入并測試假設,」Sejnowski說,目前他擔任奧巴馬總統1億美元BRAIN Initiative的顧問,Microns項目也是這個計劃的一部分。
通向意識的線索
就像所有的IARPA項目,Microns的項目風險高。研究人員大規模繪制神經元活動和線路需要技術,目前也存在這樣的技術,但是,之前沒有人以這種規模運用過這些技術。研究人員面臨的挑戰之一就是如何處理研究產生的海量數據量——大腦每立方毫米就有1到2拍字節。團隊可能需要開發出新的機器學習工具,分析所有數據,一個相當具有諷刺意味的它自己的反饋環路。
從一小塊大腦學到的東西是否將證明是 大腦更大天賦的例證,也不清楚。Sejnowski說,「大腦并不僅僅是一片皮質,」「大腦是數以百計專司各種不同功能系統(的集合。)」
大腦皮質本身由大致相同的重復著的單元組成。但是,大腦的另一部分可能扮演完全不同的功能。比如,Alpha Go算法采用的加強學習就與基底神經節(basal ganglia)——與成癮有關的大腦部分——活動過程有關?!溉绻阆M斯ぶ悄艹胶唵蔚哪J阶R別,需要很多不同的功能部分,」Sejnowksi說。
然而,項目要成功,就不能止于分析智能數據。一個成功的算法將揭開大腦如何理解世界這一重要真相。特別是,它會有助于確認大腦的確是通過分析—綜合運行的——它會將自己對世界的預測與通過我們感官輸入的數據進行比較。它將揭示出,意識的關鍵成分是永遠變化著的想象與感知的混合物 ?!杆且环N想象,允許我們預測未來發生的事情,并使用這一預測指導我們的行動,」Tai Sing Lee說。通過打造思考機器,這些研究人員希望揭開思維自身之謎。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
