吳恩達談深度學習局限:AI 經濟價值目前僅來自監督學習
《財富》刊登吳恩達專訪,吳恩達介紹了百度內部深度學習平臺等人工智能應用。
《財富》近日刊登吳恩達專訪,吳恩達介紹了百度內部深度學習平臺等人工智能應用。吳恩達還指出,近年來 AI 發展主要得益于數據(燃料)和計算力(引擎)的發展,眼下數據比計算力發展稍快(給引擎的燃料還夠),但硬件發展日益加快,在某些領域甚至超過了數據(給引擎的燃料不夠),要努力保持兩者同步發展 AI 才能繼續往前。
2016 年 5 月 23 日,《財富》網站刊登了對吳恩達在加州森尼韋爾的百度人工智能實驗室接受了《財富》雜志的專訪,他談了幾個問題:(1)為什么現在人工智能這么火;(2)企業是如何利用人工智能來賺錢;(3)為什么人工智能滅世論嚴重夸大。
目前 AI 創造的經濟價值幾乎全部來自監督學習
Fortune:你將如何定義人工智能,或者說商業上可行的人工智能?
吳恩達:我們在過去幾年中看到,計算機在處理數據以進行預測這方面做得越來越好了。這既包括預測用戶最有可能點擊什么樣的廣告,也包括在圖片中識別出人、預測哪些網頁最符合你的搜索查詢需求——以及數百個其他的諸如此類的例子。許多這樣的應用可以讓用戶的數字體驗變得更美好,而有些時候這些改變也提高了企業的技術最低門檻。
Fortune:是否可以說,目前主流的人工智能主要關心從數據中識別出模式,而不太關心建造出能像人類一樣思考的計算機?
吳恩達:盡管人工智能常常被過度宣傳,我仍認為人工智能的進展程度已遠遠超出了許多人的想象。目前,幾乎所有由人工智能創造的經濟價值都來自監督學習技術。監督學習的意思是,基于系統曾經接受過的其他實例的輸入,來學習對結果進行預測或對東西進行分類。這些任務可以是:“給你一幅圖片,請把那個人從圖里找出來”,“給你一個網頁,請預測用戶是否會點擊這個網頁”或者“給你一封電子郵件,請判斷它是否是垃圾郵件。”
語音識別是這方面的另一個例子,在語音識別中輸入的是音頻剪輯,而輸出是音頻內容轉換成的文本。
機器學習這幾年之間發生了什么
Fortune:由于蘋果 Siri 提供的新功能,語音識別最近比較火。下一步怎樣才能讓智能助理型的應用更加有用呢?
吳恩達:我們想要追求的目標是,讓與計算機交談變得像與人交談一樣自然。這是一個遠期目標,我們短期內不能實現它,但當我們實現這個目標后,就會有更多的用戶想使用它。目前,很大程度上只是一些技術熱衷者在使用語音功能。世界上的大部分人并不使用語音來與電腦互動。
與機器交談的感覺仍然和與人交談的感覺非常不同:你只能夠交談某些方面的東西,你不能在交談中打斷機器人。有些時候,機器人的回應會比較慢。有些時候,你說的東西會令機器非常困惑。比方說,如果我對計算機說,“請打電話給卡洛,號碼 555-1000……不,等等,1005”,計算機就很難理解我的話,也很難采取正確的行動。
Fortune:幾年之前,沒有幾家人工智能是面向消費者的,而今天像語音識別和能理解照片的算法這樣的技術已很普遍。這幾年之間發生了什么?
吳恩達:機器學習方面的大量進展是由計算能力的提高和數據的增長所驅動的——不過我這個觀點在學界可能不太受歡迎。我們可以把它類比于建造太空火箭:你需要大功率火箭發動機,你也需要大量的燃料。如果你有許多燃料但只擁有小功率發動機,你的火箭大概無法飛離地面。如果你擁有大功率發動機但只有一點點燃料,你的火箭即使飛上天也無法進入軌道。
只有當你同時具有了大功率發動機和大量燃料時你才能去探索太空中的奇妙之地。作為類比,大型電腦相當于火箭發動機(在百度我們已經可以建造超級電腦了),而大規模數據則相當于火箭燃料。
在過去十年中,數據的增長或者說火箭燃料的增長略微超出了我們建造火箭發動機以利用燃料的能力。不過目前,我們在擴增火箭發動機方面的能力已經追了上來,在有些時候甚至反過來超過了我們提供火箭燃料的能力。我們必須努力工作才能同時擴展這兩種能力。
Fortune:好像現在每當深度學習被應用于某個任務時,它都能為那個任務產生最佳結果。我們是否也能夠把深度學習應用于企業銷售數據,從而比傳統企業軟件或流行的“大數據”工具更快地找到有意義的商業洞見?
吳恩達:深度學習的一大局限是,它所創造的幾乎所有價值都來自“從輸入到輸出的映射”的方法。比方說你有一些企業數據,其中 X 或許是用戶在亞馬遜上的帳號,而 Y 是“用戶是否進行了購物?”這樣一個問題。如果你擁有關于 X-Y 配對的大量數據,那么你就能夠利用深度學習來進行預測。然而,如果讓電腦自己在數據中進行探索和發現,這方面的算法在很大程度上尚處于搖籃期。
正因為如此,那些關于人工智能邪惡殺人機器人和超級智能的宣傳都是嚴重夸大的。上面提到的 “從 X 到 Y 的映射”只是一種很狹窄的學習方式。而人類可以以多得多的方式來學習。這種“從 X 到 Y 的映射”方法在技術上被稱為監督學習。我認為,關于監督學習之外的其他學習方式,我們仍然沒有找到正確的思路。
中國市場上的人工智能
Fortune:在美國谷歌和 Facebook 的工作引人矚目。能否告訴我們,百度用人工智能做了些什么?
吳恩達:百度有一件事情做的很不錯,它創造了一個機器學習內部平臺。這個平臺能夠讓全公司的工程師、包括那些不研究人工智能的人都能以各種創造性的方式來利用深度學習——他們會用深度學習創造出一些像我這樣的人工智能研究者從未想到過的東西。除了我們核心的網絡搜索、圖像搜索和廣告業務外,深度學習還支持著大量的創意產品,這些創意產品構成一條非常長的長尾。
例如,我們的電腦安全產品使用深度學習來識別安全威脅。我從未想過深度學習可以做這個,也不知道該怎么做。我們也使用深度學習來提前預測一個硬盤何時會崩潰,而這就既增加了系統的可靠性,也降低了數據中心的成本。
Fortune:百度也制造了類似谷歌眼鏡的產品,還制造了數字助理,甚至智能自行車。這些產品有市場嗎?還是說它們目前只是一些有趣的實驗而已?
吳恩達:我認為這些目前還屬于研究性探索。不過,通過我們從社區中獲得的反饋,我們了解到對智能自行車和可穿戴攝像機的需求是確實存在的。
實際上幾周之前,我們剛剛在中國發布一個名叫 Dulife 的新產品的 demo,該產品使用計算視覺和自然語言處理技術來告訴盲人其面前有什么東西。比方說,在中國,有好幾種面值不同的鈔票大小相同,而盲人必須通過觸摸才能知道它們哪里不一樣。然而,當鈔票被反復使用后,它的盲文部分會磨損,這樣盲人就很難辨別其面值。在這種情境中,計算機視覺可以告訴盲人,這是一張 20 元的紙幣,還是一張 50 元的紙幣。這種產品是盲人十分需要的。
Fortune:在這些移動和可穿戴設備方面,中國市場是否與美國市場以及其他市場有什么不同呢?
吳恩達:中國市場非常不一樣。其中一個差異是,中國目前最大、最熱的技術趨勢是 O2O,即從線上到線下。 O2O 的概念指的是,用你的移動設備把你周圍的外在服務連接起來,無論這些服務是洗車、送餐、尋找附近的打折電影、美甲還是雇傭私家廚師。在美國也有這些東西,不過中國巨大的人口密度使得 O2O 可以迅速成長。
還有,在中國許多用戶的第一件計算性設備是智能手機。當你的第一件計算性設備是手機的時候,你就會學習用最有效的方式來使用手機做事,而不一定會改為使用電腦。
我們可能正在接近 AI 期望值的頂點
Fortune:什么時候我們會不再把人工智能當成新鮮事物來看待,而是像對待許多其他技術一樣把它視為理所當然呢?
吳恩達:我想,就像在 Gartner 公司的技術成熟曲線(Gartner Hype Cycle)上,我們可能正在接近人工智能期望值的頂點。我認為,對人工智能超級智能的恐懼曾經達到過頂點,而如今這種恐懼的高潮已經過去了。很難講,或許我是錯的,但我希望的是這樣一個未來:到那時,我們將不再夸大人工智能,而是集中精力去探索人工智能的進步。
Fortune:這么說,我們近期是不是還達不到這樣的水平:我們的設備或應用程序能識別出我們或我們周圍的東西,而我們對此能習以為常?
吳恩達:我認為,在計算視覺方面還要等很久,因為目前計算視覺的產品并不多。不過我可以分享一個盈利很好的計算視覺產品。
在百度的廣告系統中,如果你向用戶展示一段文本,這沒問題。運用我們的深度學習技術,我們可以幫助廣告商選擇一個小圖片,這個小圖片可以與文本并列放置。這樣,你不僅會讀到一小段關于在巴厘島度假的廣告,還會看到一幅巴厘島的小圖片,而你只需要幾分之一秒的時間就能理解它。這一服務能讓用戶更快地明白某個廣告是關于什么的,它極大的促進了我們在溝通用戶與廣告商方面的能力。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
