關于AI的7個誤解 | 人工智能核心概念對比
打破媒體打造的AI神話,告訴你AI的真相到底是什么?
【編者按】:本文轉載自新智元,作者:Robin Bordoli,來源:crowdflower
如果你是一名企業主管(而不是數據科學家或機器學習專家),你可能已經從主流媒體的報道中接觸過人工智能。你可能在《經濟學人》和《名利場》讀過相關文章,或讀過有關Tesla 自動駕駛的故事,或史蒂芬•霍金寫AI對人類的威脅的文章,甚至還看過有關人工智能和人類智能的諷刺漫畫。
所以,如果你是關心你的企業發展的高管,這些有關AI的媒體報道可能會引出兩個惱人的問題:
第一, AI的商業潛力是真是假?
第二, AI如何應用于我的產品?
第一個問題的答案是肯定的,AI具有商業潛力。今天,企業已經能應用AI改變需要人類智能的自動作業流程。AI能讓人力密集型企業處理的工作量增加100倍,同時把單位經濟效益降低90%。
回答第二個問題需要多一點時間。首先,我們必須消除主流媒體宣傳的AI神話。只有消除這些誤解,你才能對怎樣應用AI到你的業務中有一個框架。
神話1:AI是魔術
許多主流媒體把AI的描述得想魔術一般神奇,好像我們只需要對谷歌、Facebook、蘋果、亞馬遜和微軟這些大公司的高級魔術師使勁鼓掌。這種描述是幫倒忙。如果我們希望企業采用AI,那么我們就需要讓企業家們理解AI。AI并不是魔術。AI是數據、數學、模型以及迭代。要想讓AI為企業接受,我們需要更加透明,以下是3個有關AI的關鍵概念的解釋:
訓練數據(TD):訓練數據是機器學習的初始數據集。訓練數據包括輸入和預回答輸出,所以機器學習模型能夠為任何給定輸出尋找模式。例如,輸入可以是帶有客戶和企業支持代表(CSR)間的電子郵件線程的客戶支持ticket,輸出可以是基于企業特定分類定義的從1到5的分類標簽。
機器學習(ML):機器學習是能從訓練數據中學習模式,并讓這些模式應用于新的輸入數據的軟件。例如,接收到帶有客戶和CSR間的電子郵件線程的一個新的客戶支持ticket時,機器學習模型能預測它的分類,并告訴你它對這個預測的置信度。機器學習的主要特點是它學習新的、而非適用固有的規則。因此,它能通過消化新的數據調整自己的規則。
Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三個核心要素。我們不能指望機器學習模型絕對可靠。一個好的機器學習模型可能只有70%的準確率。因此,當模型的置信度較低時,就需要人使用Human-in-the-Loop作業流程。
所以,不要被AI是魔術的神話所迷惑。理解AI的基礎公式是:AI=TD+ML+HITL。
神話2:AI只為技術精英專屬
媒體報道很容易讓人產生一種錯覺,就是AI只屬于技術精英——大公司例如Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它們能夠組建大型機器學習專家團隊,并獲得億美元級的投資。這種觀念是錯的。
今天,不用10萬美元就能著手應用AI到你的業務中。所以,如果你是美國收益大于5000萬美元的26000家企業之一,你就可以把收益的0.2%投資于AI應用了。
所以,AI不是技術精英專屬。它屬于每個企業。
神話3:AI只為解決十億美元級別的問題
主流媒體的傾向于報道未來主義的事物,例如自動駕駛汽車或用于運送快遞的無人飛機。像Google,Tesla,Uber這些公司由于“贏者通吃”的心態,為了搶占未來無人車市場的龍頭老大地位,已經投資進去數百億美元。這些給人的印象是AI只用于解決十億美元級別的新問題。但這又是一個錯誤。
AI也應用于解決現存的較小的問題,例如百萬美元級別的問題。讓我解釋一下:任何一個企業的核心需求都是理解客戶。從古希臘的agora市集和古羅馬的個人買賣廣場就是如此。今天也是如此,哪怕生意買賣爆發性地轉移到了互聯網上。許多企業坐擁來自客戶的非結構化數據寶藏,這些數據來自電子郵件線程或Twitter評論。AI能應用于這些分類支持ticket的挑戰,或用于理解推文情緒。
所以,AI不僅能應用于十億美元級別的令人興奮的新問題,例如自動駕駛汽車。AI也用于現存的“無趣”的小問題,例如通過支持ticket分類或社交媒體情緒分析更好地理解客戶。
神話4:算法比數據更重要
主流媒體中有關AI的報道傾向于認為機器學習算法是最重要的要素。它們似乎把算法等同于人類大腦。它們暗示正是算法讓魔術發生作用,更精細復雜的算法能超越人類大腦。有關機器在國際圍棋和象棋中戰勝人類的報道就是例子。媒體關注的是“深度神經網絡”、“深度學習”以及機器如何做決定。
這樣的報道可能帶給企業這樣的印象:想要應用AI,他們得先聘請到機器學習專家來建一個完美的算法。但假如企業不考慮怎樣獲得更高質量、更大量的定制訓練數據以讓機器學習模型學習,就算有了完美的算法也可能得不到理想的效果(“我們有超棒的算法”和“我們的模型只有60%的準確率”間的落差)。
從Microsoft,Amazon和Google這些公司購買商用機器學習服務,卻沒有一個訓練數據規劃或預算,就好比買了一輛汽車,卻沒法到達加油站。你只是買了一大塊很貴的金屬而已。汽車和汽油的類比雖然不夠恰當,因為如果你給機器學習模型補給越多的訓練數據,模型就能變得越好。這就像汽車每用完一箱汽油,積累的里程數越大。所以訓練數據甚至比汽油更重要。
所以,訓練數據的質量和數量至少是與算法同等重要的。
神話5:機器>人
過去30年來,媒體一直喜歡把AI描述為比人類強大的機器,例如《終結者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒體這樣做也可以理解,因為媒體想建立起機器和人類之間誰會贏的簡單敘述結構。但是,這和實際情況不符。
例如,最近Google的DeepMind/AlphaGo戰勝李世石的新聞被媒體簡單描述成機器戰勝了人類。這是不準確的,真實情況不是這樣簡單。更準確的描述應該是“機器聯合許多人戰勝了一個人”。
消除這種誤解的核心理由是機器和人類具有互補的能力。請看上圖。機器的特長是處理結構化計算,他們會在“找出特征矢量”任務上表現良好。而人類的特長是理解意義和上下文,他們在“找出豹紋連衣裙”任務上表現良好,讓人類做“找出特征矢量”的任務就不那么容易了。
因此,對企業來說正確的框架是實現機器和人的互補,AI是機器和人的共同工作。
神話6:AI就是機器取代人類
主流媒體喜歡描繪反烏托邦的未來,因為它們認為這能吸引眼球。這樣或許確實能吸引讀者眼球,但是,它對真正理解機器和人類如何共同工作沒有一點幫助。
例如,讓我們再回到企業分類支持ticket的業務上來。在現今的大多數企業,這還是100%人工的過程。所以,這個過程又慢成本又高,能做的數量受到限制。假設你在分類了10000個支持ticket之后得到了一個準確率為70%的模型。30%的時候結果錯誤,但這時Human-in-the-loop就可以介入了。你可以把可接受置信度設置為95%,只接受置信度是95%或高于95%的輸出結果。那么機器學習模型最初就只能做一小部分工作,比如說5%-10%。但是當模型得到新的人工標記數據時,它就能學習、進步。因此,隨著時間的推移,模型能處理更多的客戶支持ticket分類工作,企業也能大大增加分類的ticket量。
所以,機器和人聯合可以增加工作量,同時保持質量,降低重要業務的單位經濟效益。這就消滅了機器取代人類的AI神話。真相是,AI是機器強化人類。
神話7:AI=ML
主流媒體有關AI的最后一個神話是把人工智能和機器學習當做一回事了。這可能讓企業管理層以為只要買下Microsoft,Amazon或Google的某個商用機器學習服務就能把AI轉變為產品。
實現一個AI解決方案,除了機器學習,你還需要訓練數據,需要human-in-the-loop。缺了訓練數據的機器學習就像沒汽油的汽車,雖然很貴,但去不到任何地方。缺了human-in-the-loop的機器學習也會導致不良后果。你需要人去推翻機器學習模型低置信度的預測。
所以,如果你是想把AI應用于你的業務的企業高管,那么你想在應該有一個框架了。你可以用AI的7個真相代替AI的7個神話:
真相1:AI=TD+ML+HITL
真相2:AI適用所有企業。
真相3:AI適用現存的小問題。
真相4:算法并不比訓練數據的質量和數量更重要。
真相5:機器和人類互補
真相6:AI是機器強化人類
真相7:AI=TD+ML+HITL
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
