發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

Lynn 8年前 (2017-12-30)

本文基于大量的報告資料,揭示了機器學習對于就業和社會的具體影響。

本文編譯自《science》雜志中的一篇長文“What can machine learning do? Workforce implications”,作者為MIT教授、美國經濟研究局研究員Erik Brynjolfsson和卡內基梅隆大學教授Tom Mitchell,本文的參考資料多達23篇。

以下為正文:

在過去幾十年里,計算機已經改變了幾乎所有的經濟運作?,F在,因為機器學習(Machine Learning)的興起,自動化的程度和速度有了迅猛的增長。就像當年的蒸汽機和電力的誕生一樣,機器學習也是一種帶來巨大生產力的革命性技術。但是目前,在對于機器學習在應用領域上的潛力,我們還沒有完全認識,也無法達成共識。因此,在當前這一階段,人們唯一的共識就是機器學習將會對生產力和經濟產生巨大的影響。

本文,我們借鑒了與機器學習系統相關的報告資料,以探討我們所能夠看見的這一技術對生產力產生的關鍵性影響。我們發現,有些工作是適合用機器學習系統替代來做的,有些工作采用機器學習是不適合的。因此,在討論機器學習對就業的影響時,就不是替代人類或是無法替代人類這么極端而簡單的問題了。雖然,目前機器學習對經濟的影響還是有限的,我們也并沒有像宣稱的那樣面臨失業,但其對于未來的經濟和勞動力的影響還是很深遠的。

發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

MIT數字經濟學教授、美國經濟研究局研究員Erik Brynjolfsson

我們需要認識到的是,創新對價值的創造和生活水平的提高都起到關鍵作用,所以機器學習誕生以來的信息技術系統就為人們創造了第一波價值(數萬億美元),對此,在美國國家科學、工程和醫學科學委員會提交的一份報告中就指出了其影響力“技術的進步導致了嚴重的工資不平等”。其實,因為技術的進度而帶來的不平等還有很多,如在經濟全球化和近十年來技術巨變的雙項因素下,未來經濟的影響將會具有高度破壞性,這也就意味著,即便你是贏家,賺了很多錢,但因為經濟危機受牽連,你依然是失敗者。而這一問題,就需要制定政策的政府領導、商業領袖、技術人員和研究學者的高度重視。

不過盡管機器學習正在為我們帶來很多不良的影響,在談論機器學習可以做什么,不可以做什么之前,我們仍需明確這兩點:1.離機器取代人類還有很長時間;2.機器不可能完全取代人類。

從價值層面來看,當機器執行特定的作業或者某一部分任務時,剩下的非機器學習可以完成的任務就會變得更有價值。另一方面,機器將會增加人的生產力,使全新的產品、服務和工作流程的產生變為可能。因此,在對勞動力需求的影響上,即便是對那種需要機器的工作崗位,機器學習帶來的影響可能是消極的,也可能是積極的。當機器學習系統接近于某些崗位的人類的能力時,作為這些系統的補充的職位就會出現。而當機器學習系統比人類更具成本效益時,企業家或商人就自然會采用機器來取代人類,以達到利潤最大化。進而,這樣將會提高生產力、降低價格、轉移勞動力需求并重組整個行業。

發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

卡內基梅隆大學深度學習領域教授Tom Mitchell

大數據等因素促進了機器學習的蓬勃

哲學家 Polanyi說過:We know more than we can tell. 人臉識別、騎自行車這個動作和對自然語言的理解是人類天生具備的能力,但是我們卻不知道我們自己是如何做到和學習的,有一個很大的原因在于我們沒有辦法輕松的處理一大堆數據并從中發現規律。因此,在機器學習時代到來之前,我們是很難通過計算機完成這么巨大的任務的。但今天,機器學習的算法已經使計算機系統訓練過程比手動編程更有效。

近幾年,寫一段特定功能的程序都需要很多程序員來參與編寫,但逐漸,因為機器學習算法(神經網絡)的存在,寫程序也可以變成自動化過程,我們只要不斷的給數據對其進行訓練即可,無需再做大量的編程工作。

機器學習算法為編程領域帶來了兩項影響,一是通過對神經網絡的訓練就可以得到比程序員編程編出的程序更精確的算法(如人臉識別);二,這種模式大大降低了創建和維護新軟件的成本。

過去6到8年間,機器學習的發展十分迅速,很大程度上是因為我們擁有關于某項領域的大量的數據,通過對這些數據進行訓練和分析,我們會發現很多此前沒有發現的規律和價值,或者換句話說,是機器學習通過其類似于人的分析能力讓我們看見了數據的潛在價值。當我們有足夠多的數據時,機器學習就可以很好的完成我們的任務要求。

當然,除了大數據,其他很多方面的發展也是促進機器學習發展的關鍵因素,如毫米波的改進、深度神經網絡(DNN)的出現和計算機硬件的發展。如現在,Facebook每天將超過45億的短語翻譯模式轉換到DNN模式;同時DNN也用于ImageNet中的圖像識別等;此外,因為DNN的運用,其語音識別的錯誤率已經從2010年的30%降低到2016年的3%。值得指出的是,圖像識別和語音識別的錯誤率閾值是5%,因為這是人類犯錯的概率值。

新型自動化模式:學習

發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

 

但是要用機器學習來完成一項任務或者解決一個問題,我們必須讓機器弄明白這項任務的要求,即性能指標。目前在實際應用中,大多數學習都是指向目標函數的,即目標的輸入應對應于特定的輸出數據。如自動駕駛車輛傳感器測試到的輸入數據應該直接指向下一個對應的輸出指令。

但是在某些領域,想要獲得貼近于事實的輸出(目標函數)是很困難的事情,如精神病的診斷、人力資源決策方面和處理法律案件,因為它們沒有固定的輸出模式。

所以想要成功的將機器學習商業化,其關鍵步驟是:明確機器學習的任務;能夠收集到用于訓練的高質量數據;數據能夠為工程師所用并有助于預測目標輸出;能夠收集到新的數據以彌補原始數據的不足;要嘗試不同的算法和參數設置,以優化學習分類器的準確性;最后將其嵌入到日常應用中,從而提高生產力。

由機器學習發展而來的一種未來自動化模式就是學習人類,其中人工智能(AI)就是通過模仿和學習人類的很多行為來實現這種最新的自動化模式的,這也導致了新的商業模式。

發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

八項判別準則,揭示機器學習的特征

盡管目前的機器學習系統的能力讓人驚艷,但是它們并不是適用于所有的任務?,F有的機器學習的能力很大程度上取決于深度神經網絡。在有些方面,它們確實比人都要厲害,但是它們的決策能力比人的能力要弱太多。當然,機器學習系統還在進步中,后面可能適用于更多的工作?;谀壳暗陌l展情況來看,我們給出了8個關鍵的判別標準,以此可以區別某一項任務適不適合利用機器學習系統去做。

1.明確的輸入必須映射到明確的輸出,以構成明確的函數

這一準則也適用于分類(如根據品種來標記狗的照片)和預測(如通過分析貸款申請來預測未來缺省的情況)。不過雖然機器學習系統可以根據統計意義上的相關性來預測與輸入(X)有最大關聯的輸出(Y),但是它可能無法學習到如何判斷因果關系。

2.大數據中必須存在成輸入-輸出關系的數據對

根據系統的需求,想要有效的訓練深度神經網絡,提高其準確度,越多的數據對越好。盡管深度神經網絡就像一個“黑盒子”,原則上可以表征任意函數,但是計算機很容易模仿并不斷訓練存在偏差的函數,這樣就不利于找出數據的規律。所以這就需要專人來對數據進行明確的標記和梳理。

3.這項任務有明確的目標和參數來對學習的效果進行明確的反饋

雖然通過機器學習不是總能很好的得到目標輸出,但是至少機器學習系統可以很好的描述我們想要的目標輸出。這就像早期的自動化系統,它們可以通過輸入輸出來模仿任務,但可能不會是最佳的逼近實際系統。因此,明確一個衡量系統性能的指標是一條黃金準則。依據這條準則,系統在訓練過程就會不斷自我修正,從而達到最佳的性能表現。

4.無需很長的邏輯和推理鏈

機器學習系統非常善于分析數據的關聯性,但是一旦邏輯鏈過長,后面的學習效率就會降低。但是像Alpha Go這樣的非物理類的游戲,因為可以自動收集數百萬個典型訓練數據案例,所以可以很好的模擬。但在現實世界中,我們就很難做到這樣完美的模擬。

5.我們不知道也無需知道系統是怎樣做出這樣的決定的

大型的神經網絡可以通過數以萬計的數字權重來做出最后的抉擇,這些數字權重就是人造神經元。但是其中的邏輯還是很難解釋的,目前對于這方面的研究也比較缺乏。

6.任務的容錯能力較強,無需最佳的解決方案

幾乎所有的機器學習算法都是基于統計概率來給出最后的輸出的,因此很難將其訓練到100%的準確度。即便是人,也會犯錯。

7.所學的功能不會隨著時間的推移而快速變化

通常來說,當需要處理的數據和訓練的數據分布是類似的結構時,機器學習算法才能很好地工作。如果新的數據分布發生變化,系統就需要重新訓練。

8.缺乏靈活性、物理上的操作和移動能力

在處理非結構化環境和任務中的物理操作時,機器人和人類相比仍然很笨。這不是機器學習的缺點,而是現有機械技術的缺陷。

機器學習到底適用于哪些性質的工作?

此前,機器學習對于就業的影響主要在一些結構化和重復性的工作上。但是未來,其他很多工作將會被機器取代,那么我們如何辨認出這些工作呢。

一項工作通常包含許多不同但相互關聯的分工。在大多數情況下,這些分工中總有部分適用于機器學習,比如,我們可以通過訓練一個機器學習系統來幫助律師對案件的潛在相關文件進行分類,但是當面對潛在證人或者想辦法讓證人提供有效證詞時,機器學習就完全失去了作用;類似的,機器學習系統可以用于閱讀醫學影像,但與其他醫生的交流,包括與患者的交流,這些都是非結構化的任務,不適合采用機器學習系統。

但這不代表,所有需要交流的任務機器學習系統都無法勝任,比如銷售人員與客戶之間的很多聊天內容和任務,聊天機器人都可以勝任;還有視頻中人臉面部的一些情緒表現,機器學習系統也可以識別出。

除了上面提到的情形,對于機器在創造性任務上的表現,我們的認識也需改觀。傳統意義上,機器是按照人們設定好的方式來一步一步完成任務的,沒有任何“創造性”空間。但是機器學習系統是專門為找出解決辦法而設計的系統,我們對其的設定只是目標和參數,沒有明確規定該怎么去解決。舉例來看,以前人類設計復雜設備的能力遠遠超過機器和計算機,但是現在根據要求,利用機器學習系統生成的設計比任何人設計的都好。

從機器學習的層面來看,這又不是“創意”,因為能不能設計出好的設備完全取決于人們在最初設定的參數。所以未來,這種看似是創造性的工作將會被機器學習取代,而同時更為重要的是人們在選擇參數和設定目標的能力上。這也就意味著,無論是科學家,還是企業家,能夠準確描述出問題這一能力將變得越來越重要。

發展至今的機器學習到底對我們的就業和社會產生了哪些影響?

 

從六項經濟因素看機器學習對社會的影響

有許多非技術因素會反映機器學習對于就業的影響,換句話說,機器學習對于就業的整體影響可以轉化為六項經濟因素。

1.代換

融入機器學習的計算機系統將會直接取代部分人力,并減少產出部分的勞動力需求。

2.價格彈性

通過機器學習實現的自動化生產將會導致完成一項任務的成本降低,但總的消耗增加或減少取決于需求的價格彈性因素。如果彈性小于-1,則價格下降導致購買數量的增加,那么整個成本就會增加。1903年以后,由于技術降低了航空的價格,需求就增加了,在航空方面所花費的反而增多,就業也自然變多。

3.互補性

工作A是自動化的工種,而非自動化的任務B對A來說又是不可或缺的,那么隨著A的成本降低,對B的需求自然會增加。類比來看,隨著計算機的普及,程序員的需求不斷增加;人際交往能力和分析能力之間也是一種互補。

4.收入彈性

自動化的程度是可以改變社會的總收入的。如果一個商品的收入彈性不為零,這又會改變對某些商品類型的需求以及生產這些商品所需工作的派生需求。類比來看,隨著總收入的增加,美國人已經把更多的收入用于餐飲。

5.勞動力供給的彈性

隨著工資的變化,從事某項工作的人們會給出一定反饋。如果有許多人具備了該必要的技能,那么供給就會有彈性,即使需求會增加(下降)很多,工資也不會上漲(下降)很多。相反,如果這項技能很難修煉,比如成為數學家,那么需求的變化將主要體現在工資而不是就業上。

6.業務流程重新設計

給定的勞動力的數量和類型不同、資本和其他投入、產出不同,與之相關的生產函數也是不同的。所以其中任何一項因素改變,管理人員就要重新建造相關流程。而新技術會改變生產過程,所以他們需要找出最有效的方式和生產流程。這些變化會需要一段時間,但它往往能夠節省成本和投入,增加需求彈性。隨著時間的推移,個人可以通過學習新技能或換新工作,來表示對于高工資的認可和回應,這樣會增加相關的供給彈性。

因此,根據Le Chatelier準則,隨著固定因素的調整,長期來看,供需彈性比短期更大。由于生產流程、組織設計、商業模式、供應鏈、法律約束甚至文化期望都需要改變,所以一項技術的采用和推廣往往需要幾年或幾十年的時間。因此為了加快技術的推廣,往往我們需要在社會方面也采取一定的措施。

隨著時間的推移,新的產品、服務、分工和工作流程被創造出,從而致使新的工作產生。從歷史層面來看,隨著一些工作任務趨于自動化,釋放的勞動力已經重新部署到生產新的商品上。這種創新比增加資本、勞動力或資源投入更能提高人們的整體收入和生活水平。

結語

機器學習發展到最終,其范圍和規??赡軙^電力技術。該技術帶來的進步不僅直接提高了生產力,而且更重要的是,引發了機器、商業組織乃至整個經濟的互補性創新浪潮。未來,在技能、資源和基礎設施等方面做出正確的互補性投資的個人、企業和社會將會得到蓬勃發展,而另一些沒有參與進來的人,在某些情況下將會更糟糕。因此,更好的理解機器學習的具體適用場景和工作任務,對于理解其對經濟的影響也是至關重要。

原文鏈接:http://science.sciencemag.org/content/358/6370/1530.full

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到