計算機視覺中的深度學習:技術、市場和5個你想不到的未來

鎂客 9年前 (2016-07-08)

本文從算法、市場及硬件三個角度觀察深度學習對計算機視覺的影響。

【編者按】本文由新智元整理,來源:vision-system.com,整理:王楠

本文從算法、市場及硬件三個角度觀察深度學習計算機視覺的影響。以下三個視頻中,谷歌TensorFlow移動端和嵌入式應用團隊負責人Pete Warden介紹了如何用TensorFlow框架開發不同的低能耗深度學習產品。調研公司Tractica首席分析師表示,到2024年,深度學習服務業產值將超過500億美元。IEEE Fellow Chris Rowen預測,神經網絡將催生出新的價值鏈,全新的IP、工具和數據服務也會應運而生。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

嵌入式視覺聯盟主編Brian Dipert今天發布博文,介紹了2016年嵌入式視覺峰會(Embedded Vision Summit)中有關深度學習的內容:

谷歌工程師Pete Warden介紹如何利用TensorFlow框架,開發為Google Translate、Google Photos等不同產品訂制的深度學習方案;

調研公司Tractica的首席分析師Bruce Daley從市場的角度介紹深度學習在計算機視覺產業生態中的影響,以及Tractica對未來計算機視覺市場發展和機遇的預測;

最后,電子設計自動化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen給出了神經網絡在計算機視覺產業的五大趨勢。

讓嵌入式機器智能成為可能

TensorFlow移動端和嵌入式應用團隊負責人Pete Warden,介紹了如何使用TensorFlow框架開發不同的深度學習產品,還談了谷歌為什么選擇開源TensorFlow,以及讓這個機器學習框架支持低功耗應用的方法。Warden此前是機器學習算法公司Jetpac 的CTO,在2014年該公司被谷歌收購后加入谷歌。

Warden開場直奔主題,再次為人盡皆知的TensorFlow打廣告:是深度學習開源框架;支持視覺、語音及自然語言處理等多種應用;在谷歌公司內外都有廣泛應用,在谷歌內部的應用包括Google Translate、Google Photos、OK Google、RankBrain。

Warden號召開發人員都來使用TensorFlow,因為TensorFlow擁有經過完善測試、產品級的代碼,專門針對工程師需求,歷史記錄會得到妥善管理,他們團隊一直認真工作,所以長期支持沒有問題。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

TensorFlow使用圖表示計算任務,圖中的節點被稱之為 op,一個 op 獲得 0 個或多個 Tensor, 執行計算, 產生 0 個或多個 Tensor。每個 Tensor 是一個類型化的多維數組,比如一個圖像集可以表示為四維浮點數數組。

Warden介紹了怎樣用TensorFlow打造App:首先,下載一個免費的TensorFlow模型,當然這個模型是已經訓練過了的,然后,使用你自己的圖像數據訓練這個模型。這之后就可以開始用TensorFlow搭建自己的平臺,在移動設備上用C++運行。Warden接著講了在TensorFlow上調用C++的方法。

在談到為什么世界上還需要一個開源機器學習框架的時候,Warden表示,TensorFlow與OpenCL不同,是一種描述神經網絡的高級語言,不過TensorFlow也支持OpenCL和CUDA。至于TensorFlow與OpenCV的區別——總之OpenCV很好,有很多傳統計算機視覺模塊,鑒于深度學習得出的結果一般會更好,將兩者整合起來也很容易。

TensorFlow具有獨一無二的架構,模塊化和數據流的優化性能高于其他開源深度學習框架。在谷歌,TensorFlow的開發過程一直是產品導向的。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

作為移動端和嵌入式應用團隊的負責人,Warden強調,TensorFlow非常重視移動端和嵌入式應用的開發,TensorFlow結構很容易簡化,也就能夠應用于低功耗App。TensorFlow支持推理的8比特整數計算,并且專門針對8比特整數代碼做了優化。

深度學習服務產業市值將超過500億美元

深度學習算法是加速大規模數據分析并使其自動化的關鍵工具,有很多商業應用。調研公司Tractica的首席分析師Bruce Daley從市場的角度介紹深度學習在計算機視覺產業生態中的影響,在名為《深度學習如何拓展計算機視覺市場》中,Daley圍繞深度學習的計算機視覺市場和技術、使用案例以及產業生態。作為Tractica的首席分析師,Daley還給出了Tractica調研發現的具體市場機會和產業整體趨勢。

首先,Daley回顧了人工智能發展歷史及標志性事件,快進到2015年,企業級人工智能應用開始出現。根據Tractica預計,到2025年,光是深度學習軟件的銷售額就能達到104億美元,而且硬件和服務還會增長更多,其中深度學習相關服務的產值高達500多億美元。

深度學習雖然不會對生活造成直接影響,但它會從最根本的層面改變生活——改變數據。你可以用同樣是算法處理各種不同類型的數據。隨著社會越來越數字化,數據增加,深度學習展現出了優勢。不過,Daley也指出,在產品周期里當過了成熟期以后,數據的價值就會逐漸降低。同時,深度學習也有局限:雖然應用廣泛,但依賴高質量的數據,無法用數學語言描述,人才嚴重不足。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

深度學習的市場將是這個樣子的

到了具體應用,Daley表示,Facebook 用戶每天都會上傳3.5億張照片,谷歌的圖片列表更是高達1萬億之多,用人力給這些圖片打標簽是不可能的,但這些又都是寶貴的數據,這時候深度學習就派上用場了。

就像谷歌可以用計算機識別貓,如果一個人在網上看了很多貓的照片,那么計算機會自動推薦更多的與貓相關的內容。不過,這種技術很神奇,但消費者為什么會花錢買呢?因此必須有好的商業模式。

接下來,Daley介紹了使用深度學習的計算機視覺系統在農業、零售業、服裝(量身定制)、廣告、制造等產業中的應用和趨勢,以及在這些產業中值得關注的企業。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

神經網絡:5個你想不到的未來

最后,電子設計自動化軟件公司Cadence的CTO、IEEE Fellow Chris Rowen,分析了神經網絡計算的本質及局限,尤其是在實時和嵌入式系統中的應用。

Rowen表示,雖然最近神經網絡可能有些過于“火”了,但還是有一些機會可以切實分析地分析一些意想不到但卻很有可能發生的未來。Rowen預測,計算機視覺產業接下來會發生一系列變革,從神經網絡改變數據商業模式到云端、全新軟硬件中的應用。

計算機視覺中的深度學習:技術、市場和5個你想不到的未來

Rowen在演講中給出的不怎么驚人的預測是:

神經網絡的云端的應用會增多

神經網絡很快將擁有實時嵌入功能

能耗和帶寬的限制將推動CNN在嵌入式和服務器等處理器上的優化

實時神經網絡不僅能識別物體,還能識別行動

計算機視覺將成為計算和高端部署的主要問題

然后,Rowen 認為很有可能出現的是:

通過網絡和引擎結構優化,近期會帶寬會編程原來的20倍

不久后將會出現1000-tera MAC神經網絡嵌入式芯片和1000000 tera-MAC神經網絡服務器

新的EDA模式

新的價值鏈會帶來全新的IP、工具和數據服務

數據為王,擁有大規模、多樣化數據的人是贏家

可能傷及隱私

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到