機器視覺市場腥風血雨,華捷艾米要做嵌入式的3D感知芯片
在蘋果iPhone X的Face ID帶動下,基于深度傳感器獲取深度信息的傳感器廠商正在迎來發展的黃金時間。
近幾年,在機器視覺領域內,一直出現大公司并購、整合小的技術公司的情況,鎂客君此前做過一張表格,統計了像蘋果、Facebook、微軟等大公司收購或者投資的三維視覺技術公司:
Markets and Markets的一份報告也顯示,預計到2020年全球機器視覺市場規模將達到125億美元。麥姆斯咨詢也顯示,預計2016~2022年間3D傳感器市場規模的復合年增長率為26.5%,2022年將達到54.6億美元。
“這個市場一旦到了消費級,成本降下來之后必然會出現很多的并購,技術的整合,不過現在深度傳感器市場還很小,大鱷還沒有進來。”同樣是專注于機器視覺研發的華捷艾米聯合創始人沈瑄表示。
在今年的高交會上,當鎂客君見到沈瑄時候,滿頭大汗的他剛和客戶聊完,正坐在展區的休息沙發上,大口地啃著麥當勞的漢堡,當時已經是下午四點左右。
時勢造英雄。就像大多數人工智能公司一樣,在多年的技術積累后,華捷艾米趕上了這一波AI熱潮。
深度傳感器市場的腥風血雨
高交會上,華捷艾米的展臺也吸引了非常多的年輕用戶,在電視大屏前,手舞足蹈地和屏幕內的游戲內容交互:身體動一下,游戲內的人物位置也會相應發生變化,當你跳一下,相對應的游戲人物也會做出跳躍的反饋,這就是華捷艾米基于自研芯片打造的AR體感交互產品IMI-3DAR攝像頭,芯片中的骨骼跟蹤技術能夠準確、實時的識別玩家的動作。
據沈瑄介紹,目前華捷艾米的產品主要有三類,第一個是相關項目;第二是整機產品,他們將OTT盒子和攝像頭做成了一體,主要應用于教育或者學習領域;第三是小型化手機模組。
“雖然AR攝像頭應用于手機領域的市場是應用于TV市場的十倍,但由于手機集成化很高,添加體感技術這一功能相對較難。相比之下,AR體感技術嵌入TV則比較簡單,嵌入良率高達98%,所以短期之內,我們先推出嵌入TV的產品,將其做好之后,逐步向手機領域拓展。”
IMI-AR一體機
說到捕捉三維視覺信息,主流的三種技術方案:雙目、結構光以及飛行時間(TOF),從功耗、準確率以及環境適應性來說各有優劣。
華捷艾米的技術主要是結構光的方案,以飛行時間為例,“TOF的精確度是要比結構光要高的 但是它的成本、功耗和結構光相比就高很多了。”
“我們只能說是在某個時間點,選擇最優性價比的技術方案,而在當下,結構光無疑是最佳的選擇,”
正如開篇所說,華捷艾米也收到了收購的橄欖枝,“我們不會賣的,現在這個市場才剛剛起步。”
嵌入式的方案是消費端的趨勢
華捷艾米的3D感知芯片研發已經進入第三代,沈瑄表示,“明年我們要做16nm制程的,18年11月份第一批會正式量產,現在的重點是做嵌入式的方案,包括嵌入到電視機、平板以及手機中,這一代芯片的量產會在明年3月份。”
在蘋果iPhone X的Face ID帶動下,基于深度傳感器獲取深度信息的傳感器廠商正在迎來發展的黃金時間,而像華捷艾米的嵌入式方案無疑是最佳的選擇。
他們的嵌入式方案主要包括三大塊:芯片、光學元件以及軟件的SDK,沈瑄認為這種嵌入式的方案是消費端的趨勢,蘋果正在將這股風帶起來。
“主要推的還是手機廠商,除了提供硬件之外,人臉、手勢的路徑規劃算法都會融入到新的芯片中。”
在手機的人臉識別這塊,雖然目前也有手機廠商推出人臉識別解鎖,但是和蘋果的結構光方案相比,差距很大,簡單的2D圖片都可以蒙混過關,用沈瑄的話說,安卓市場要等到明年9、10月份才能逐漸擁有類似于Face ID的人臉識別功能。
我們認為AR肯定會火!
眼瞅著2017年又要快結束了,去年的這個時候,VR遇到了高潮后的第一波落潮,一年的時間內,整個VR硬件、內容生態圈并沒有發生大的變化,相較之下,AR反而有種迎頭而上的勢頭。
在沈瑄看來,VR行業在15年起來以后,走下坡路無非就兩個主要原因:
“硬件的不成熟,電池、眩暈的問題,如果你要達到很好的效果價格就上來了,而消費級市場對這個是最敏感的。
其次是體驗的問題導致硬件的普及率不高,反向又造成了內容和CP的投入不夠,沒有終端,我做的游戲推給誰呢?”
沈瑄認為在VR發展走到拐角的時候,蘋果解決了AR的問題。
“我們認為AR肯定會火!”
“蘋果把結構光做成嵌入式的3D相機,通過iPhone推廣出去,讓這個技術和設備來到了普通消費者身邊。第二,他們有App Store,App Store的聚合和引領力太大了,現在每周有幾百款用ARkit開發的應用。以日區為例,AR排名第一的應用周下載量都是2、30萬。”
華捷艾米選擇在這個時間點做一些正確的事情,“其實我們對華捷艾米的定義是,未來我們做的是AR芯片、算法,像光學模組這些任何一家手機模組廠商都可以去做。”
所以對于華捷艾米來說,他們最核心的永遠是算法,這也是他們最根本的價值所在。
“像谷歌也在做這塊市場,他們要在19年出一個10nm的芯片,我們知道走這條路肯定是對的。”
未來,最普通的攝像頭也能獲取三維視覺信息
由于機器視覺是非?;A的技術,所以它應用的場景非常多,比如電視、游戲健身、教育培訓、機器人、醫療康復、智能安防以及IOT物聯網等領域。
未來在深度傳感器領域內,消費級市場會越來越大,但是圍繞倉儲、物流的企業級市場也有很大的機會,以京東的無人倉儲為例,機器人自動運貨送到定點,都需要基于深度傳感器獲取環境中的深度信息。
沈瑄認為。“隨著計算能力的強化以及技術的發展,以后甚至是最普通的攝像頭也能完成對三維視覺信息的獲取。”
以人類為例,我們的大腦皮層有50%的區域是用于視覺,在經過幾億年的進化以后,我們的眼鏡可以在150毫秒內將看到的場景識別理解出來。但是,現在要讓機器只憑簡單的攝像頭做到這些是不可能的,首先它們的二進制計算方式和人腦神經元就有很大區別,現有的計算力無法在這么短的時間內識別出,但是隨著像模仿人類大腦的量子計算機的發展,或許十年以后,兩個普通的RGB攝像頭就可以識別出深度信息。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
