iPhone X帶起的深度攝像頭熱,移動端的路到底怎么走?

巫盼 8年前 (2017-12-06)

最近一段時間,我們也采訪了不少做深度傳感器的廠商,聊來聊去,繞不開的一個話題就是:曾經小眾的深度攝像頭市場,正在慢慢走向大眾化。

我們大腦皮層有50%的區域是用于視覺,在經過幾億年的進化以后,我們的眼睛可以在150毫秒內將看到的場景識別理解出來。但是,現在要讓機器只憑簡單的攝像頭做到這些是不可能的。

所以出現了可以捕捉三維深度信息的深度傳感器,雖然聽名字這是一顆傳感器,其實它的最終形態和我們的眼睛一樣,需要去觀察、認識以及理解這個世界。

尤其是在蘋果推出Face ID之后,相關的智能手機廠商都想跟風,雖然這股風現在還沒起來,但是大多已經開始蠢蠢欲動。最近,華為在某場手機發布會上,也公布了點云深度攝像頭Jupiter X,和Phone X的“齊劉海”系統十分相似……

從小眾走向大眾的深度傳感器市場

最近一段時間,我們也采訪了不少做深度傳感器的廠商,聊來聊去,繞不開的一個話題就是:曾經小眾的深度攝像頭市場,正在慢慢走向大眾化,而iPhone X在其中發揮了關鍵性的作用。

數據顯示,深度攝像頭市場規模將從2015年的12.5億美元增長到2021年的78.9 億美元,年均增長率達35%。

來自Markets and Markets的一份報告也顯示,預計到2020年全球機器視覺市場規模將達到125億美元。麥姆斯咨詢也顯示,預計2016~2022年間3D傳感器市場規模的復合年增長率為26.5%,2022年將達到54.6億美元。

這也是為什么蘋果、微軟、英特爾這樣的大公司會在五年時間內,紛紛投資或者收購深度傳感器、手勢識別算法以及上下游相關解決方案公司:

比如蘋果在2013年花費3.6億美元收購的PrimeSense,其前身是微軟Kinect的技術提供商,被蘋果收入麾下后,他們的結構光方案也就成功的運用到iPhone X上。

而蘋果的帶頭作用也已經對整個智能手機市場產生影響,很多手機廠商正著手尋求和國內外3D傳感器供應商合作。

另外一方面,隨著AI和智能制造時代的到來,機器人市場對于深度傳感器的需求也隨之增加。

毫不夸張的說,深度攝像頭所代表的三維視覺技術是一項非?;A的技術,早早的進行技術或者專利的布局,就是為之后的大規模應用夯實基礎。

深度攝像頭的“三駕馬車”

深度攝像頭雖然也叫作攝像頭,但是它和我們日常見到的還是有很大區別,以我們日常使用的手機相機為例,無論像素有多高,它也只能捕捉到一些簡單的二維信息,而深度攝像頭如其名所示,它能夠測量視野內空間每個點的深度數據,從而獲得完整三維坐標信息。

而一旦獲得這種三維信息,就能為機器感知和智能分析提供最基礎的數據信息。

目前,市面上比較成熟的深度信息捕捉方案主要就三種:結構光、雙目視覺以及TOF(飛行時間)。

第一種是結構光方案,通過發射特定圖形的散斑或者點陣的激光紅外圖案,攝像頭捕捉到被測物體反射回來的圖案,計算上面散斑或者點的大小,然后跟原始的尺寸做對比,從而測算出被測物體到攝像頭之間的距離。

第二個叫雙目,主要通過兩個普通的攝像頭獲得深度信息,簡而言之它就是模仿人眼的結構,通過兩個攝像頭的視差來確定距離信息。

第三種是TOF,它是通過發出的激光反射回來的時間算距離,TOF的方案在第二代Kinect上有使用過,傳感器發出調制的脈沖紅外光,然后遇到物體反射后,它會計算出光線發射和反射時間差或者相位差,實現距離的測量,最終產生深度信息。

可以說,既有的三種方案各有所長,TOF的響應速度快、精度高,不易受環境光線干擾,但是功耗和成本都比較大;結構光的工業化應用較多;雙目立體成像更適合室外強光條件和高分辨率應用,目前主要應用在機器人視覺、自動駕駛等方面。

但是,現在很多技術廠商在盡可能的取長補短,彌補既有技術的短板。

深度攝像頭的產業鏈分解

無論是哪種方案,追根溯源其產業鏈的話,如下圖所示:

從產業鏈來看,相比較傳統的攝像頭,比較突出的就是紅外相關的元件。其實,如果對比兩者的結構,也能很明顯發現深度攝像頭增加了不少新的硬件組件。

2D 攝像頭模組結構

典型的3D 攝像頭模組結構

發射端上新增了紅外激光發射器和輔助元件,包括衍射光柵和光學棱鏡部件(如準直鏡頭);在接收端,新增紅外接收部分,包括鏡頭、紅外傳感器和窄帶紅外濾光片;在圖像處理器芯片上,由于算法上的復雜性,也比簡單的2D成像芯片成本更高。

還是以蘋果iPhone X為例,它的黑劉海就引入了紅外光學發射器VCSEL(垂直共振腔表面放射激光)。

相比較傳統的LED,VCSEL的精度、體積以及低功耗更適合移動端,現在大多數深度攝像頭都會采用VCSEL作為紅外光源,像蘋果的VCSEL供應商之一是IQE,另一供應商則是Lumentum。

市場研究機構預測,2015年VCSEL市場規模為9.546億美元,至2022年預計將增長至31.241億美元,2016~2022年期間的復合年增長率可達17.3%。

VCSEL憑借其緊湊的尺寸、高可靠性、低功耗以及較低的制造成本而應用廣泛。而汽車產業電氣系統對VCSEL的應用增長,正推動整個VCSEL的市場增長。

隨著這塊市場的逐漸打開,提供綜合技術方案的廠商也開始嶄露頭角,比如我們此前采訪過的圖漾和華捷艾米,都是以提供最終的軟硬件產品,甚至是算法為主。

另外,現在一大趨勢就是三維視覺在算法端上和人工智能的結合,從而進一步提高識別的精確度。

以人臉識別為例,像我們熟悉的商湯、曠視都接二連三獲得數億美元的融資,這塊市場的容量可想而知,商湯、曠視都是算法段的高手,但是3D攝像頭可以減少對這部分算法的依賴,通過采集人臉圖像的深度信息,直接在終端上提高人臉識別技術的準確率。

機器人、無人駕駛、安防、VR/AR,深度攝像頭就像萬金油

在一項智研咨詢的數據調查中,2016-2022年3D成像會在消費電子領域迎來爆發,其平均年復合增速達到了160%,如下圖所示,

為此鎂客君也整理一份深度傳感器的應用市場情況,從宏觀上來看,基本上囊括了移動智能手機、機器人、自動駕駛、安防等領域,也難怪為什么大公司十分熱衷于收購這些技術公司。

如果簡單梳理一下深度攝像頭的應用方向,如下圖所示,主要集中在消費端和工業領域:

說到安防中的行為識別和生物特征識別。傳統的安防攝像頭只能記錄下海量的視頻信息,而無法對視頻里面人的行為做分析和預警,有了深度攝像頭,就有了對人的動作獲取的硬件基礎,配合深度學習算法,就可以對人的行為做識別和預警,安防的設備能夠真正能夠體現出它的價值。

智能制造方面,包括流水化生產線上的工業機器人,無人倉儲內的送貨機器人都需要及時獲取深度信息,比如送貨機器自動將不同大小、體重的包裹運送到規定的位置,僅僅是二維平面信息完全不夠,它必須要配備深度攝像頭去獲取包括深度在內的三維信息。

同樣是我們日常常見的掃地機器人,它在室內的避障也需要深度攝像頭去以捕獲周圍的環境信息,然后再規劃出合適的路徑。

就像圖漾的聯合創始人徐韜所說,“三維視覺在整個人工智能領域的基礎性地位,深度攝像頭的應用范圍其實是在不斷拓展,將來有望成為所有機器的標配傳感器。”

在娛樂消費端,大家就比較熟悉它的幾個應用場景,比如類似于微軟Kinect的體感游戲機。要實現體感交互,很重要的就是手勢、身體骨骼動作的識別等,以華捷艾米的3D體感芯片為例,其中就包含了骨骼跟蹤技術以及slam算法(定位、跟蹤以及路徑規劃技術的核心)等。

消費端的另一個切入口就是我們一直提到的基于智能手機的面部識別,這也是現階段不少手機廠商攻克的難點。用華捷艾米聯合創始人沈瑄的話來說,“安卓手機要到明年9、10月份才能逐漸擁有類似于iPhone X的Face ID功能。”

結構光、TOF各有各的難點,移動端正在成為兵家必爭之地

當然,技術的應用也要追求小而美,蘋果在2013年收購結構光方案的鼻祖PrimeSense,但是直到四年后的現在,才成功將其小型化到可以應用到智能手機上。

可以說,在深度攝像頭的發展歷程中,如何去縮減傳感器的體積以及降低功耗一直是各大公司努力的方向。同樣是英特爾的RealSense技術,它的設備體積就非常大,而且需要借助PC電腦來完成識別,不適用于現在的移動端需求。

相比較行業應用,移動端在深度傳感器上的需求差別會非常大,徐韜曾經向鎂客君提到,“移動端深度傳感器的體積更小、功耗更低,很多東西都要重新研發,需要投入大量的人才和資源去做這個事情。”

對于消費端來說,只有低功耗、小體積才能實現真正的商業化,這也是為什么很多廠商在做嵌入式方案、或者以“曲線救國”的形式去降低功耗等。

此前,公認的是TOF比結構光更加適合應用到智能手機上,因為采用TOF原理來實現動作追蹤和深度感知已經出現在谷歌的Project Tango方案中,Project Tango主要用于空間三維數據的采集。去年聯想推出了一款Project Tango技術方案的手機,但是時間證明,外形過大、重量過度的Tango手機并沒有打開市場,現在關于這款手機的量產和銷量也不得而知,不得不說,TOF的方案還需要“斟酌”。

深圳一家做深度攝像頭方案的繁維科技創始人程斯特則表示,“確切來說,TOF確實是比較適合移動端,但目前也不能說相比之下,結構光就不適合于移動端,很多人都斷章取義了。”

確實,從iPhone X的趨勢來看,結構光正在成功攻陷移動端。

但值得注意的是,Face ID并不是普通的結構光技術,它實際上叫做激光散斑,是PrimeSense的專利技術,而蘋果收購了他們,目前這個技術也只能是蘋果使用。

也就是說,Face ID的激光散斑技術比較封閉,而且對處理器要求高,相對來說對接受器要求比較低;但是,TOF技術對于接收器要求比較高,而對于處理器要求很低。所以TOF的方案一定要把芯片做小,減少接收端的壓力。

一旦能實現這點,深度傳感器會快速打開消費端應用的市場。

“所有的技術在某個時間點都有最優的性價比選擇,只能說在當前這個階段,結構光是最佳的選擇,這也是為什么蘋果會選擇結構光。其實從蘋果的角度,它的實力、現金流,做任何技術都可以,但是它為什么選了結構光,也說明其他技術在一些問題上沒法在當前階段做一些消費級的產品。”沈瑄表示。

雖然移動消費端的市場誘惑很大,但是這也意味著更激烈的競爭。像高通已經和奇景光電共同推出完整的解決方案,以高通在移動芯片市場的壟斷地位,其他廠商很難和它進行直面的競爭。

但是這也并不妨礙一些綜合方案解決商“快馬加鞭”地優化自己的算法和技術,去盡可能的進入到這塊紅海市場中。

結語:

此前,鎂客君在采訪北航教授李波的時候,他提到,將來計算機的感知系統應該是用綜合型的視覺來完成,而不是現在被動式的采圖。比如我們會用激光、紅外、雷達、GPS等結合起來的攝像設備。

“客觀世界遠遠不止深度,還有很多像溫度、濕度、速度、方向等等,所以未來的深度相機應該要把更多的信息整合到一起。”

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到