解讀手勢識別,或許不是VR交互的萬能工具

巫盼 9年前 (2016-11-23)

擺脫外設的VR體驗需要手勢識別作為基礎,那么手勢識別技術發展情況是如何呢?

現在主流的VR硬件設備,主要的輸入輸出設備還是類似傳統游戲手柄的外設:Oculus在Touch沒發布之前,一直用的是微軟的Xbox的手柄;HTC和索尼都有自己研制開發的控制器作為交互工具。

但是如果想要在VR中達到更加自然的交互和沉浸體驗,擺脫外設的手勢識別必然是未來發展的一個大方向。

手勢識別技術的發展

手勢識別技術的發展,可以粗略分為兩個階段:二維手勢識別以及三維手勢識別。

早期的手勢識別識別是基于二維彩色圖像的識別技術,所謂的二維彩色圖像是指通過普通攝像頭拍出場景后,得到二維的靜態圖像,然后再通過計算機圖形算法進行圖像中內容的識別。二維的手型識別的只能識別出幾個靜態的手勢動作,而且這些動作必須要提前進行預設好。

相比較二維手勢識別,三維手勢識別增加了一個Z軸的信息,它可以識別各種手型、手勢和動作。三維手勢識別也是現在手勢識別發展的主要方向。不過這種包含一定深度信息的手勢識別,需要特別的硬件來實現。常見的有通過傳感器和光學攝像頭來完成。

根據硬件實現方式的不同,目前行業內所采用的手勢識別大約有三種:

結構光(Structure Light),通過激光的折射以及算法計算出物體的位置和深度信息,進而復原整個三維空間。結構光的代表產品有微軟的Kinect一代。不過由于以來折射光的落點位移來計算位置,這種技術不能計算出精確的深度信息,對識別的距離也有嚴格的要求。

光飛時間(Time of Flight),加載一個發光元件,通過CMOS傳感器來捕捉計算光子的飛行時間,根據光子飛行時間推算出光子飛行的距離,也就得到了物體的深度信息。代表作品為Intel帶手勢識別功能的三維攝像頭。

多角成像(Multi-camera),現在手勢識別領域的佼佼者Leap Motion使用的就是這種技術。它使用兩個或者兩個以上的攝像頭同時采集圖像,通過比對這些不同攝像頭在同一時刻獲得的圖像的差別,使用算法來計算深度信息,從而多角三維成像。

手勢識別的關鍵技術

手勢識別中最關鍵的包括對手勢動作的跟蹤以及后續的計算機數據處理。

關于手勢動作捕捉主要是通過光學和傳感器兩種方式來實現,在此不再贅述原理。手勢識別推測的算法,包括模板匹配技術(二維手勢識別技術使用的)、通過統計樣本特征以及深度學習神經網絡技術。
 

                                                           解讀手勢識別,或許不是VR交互的萬能工具

前兩種在早期的手勢識別技術中運用的比較多,而基于深度學習神經網絡的手勢識別必然是未來手勢識別的趨勢。這種技術可以讓機器自己去提取特征,它不需要手工特征提取,強大的學習能力使得模型在復雜背景下也能取得理想效果。而且這種算法可以在一定范圍內允許運動背景的存在,從而提高了識別的環境耐受力和精細度。

手勢識別的應用場景

首先就是游戲娛樂上的應用。以微軟的Kinect為例,它主要是搭配xbox游戲機來體驗一些趣味性強的游戲,比如,通過手勢的動作來控制游戲中的角色做出不同的反應。在娛樂方面,手勢識別還可以應用在電視上。像三星、TCL等電視廠商都已經推出了帶有手勢識別的電視機產品,可以直接用手勢來完成移動控制、選擇確認、播放等功能。

其次還可以運用在汽車的智能駕駛上。在去年的亞洲CES展上,寶馬展出了最新iDrive系統,通過安裝在車頂上的3D傳感器對駕駛員手勢的識別,實現對車輛導航、信息娛樂系統的控制等。

不過,手勢識別作為人機交互重要的一環,正如開篇所述,現在最火的應用場景其實是VR。目前像國外的Leap Motion,國內的凌感,都在把研究的重點放在VR的應用中。

手勢識別不是VR萬能的交互方式

VR的最大特點就是沉浸感和交互性,擺脫外設的手勢識別可以加強體驗的沉浸感。在虛擬世界里,你可以完全像真實世界中一樣去使用你的雙手。

問題是對于VR來說,交互并不具備通用性和唯一性的特點。舉個例子,如果是一些簡單的拾取類的操作,手勢識別是非常自然的交互方式。但如果是那種需要使用各式各樣武器工具的重型的VR游戲體驗,手上空無一物的話,沉浸感和真實性就要大打折扣了。從這個角度來看,手勢識別并不是VR萬能的交互方式。

但是隨著VR硬件技術的不斷發展成熟,以及內容開發上的擴展,未來或許會出現多種技術結合的新的交互方式,而手勢識別一定是其中不可或缺的一環。

結語:

有了手勢識別,VR體驗的沉浸感和交互性會大大增強是毋庸置疑的,不過從目前的硬件發展來看,手勢識別想要成為VR中最自然的交互方式,還需要等待動作追蹤和深度學習算法的深入研究,而且可能還需要與其它交互方式相結合。不過可以預見的是手勢識別技術在未來一定會成為我們生活中常見的交互方式,如果再加上語音識別、眼球追蹤等等技術,未來我們完全可以做到像好萊塢科幻電影中那樣,揮揮手,動動口完成各種交互。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到