閱面科技趙京雷:突破行業現狀,做下一個硬件平臺的關鍵技術點
面對當下的行業,閱面背靠嵌入式視覺算法,以圖像識別消費級產品切入,立志做一個行業突破者。
當下,人機交互成為了人工智能技術發展的一大重點領域。在過去的2016年里,除了語音交互技術,視覺交互的發展速度也令人不得小覷。
與此同時,從事視覺識別技術的公司開始逐漸走入大眾的視線,引起資本的關注。正是由于對行業敏銳觀察,閱面科技CEO趙京雷毅然決然地放棄了自己的高薪工作,轉而投入了視覺識別技術創業的懷抱。
突破現狀,做下一個硬件平臺的關鍵技術點
“阿里是一個培養創業者或是創業想法的土壤,我們可以在工作中發現很多機會,就比如一些即便像阿里這種大公司也不能做好的領域。”由此,為了實現以前可能敢想但是做不到的一些事情,趙京雷與前百度高級研發工程師宋向明等業界伙伴一起,創立了現在的閱面科技。他希望基于自己對行業的一些認識,去做一些比較具備突破性、創新性的產品,為整個行業帶來一些改變。
在其看來,繼智能手機之后,下一個硬件平臺的關鍵技術點在于如何讓機器人更好地認識這個世界,這就涉及到一個人機交互的問題,也是閱面科技希望實現突破、創造價值的地方?,F如今,語音、視覺已然成為人機交互的兩大主要途徑,而之所以選擇視覺,其關鍵在于趙京雷對行業的觀察。
在公司成立之前,依據自己對行業的觀察,趙京雷發現,在人機交互上,語音交互領域已經有了科大訊飛、思必馳等很多相對成熟的企業。與此相對的,雖然從事視覺交互的企業也不在少數,但產品多傾向于安防、金融等領域,技術上也依賴云端和服務器,由此一來,極大地限制了視覺技術在很多場景中的一個運用。正是這種現狀,讓他看見了市場的缺口,也確定了自己創業后進行產品突破的方向。
主打嵌入式算法,三線齊發
目前在市場上,安防和金融是視覺識別的兩大主打市場,在產品上,絕大多數從事視覺識別的企業有一個共通的特點:將采集到的數據上傳至云端或是服務器進行運算。事實上,因為延時等不確定因素的存在,此種做法并不能進行即時信息流的處理分析,從而難以全面進入尤其講究“實時性”的消費級市場。
從這一點出發,閱面科技推出了嵌入式圖像識別算法,也就是“把算法嵌入到設備前端去運行”,不需要依賴云和額外的服務器等,做到即插即用。在此基礎上,不管是對計算機資源的依賴,還是本身的功耗,在加載了嵌入式視覺算法的產品設備上來說都是非常小的,也讓深度學習得以在消費級市場的大規模應用成為可能。
在產品上,閱面科技主要規劃了三條線路:處于最底層是一系列算法,像嵌入式的人臉識別技術、人體感知技術以及空間感知技術等等,這些算法都能基于普通的單目攝像頭做到;其上是面向行業的嵌入式模塊和解決方案,比如閱面近期推出的一種面向機器人、編程型機器人的人機交互視覺模塊;而在最后,閱面還將推出一系列基于底層算法的軟硬件一體的產品。從這三條產品線來看,在圖像識別市場的布局上,閱面的策略可以說是以點及面,從尚處于“藍海”的消費級市場著手,憑借覆蓋范圍全面的產品開拓自己的市場。
技術已經成熟,接下來是應用領域升華的兩年
從去年開始,圖像識別的技術以火箭般的速度得到了提升,進入了大眾的視野。以人臉識別技術為例,就在近期,美國《MIT科技評論》將“人臉識別”技術劃入了成熟期。對此,趙京雷也給予了贊同,他表示,近兩年來,依靠深度學習算法,在技術提升的同時,人臉識別的應用范圍也得到了進一步拓寬。舉個例子,以往的人臉識別在應用中有著諸多的要求,包括正面近距離對著攝像頭等等,以此才能達到令人滿意的效果,但是,如今在深度學習算法之上利用大數據等技術,攝像頭就能以一種新的、類似于“人眼”的方式去識別人臉,擴大人臉可識別范圍以及提高識別的準確性。
對于2016年人臉識別技術的發展,趙京雷稱之為技術在某些領域的一個點的嘗試,而在接下來的一兩年內,人臉識別技術將在多個領域進行升華。在其看來,人臉識別技術帶給人們生活的變化主要體現在兩方面,分別是安全和便捷。
在安全方面,人臉識別技術本質上就是一種身份認證體系,當成熟到一定程度,必然會帶來一套更為安全的驗證體系。而在便捷性上,除了通常所說的“刷臉消費”之外,機器人也是不可或缺的一部分,它能在識別出用戶身份之后及時調整,提供一個個性化服務。
此外,在對人臉識別技術和應用的贊賞之余,趙京雷也表示,雖然人臉識別技術已經進入了成熟期,但在應用范圍的擴展上,最后還是要看具體的領域。鑒于光線、角度等多種不穩定因素帶來的影響,在某些領域,人臉識別技術還需經過一段時間的技術提升。
圖像識別在C端可能早已爆發,只是容易忽略
當前,火車站人臉識別安檢、銀行人臉識別身份認證……安防和金融已然成為了圖像識別技術的兩大戰場。依據當前的情形,我們總是說B端圖像識別的競爭已經進入了“紅?;?rdquo;,而C端仍是一塊尚未遭到過多開墾的市場。
但實際上,正當各家廠商在B端市場打的火熱的時候,C端市場正在被慢慢“蠶食”,“人臉識別在C端的爆發可能早已出現,只是我們不太容易注意到。”趙京雷如是說道。他也向我們舉出了幾個例子,比如蘋果的iOS10系統的相冊,系統中的人臉識別算法能夠根據不同的對象進而分化多個自相冊,又比如手持云臺,在使用過程中,用戶只需指定一個對象,利用圖像識別技術,其便可以實現自動跟隨等功能,這些都是人臉識別在C端的應用。
需要注意的是,早在人們真正認識圖像識別技術之前,就已經在生活中不經意間使用了這項技術。而其中,我們最直觀的體驗是在“拍照”方面,在相機中,人們發現總會出現一個將人臉框住的框框,這就是人臉識別技術的一個體現。另外,在美顏相機、Faceu激萌等產品中,美顏效果、特效等一系列功能都是在人臉識別技術的基礎上所實現的。
不僅僅是那些直接的表現,在某些領域,圖像識別也在以一種間接的方式進入C端市場。就在近期,閱面推出了一款基于深度學習的人機交互嵌入式視覺模塊,它也是世界上第一款基于單目攝像頭的一個即插即用的視覺人機交互模塊,能夠讓機器人識別周圍是否有人、面前人的身份以及實現人體跟隨、手勢識別等等。從某種意義上來講,這也可以說是圖像識別在C端市場的應用,當這個機器人面向消費級市場的時候,畢竟圖像識別功能的實現是在家居等一系列消費級、民用場景中。
如今,我們在C端市場上見到了越來越多的圖像識別產品及應用,隨著B端市場競爭的白熱化,以及技術進入成熟期,在接下來的一兩年之內,面向C端市場的應用將會實現一個突破。
【鎂客·請講】專注于報道科技創新項目;我們敞開心扉面對每一位創業者,力求為您呈現一群鮮活、有性格的品牌和人物;我們傾聽創業故事和人生經歷、探討商業模式和行業趨勢、對接資本市場和供需雙方,以期為產業發展注入新的活力。
歡迎做客【鎂客·請講】,欄目合作請發送郵件至:post@im2maker.com
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
