硬紀元AI峰會實錄|華捷艾米沈瑄:端加云才是AI和AR的未來
關于人機交互,關于AI和AR的未來,我們應該如何看待?
2017年7月9日,由鎂客網、振威集團聯合主辦的“3E‘硬紀元’AI+產業應用創新峰會”在北京國家會議中心盛大開幕?,F場200位來自全球AI行業的頂級專家、知名創投機構、創業公司團隊和知名媒體齊聚一堂,共謀AI+行業的創新應用,探討AI的當下與未來。
現場,華捷艾米聯合創始人沈瑄給我們帶來了主題為“3D視覺系統——打造AR&AI生態”的內容分享。沈瑄表示,未來的人機交互一定是回歸到人與人之間交流的本質,即視覺+語音的交互,如此才能相互理解,繼而進行充分的交流。此外,關于未來數據應用的方式,在沈瑄看來,無論是AI還是AR,端加云才是真正的未來。
以下為演講實錄(為方便閱讀,有所刪減):
大家下午好,我是南京華捷艾米的沈瑄,剛才前幾位嘉賓已經給大家分享了非常多的干貨,其實人工智能的概念非常的廣闊,而我們只是參與了其中的一部分:機器視覺。對于機器視覺這個概念我們也覺得非常的大,從這個車牌的識別到人臉的識別,這都是屬于機器視覺,而我們做的是一個3D的一個視覺。
未來的人機交互是視覺+語音
我們說一下人機交互,尤其是人與機器人的交互。包括成人和小孩在內,其實我們大家都有一個機器人夢,從星球大戰到鋼鐵俠,從變形金剛到阿童木,到大白,到哆啦A夢,我們都希望身邊有一個機器人可以在生活、學習或者工作中去幫我們解決各種各樣的問題。這就需要說到人與機器是怎么交互的。
這就是人與機器交互的一個歷史。在50年代,我們通過鍵盤產生人與人、人與機器的交互,在下一階段有了windows,我們通過鼠標人與機器去交互,而在2000年左右的時候,蘋果的iPhone出來了,我們通過touch、通過觸摸即可實現人與機器的交互。
而我們說現在再下一代人與機器是怎樣去交互?是視覺加語音,回到人與人之間溝通的本質。比如說我現在跟大家在交流,通過我的臉部、手勢,通過我的肢體語言,大家能互相理解,去充分的交流。人機以“自然語言”的方式交互,包括語音交互、語音溝通作為基礎,還包括人臉、圖像、手勢、虹膜、體感等等。
無論是AI還是AR,端加云才是未來真正的解決方案
然后我介紹一下我們公司在3D、AR上面的一些工作。我們公司認為,AR是人工智能在下一階段能夠應用的一個比較好的行業。蘋果CEO庫克也說過,AR具有無限的想象空間,它打破了虛擬世界與真實世界的一個界限,是下一代人與機器交互的一個新的模式。
我們認為AR的體系應該分成三個步驟去實現:第一是基礎技術,包括3D的實時測量、V-slam、人體動作識別和手勢識別等等,這些基本的一些活動的元素;到了第二代會具備一些娛樂性的要素,包括換臉、3D美顏等;最后一步則是會實現真正智能化的AR的系統,那可以通過身高、體型、年齡、性別甚至情緒的識別、通過深度學習以及物聯網等各種新的技術來達到最終的一個智能化AR系統。
我們現在的芯片是把所有的數據放在里面,主要是在端這邊來識別跟計算,而在未來,我們會把云端去打通,也是基于思科在2015年提出的霧計算或者是邊緣化計算的這種理想?,F在的移動化設備人人都有,全球可能有20億部手機,到了一定階段,這個數量會乘以至少7到8倍,也就意味著有140億到150億的終端要連接到云端,而其中所需的傳輸能力跟計算能力是現在的基礎架構所實現不了的。思科在15年的時候提出了這個霧計算,就是在IOT的智能終端上把更多的計算,尤其是前端的一些計算放在端的芯片里,然后實時去上傳一些預處理以后的數據,而從云端下載下來的是更新過的通過深度計算更新過的一些算法的模型。
所以我們認為,無論是人工智能還是AR,端加云才是未來真正的解決方案,通過終端上傳數據到云下載數據,這種簡單的模式肯定是遠遠不夠的。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
