CVPR 2016正式開幕,一大波黑科技正在奔涌而來!
近日,2016計算機視覺和模式識別領域頂級學術會議(CVPR)于美國正式拉開序幕,內容涉及機器人、無人機、VR、AR、自動駕駛等眾多領域。
近日,2016計算機視覺和模式識別領域頂級學術會議(CVPR)于美國正式拉開序幕。
CVPR是世界頂級計算機會議之一(另外兩個是ICCV和ECCV),內容涉及機器人、無人機、VR、AR、自動駕駛、生物醫療、工業自動化和檢測等眾多領域。值得關注的是,每年的CVPR上都會涌現出各種前沿科技,吸引了不少圈內外的眼球,看看今年的CVPR都將涌現出哪些黑科技。
機器人預測人類行為
這項在視覺預測領域取得的突破性進展由MIT 的計算機科學及人工智能實驗室(CSAIL)發表。運用CSAIL團隊自創的“視覺表征”算法,在進行了600個小時無標簽視頻訓練后,該系統對新視頻中人們下一步動作的預測精確度高達43%,除此之外,還可以預測5秒后的世界。
詳情參看鎂客網文章《MIT人工智能實驗室發力!讓機器人告訴你5秒后的世界》
基于深度學習的手勢識別:DeepHand
DeepHand(深度手勢識別)是美國普林斯頓大學C Design 實驗室的研究成果。該系統使用了深度學習“卷積神經網絡”,通過判斷手勢動作的數字位置(把手指的每一個區域都定義為數字),DeepHand可以推算出其下一個手勢的數字位置,進而預測手勢變化的可能性。通過定位鄰近區域,DeepHand還能夠計算,顯示攝像頭中無法直接捕抓到的手勢運動。
詳情參看鎂客網文章《無需VR外設,普林斯頓學霸用DeepHand解放你的雙手》
微軟全息“穿越”技術:HoloPortation
HoloPortation(全息傳送)可以將活靈活現的人物全息圖像投射到另一個房間,并與房間的人進行實時互動,同時解決時間與空間的距離問題。視頻中出現的就是Shahram Izadi以及他女兒(的全息圖像)。
人工智能成“配音員”
麻省理工學院開發出一個能夠精準預測聲音的算法。當研究員將一個擊打物品的短視頻交給算法,算法就可以生成一個打擊的聲音,真實到可以糊弄住觀看視頻的人類。
百萬人臉測試:人臉識別靠譜嗎?
華盛頓大學的UW團隊用69萬人的照片創建了一個百萬圖片的數據集,分別讓幾個團隊在此基礎上對自家人臉識別系統的匹配準確率進行測試。
測試結果顯示谷歌的FaceNet算法識別準確率最優,在百萬規模數據下達到75%的準確率,另一個與之接近的團隊是俄羅斯的N-TechLab,達到73%的準確率。相比之下,其他算法在小規模數據集能達到95%以上,但是百萬規模下的識別準確率下降到33%左右。
詳情參看鎂客網文章《華盛頓大學最新研究:人臉識別靠譜嗎?》
深度學習識別YouTube的視頻
迪尼斯研究院和復旦大學在CVPR 26日的大會上展示了如何用深度學習自動識別剛剛上傳到YouTube視頻里正在發生什么大事以及新鮮事。來幫助開發之前視頻上傳后丟失的大部分有潛在價值的信息。
斯坦福大學打造“懂禮貌”機器人Jackrabbot
斯坦福大學的研究人員費盡了心思制造了一個叫Jackrabbot的原型機器人,希望它能夠自行在街道上行走,又不會與其他行人碰撞,或者有人迎面而來時不知往左往右。研究人員表示,未來這些走路的經驗將分享給其他的機器人。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
