最新讀唇術機器來了:主要依靠新的讀唇算法
計算機科學家 Bear 帶來最新讀唇技術,可以利用讀唇算法識別唇形讀出內容并轉換成文字。
近日,相關消息透露,東英吉利大學計算機科學家 Helen Bear 和她的同事 Harvey 共同研發出一套新的讀唇算法,這套算法可以幫助計算機提高識別自然語言的能力,可以根據發音的唇形來讀出內容并且轉換成文字。
不過這聽起來怎么那么充滿科幻的色彩呢?
其實所謂的讀唇術就是傳統意義上的語音識別,而要想真正挑戰這項技術還是很不容易的,因為唇形的發音很容易受到一些微妙的變化而改變,當我們的口型微張、微閉,或者舌面高低發生變化,這些都會導致嘴型發生變化,很難準確識別。
而 Bear 科學家和她的同事研發出來的算法現在已經可以精確的識別一個嘴型所對應的特定音素,它主要是通過對發音嘴型的重復訓練從而形成一定的概念。而且現在這個算法的識別的精準度已經越來越高了。
哈哈~這是不是意味著大家以后都不能在一些特定場所說著悄悄話了呢?
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
