AIIA人工智能開發者大會開啟在即,思必馳俞凱暢談語音交互技術的“AI互聯”

伶軒 7年前 (2018-10-08)

語音交互技術會使信息和人、信息和設備以更豐富的形式鏈接在一起,它已成為AI最重要的交互方式。

在當前的人工智能行業里,有一個非常有意思的比喻:AI就是“電”。

可能在1780年伽伐尼通過閃電研究電流現象的時候,除了科學界,沒有任何一個人會認為他的研究將徹底改變人類未來的生活。直到86年后,1866年西門子制成了世界上第一臺自勵式直流發電機,人類才愿意去相信,電,是一個足以顛覆現有生活方式。由此到來的第二次工業革命,也充分印證了這一點。

現在,人工智能時代來了。AI技術正在以各種方式、從各個方面滲透入我們的生活。它極有可能會和“電”一樣,再次顛覆我們現有的生活。而作為人工智能相關技術中與用戶接觸最為直接的部分之一——語音交互也正在通過各種智能終端硬件潛移默化的改變著我們的生活方式。

10月15日,由國家發展和改革委員會、國家網信辦指導,中國人工智能產業發展聯盟(AIIA)主辦,蘇州工業園區管理委員會支持,鎂客網全程協辦的“AIIA人工智能開發者大會”將在蘇州舉辦。屆時,思必馳首席科學家俞凱將從語音識別技術發展及落地應用出發,圍繞“對話智能”發表主題演講。思必馳也將主辦“智無界·創有形——AI開發者如何利用軟硬件技術融合實現創新”專題論壇。

活動前夕,鎂客網獨家采訪了俞凱,他表示,“語音交互技術會使信息和人、信息和設備以更豐富的方式鏈接在一起,在人工智能這個“電局”中,它所承載的就是‘輸電電網’的功能。”

AIIA人工智能開發者大會開啟在即,思必馳俞凱暢談語音交互技術的“AI互聯”

圖 | 思必馳首席科學家俞凱

與物聯網智能硬件終端飛速發展,是水到渠成的事情

前兩天,網絡上有個小視頻很火:一位女生模仿Siri得惟妙惟肖,被廣大網友評為是“Siri本Sir”。

這個視頻為什么火?有兩個格外重要的原因:第一,女生無論在聲線、語速、說話方式上都幾乎和Siri一模一樣;第二,Siri已經成為了大眾生活中的一份子了,語音交互及相關應用正在深入地滲透進我們生活的方方面面。

據調查公司VoiceLabs去年發布的《2017年語音報告》顯示,僅2017年,語音產業結構按照硬件產品、AI軟件、語音應用Apps、生態系統服務相結合的架構,至少出臺了2450萬臺以語音為主要交互方式的智能硬件產品,市場總量達3300萬臺,市場規模超200億美元。足見智能語音交互市場的龐大。

AIIA人工智能開發者大會開啟在即,思必馳俞凱暢談語音交互技術的“AI互聯”

而值得一提的是,即便是最早出來的Siri,也早已不是iPhone的專屬,而是被廣泛應用于蘋果所有的智能終端硬件上。亞馬遜、谷歌、百度等科技巨頭也是如此,智能語音交互技術在車載、智能家居等場景中的應用早已不是“新鮮事”了。

“其實,早在2012年的時候,我們就對智能手機做過一些探索。但當時的智能手機應用,APP應用、集成和產品設計才是核心競爭力,其他技術只是輔助手段。”對此,俞凱解釋稱,“物聯網本身的爆發性是非常驚人的,因為物聯網終端硬件產品大多屏幕很小甚至沒有屏幕,相較于手機,其對語音交互的需求更加緊迫。這也是思必馳決定在2014年果斷轉戰至智能硬件領域的主要原因。”

對于思必馳來說,其所專注的語音交互技術,是具有核心創新競爭力的。在覆蓋度上,包括語音識別、語義理解、對話、決策等,思必馳已經走到了全鏈路一體化階段,而不只是一個單純的模塊。“DUI”平臺的推出,更為思必馳加強了于眾開發者之間的聯系與合作。

除此之外,思必馳已有提供大規模、可定制服務的能力。“簡單來說,能夠做出一個好不是真的好,能做出十個不同的好才算是好。根據用戶的需求提供定制的個性化智能語音交互系統,讓其不僅具有高通用識別和交互能力,還能在相關領域擁有個性化的知識積累和交互邏輯能力,這樣才能稱為全鏈路賦能。”

因為上述幾大原因,2014年決定轉型時,思必馳將重點落地場景放在了車載、家居等物聯網相關智能終端硬件領域中,這是極具前瞻性的。“平臺性的技術就應該被更大的發揮出來,因為有了這些積累,所以到2017年我們在物聯網行業有了很大的發展。這是水到渠成的事情。”

據IDC對全球音箱出貨量的統計,2017年,應用思必馳語音交互技術的智能音箱的總出貨量排名,已是全球第三。

思必馳的使命是“溝通萬物,打理萬事”

在當前的AI行業中,有很多的細分領域,談及語音交互技術在AI行業整體發展中所扮演的角色時,俞凱給我們打了個比方:如果將現在的人工智能行業比喻成“電”,那么行業就由三部分組成,發電的、用電的、和輸電電網。

發電,如芯片、大數據等提供基礎智能服務的行業,就是通過篩選、分析、處理信息,并通過這些信息提供智能服務;

用電,如智能硬件中的機器人、智能醫療器械以及相關智能系統等;

輸電電網,就是語音交互技術,它會使得信息和人、信息和設備以更豐富的形式鏈接在一起,從而產生很多新的機會。而無論對于“發電”還是“用電”層面,這一交互媒介都已經成為了AI最重要的入口之一。

由此來看,作為一家以擁有“媒介”核心技術的公司,思必馳所需要做的,就是通過語音這一媒介,去解決用戶“用電”中所有的問題,尤其在簡化“輸電”方式,提升“輸電”效率上。對此,俞凱強調,“溝通萬物、打理萬事,就是我們當前的使命。”

“為了更好的提供語音交互服務,我們正在陸陸續續推出一些新的產品和相關技術,后續也會有更多的驚喜,包括AI芯片。”

可以看到,在“端”上進行布局已是大勢所趨。從語音交互的角度來說,用“溝通”連接萬物最主要的就是把物聯網上一些非標準的重要節點標準化,如各種規格性能的傳感器等。

而對于芯片的具體信息,俞凱表示現在還不方便透露過多。

關于大會的期待

很明顯的,對于思必馳來說,加強原始創新技術積累和打造有價值的實際應用是其未來需要一直努力的方向。作為語音交互行業的佼佼者和此次“AIIA人工智能開發者大會”的演講嘉賓,俞凱期待能夠從開發者的角度看到一些新的想法和具有創新精神的應用。

“開發者是人工智能產業發展的主力軍,我們期待與開發者緊密合作,用對話式人工智能溝通萬物打理萬事,一起讓智能的世界變得更美好。”

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到