避免淪為“人工智障”,機器人還需找對語音交互的“打開方式”

韓璐 8年前 (2017-09-21)

特定場景進行特定培訓,這是打造更連貫、更自然的人機語音交互的一個解決途徑。

“iPhone的市場占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“怎么都喜歡華為?”

以上是發生在鎂客君與某一語音交互機器人之間的對話。

避免淪為“人工智障”,機器人還需找對語音交互的“打開方式”

你來我往之間,那些令人“頭痛”的瞬間

在日常生活中,通過語音交互技術,我們能夠與機器人進行交流,或者是讓后者實時控制一些家居產品;在辦公時間,借助于語音交互技術,我們也能夠直接口頭交代語音助理一些工作,從而提升工作效率……

可以說,隨著背后語音識別和自然語言處理技術的逐步提升,人們對于“語音交互”這一人機交互方式正在變得漸漸適應。不過,在你來我往的語音對話之間,我們也不可避免的也遇到了一些有時令人“哭笑不得”的BUG。

2017國家服務機器人產業高峰論壇于近日落下帷幕,在圓桌環節的自由問答時間,有人提出一個問題,稱當前的服務機器人在人機語音交互的過程中,常常會詞不達意,或者是出現上下文不連貫的問題,導致最終的用戶體驗不佳??梢哉f,這是當前人機交互上最“頭痛”的問題,也是導致人工智能被冠上“人工智障”稱號的根本原因。

避免淪為“人工智障”,機器人還需找對語音交互的“打開方式”

避免“人工智障”,我們目前需要將機器人關在“籠子”里

談及這種“人工智障”現象,其中主要涉及自然語言處理和深度神經網絡的一個問題。

一般情況下,基于自然語言處理技術,人工智能系統即能夠對人們的語句進行拆分和處理,從而做到“理解”這句話,繼而對用戶作出相應的回應。至于上下文連貫,這其中主要關乎深度神經網絡的一個搭建,換一種說法,主要是“知識圖譜”在起作用。仍以本文最開始的對話為例:

“iPhone的市場占有率是多少?”

—“目前80%。”

“那華為的呢?”

—“目前是xx%。”

在深度神經網絡,或者是知識圖譜的協助下,當我們提出第二個問題的時候,它會將華為與上一個問題的“市場占有率”進行關聯,從而做到對這一問題更為完整、精準的理解。

事實上,為了達到更為完美、自然的人機交互體驗,難道人工智能企業就沒有搭建深度神經網絡、構造知識圖譜嗎?當然不是,只不過在這基礎之上,依據當前機器人的語音交互的整體情況,我們還需要附加一些場景條件。

這一塊問題的解決還是需要根據不同的場景來做不同的定制,畢竟這也不是說一個模型、一個算法就能解決好所有的問題。武漢泰迪智慧科技有限公司創始人兼董事長李成華表示。

總結一下也就是說,要想解決當前這一上下文理解不連貫的問題,我們還需要依據特定的場景來對機器人進行特定的數據訓練,從而打造一個特定機器人。舉個例子,比如智能客服機器人,其所能提供服務的領域包括金融、教育、酒店等多個領域,每個領域都有著其所特有的問題或是對話場景,為了保證對話的連貫,我們就得利用這些特有數據進行培訓,構建一個面向垂直領域的知識圖譜,以避免問題交叉、邏輯混亂等情況的出現。

避免淪為“人工智障”,機器人還需找對語音交互的“打開方式”

面對無人駕駛的落地問題,我們都說低速行駛、封閉性場景是其當前能夠快速實現落地的一個方向,簡單粗暴的說,也就是將無人駕駛汽車關在一個相對“封閉”的場景里。而與此類似,要想機器人在語音交互上表現的沒有那么“智障”,我們也需要將其關在一個限定的“籠子”里面來實施培訓,不同的是,無人駕駛汽車的“籠子”是在真實的物理世界,而機器人則是在一個虛擬層面。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到