為了理解自然語言,聊天機器人還要走很多“歪路”
為理解自然語言,唯有慢慢的填坑。
上周,以先進的機器學習和自然語言處理技術見長的聊天機器人初創公司Talla推出了一款HR機器人。而就在近日,其首席執行官ROB MAY在某科技網站撰文,指出了一些聊天機器人在自然語言處理上面臨的問題,并表示,雖然自然語言處理技術能夠改善用戶體驗,但依舊面臨著各種技術挑戰。
以下是正文:
目前諸如Slack以及HipChat等聊天機器人的應用逐步增多,企業都在使用聊天機器人發揮更多功能。不少應用程序開發商都在試圖搶占這個新的風口,特別是不斷加強對自然語言處理技術的研究,從而寄希望于通過該技術提升用戶體驗。
對于自然語言處理技術,我們已經投入很多精力來改進、來提升相關的用戶體驗。自然語言處理技術是一個新興的研究領域,盡管我們擁有一個強大的數據科學研究團隊,但對于該技術的研發還處于初始階段。目前來看,自然語言處理技術依舊不夠成熟,也不夠完善,相關的工程實例根本談不上良好的用戶體驗。
不久前,我們推出了具備自然語言處理功能的聊天機器人Task Assistant,超過700家公司使用了該產品,產生了不少相關教訓:
1、人類語言極為不同
即便是關于簡單任務,人類與聊天機器人之間的交互也各有不同。在用戶語言中,充斥著各式各樣的夸張、隱喻、文字拼寫錯誤以及俚語,這些語言組織方式的存在使得聊天機器人需要大量的訓練。
Facebook語言技術開發團隊工程總監艾倫·帕克(Alan Packer)曾就如何構建機器翻譯技術進行過深入探討。雖然工作語言并不像用戶的日常用語一樣多樣化,我們可以通過所提供聊天機器人的類型對不同工作進行區分,從而對機器所能理解的語言加以限制。雖然自然語言處理技術仍非易事,但是通過針對不同工作用戶進行相應調整,能夠有效減少機器理解歧義引發的相關問題。
2、聊天機器人不能將所有不理解轉嫁給背后的人類客服
很多聊天機器人的背后都有人類干預,當機器無法理解用戶語言時,它們將相關問題轉給人類處理。這種處理問題的想法是通過這種方式訓練聊天機器人,直至其存儲了足夠多的數據以應對各種問題。但當用戶期望獲得更好的用戶體驗,并期望機器能夠完全理解其意思時,這并不是一個可持續性的解決方法。因為當用戶提出一個獨一無二的問題時,機器無法進行擴展。據統計,目前15%的谷歌搜索都是獨一無二的,這意味著每天都有上億次的獨特查詢。對于聊天機器人來說,要回答所有的人類問題時相當困難的,因此單單依靠背后的人類客服并不是長久之計。
第一點已經不用多說了,畢竟在這一點上,多數人都已有了自己的認識,而關鍵的第二點卻一針見血的說出了當前的一個盲點所在。的確,按照當前的方法,聊天機器人也只是一個會模仿的提線木偶而已,并不能真正的理解自然語言,而這樣就代表著一切努力終將是白費力氣。
不過,在當前針對自然理解語言面臨的問題上,ROB還能夠提出這與眾不同的一點,如此新穎奇特,也難怪他的公司在機器學習與自然語言處理上能達到如此成就。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
