騰訊AI翻譯首次亮相博鰲論壇,只證明了這一件事……

韓璐 7年前 (2018-04-10)

不管是技術層面,還是訓練數據,當前的AI翻譯距離取代人類還有好一段距離。

“一帶一路”=“一條腰帶和一條路”?

4月9日下午,“騰訊同傳”在博鰲論壇現場上鬧了一個大烏龍。

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

 

這是博鰲論壇首次采用AI同聲傳譯技術,作為頭一份的“騰訊同傳”竟然還出現這種離譜的翻譯錯誤。

另外,從網上一些上傳的現場翻譯圖片來看,一些錯誤簡直令人不忍直視:

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

按照官方所稱,上面的錯誤簡稱“大面積單詞無意義重復、大小寫及字符混亂”。

首次亮相結果鬧烏龍,說好的取代人類呢?

在博鰲論壇現場,基于自研的NMT(神經網絡機器翻譯)、語音識別等技術,“騰訊同傳”會實時識別、翻譯各國嘉賓的演講內容,并同時以中英雙語的字幕形式進行投屏展示。另外,觀眾還可利用微信小程序對嘉賓演講的雙語同傳內容進行回看、收聽和記錄。

從提供的服務內容來看,騰訊的同聲傳譯聽起來還是不錯的。然而,從上面的錯誤來看,體驗有些糟糕呢。

對此,也有網友也進行了調侃:

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

對于此次烏龍,騰訊官方也沒有試圖遮掩,并針對圖片中“大面積單詞無意義重復、大小寫及字符混亂”的錯誤給出了解釋。

譬如中英雙語切換頻率的問題,官方解釋:

當聲源在兩種語言之間不斷轉換時,后臺中、英文識別引擎就會同時開始工作,這會導致兩種識別引擎互相“掐架”,而翻譯結果卻只能選擇一種語言進行輸出,再加上對嘉賓每個語氣詞也做了精準的啊啊啊翻譯,導致引發錯誤。

又比如“for”的問題,官方稱:

出現這種情況主要是包括神經網絡機器翻譯在內的深度學習算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發翻譯偏差。今天的嘉賓演講內容中包含“for for for for”、 ”that’s that’s that”等重復內容,而翻譯引擎不巧放大了這個重復,導致了翻譯結果出現錯誤。

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

AI同聲傳譯的玩家不在少數,鬧烏龍的也不止騰訊一家

目前,包括騰訊在內,涉及AI同聲傳譯市場的玩家也不在少數,比如科大訊飛、搜狗、百度等公司。

在市場的玩法上,他們的套路基本可以分為兩種,一類是以翻譯APP、API接口形式存在的軟件產品,譬如此次騰訊參加博鰲論壇的產品;另一類則是AI同聲傳譯硬件產品,最為典型的代表就是科大訊飛的“曉譯翻譯機”,以及搜狗的“搜狗旅行翻譯寶”。

從網上的一些用戶體驗來看,再結合此次騰訊同聲傳譯的情況,我們只能說,會鬧烏龍的不只是騰訊一家。

科大訊飛的曉譯翻譯機為例,有網友以幾句英語教學的錄音來進行測試,如下:

According to our records, a room for two guests was booked under your name.

谷歌:根據我們的記錄,有兩位客人的房間是以您的名義預定的。

訊飛翻譯機:根據我們的房間記錄,兩位客人,你們的名字都是什么?

Today we have grilled tuna and New York strip steak served with creamy Italian herb sauce.

谷歌:今天我們有烤金槍魚紐約牛排配奶油意大利香草醬。

訊飛翻譯機:吉姆去紐約的牛排,配有干凈的意大利香草醬 / 蒂姆已經得到了一份紐約的牛排,用來清潔意大利的泥土沙司。

又比如搜狗的旅行翻譯寶,在正常的翻譯過程中,其也是偶有錯誤,而在對話內容較為復雜,或者語速過快等場景下,它的語音識別也會出現問題,之后的AI翻譯自然是無法理解。又比如阿里巴巴的AI系統,此前的一場云棲大會中,該系統直接將“nationally”翻譯成了“男生弄亂”,讓演講者馬云爸爸在現場呆愣了5秒。

騰訊牌AI翻譯機首次亮相博鰲論壇,只證明了這一件事……

最后:AI翻譯還處于初期發展階段,想要取代人類還很早

當前,國外的谷歌、微軟,國內的BAT、科大訊飛、搜狗等公司均在加緊布局AI翻譯市場,發布各類軟硬件產品。在技術層面,NMT是多個公司在AI翻譯產品中所采用的技術,其能夠模仿人腦神經思考的模式進行翻譯。不過,騰訊方面此次的回應則表明,技術依舊存在不確定性的。

不僅僅是技術,AI翻譯的訓練數據也跟不上了。在一些AI速記的應用場景中,我們能夠看見,為了保證現場實時速記的準確率,工作人員一般都會提前用大量針對性數據來對系統進行訓練。

比如此次鬧出烏龍的騰訊,在備戰期間,“騰訊同傳”也學習了該論壇過往數百份演講稿。然而,從現實情況來看,訓練的數據依舊是不夠的,畢竟連“一帶一路”這一固定詞匯都能翻譯錯誤。

遙想此前,包括騰訊在內,在發布AI翻譯產品的時候都以“替代人類翻譯員”為自己的標語。不過,從現實情況來看,技術依舊存在不確定性、數據欠缺。這只能證明一件事,AI翻譯想要取代人類翻譯員,還有一段路要走。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到