極限元溫正棋:從前端信號處理到語音識別、對話、聲紋情緒與合成,要打造智能交互閉環

韓璐 7年前 (2018-03-16)

在溫正棋看來,鑒于開源等原因,智能語音的核心技術已經不存在太大差別,而他們相比之下的優勢更多集中在業務服務能力及閉環技術的應用層面。

前段時間,亞馬遜智能音箱Echo時而抽風的怪笑聲令消費者“震驚”,雖然到底是什么原因造成的,我們目前尚不清楚。不過,我們可以確定的是,語音交互已經成為了人們智能生活中不可或缺的一個因素。

極限元溫正棋:從前端信號處理到語音識別、合成與交互,我們要打造智能語音技術閉環

選擇極限元,他的初衷就是把研究轉化為產品應用到市場

我自己是中科院自動化所模式識別國家重點實驗室的副研究員,就想把研究做成產品運用到市場上,這是我當初加入極限元的初衷。極限元CEO溫正棋表示??梢哉f,從成立之初到現在,溫正棋見證了極限元的成長與蛻變。

在最初,極限元選擇以“單項技術應用”來切入市場。彼時,基于音頻比對和關鍵詞檢索兩個關鍵技術的結合,再加之與其他公司的合作,極限元開拓了多個業務,包括音頻防恐防暴、反電信詐騙等等。

此外,溫正棋表示,在語音合成、語音識別等方面,極限元最初也與多家大型公司達成了合作,如“騰訊、搜狗、奇虎360等”。

目前,在自身公司主體之外,極限元也與中科院自動化所聯合掛牌成立了“中國科學院自動化研究所-極限元(北京)智能科技股份有限公司智能交互聯合實驗室”。

極限元溫正棋:從前端信號處理到語音識別、合成與交互,我們要打造智能語音技術閉環

打造智能語音技術閉環,為市場提供整套的智能交互解決方案

從2017年開始,極限元對自己的定位進行了調整,溫正棋稱,當前他們致力于打造一個從前端信號處理——語音識別——人機對話 —聲紋識別—情緒識別——語音合成的語智能交互技術“閉環”。

而基于這一全新定位,在業務的開展方面,溫正棋指出了三個全新的角度,分別是機器人和智能客服、語音轉寫。

具體來講,比如機器人,遵循自身定位的極限元提供的也是閉環式解決方案。“從前端信號到語音識別、語音合成、再到對話,‘對話’方面會接入第三方內容。”溫正棋稱。也就是說,在具體的案例中,機器人廠商只需提供一個配備了系統的機器人,而極限元則是將自身智能語音軟件嵌入其中,以便廠商基于軟件來搭建智能機器人的語音交互能力。

又比如智能客服,也被細分為兩個小方向,分別外呼機器人,因為手握主動權,極限元在設計規劃的時候將針對性的設計對話邏輯,以避免語音識別不準確、對話邏輯混亂等問題。另一個則是語音質檢,將之替代客服行業中的人工質檢,在全面覆蓋的前提下提升質檢效率。

與眾多從事智能語音技術的公司一樣,極限元當前的業務也是以B端市場為主。同時,他們也面向C端用戶提供了一些產品/服務,譬如語音轉寫等。

在智能化趨勢之下,作為人機交互的主要途徑之一,語音交互市場愈發龐大。與此同時,我們看見的業內多個公司的此起彼伏。“鑒于技術、算法開源等因素,業內各家公司在核心技術上并沒有太大的差別,最主要的關鍵是你在特定領域的數據積累。”談及極限元的市場競爭力,溫正棋這樣表示。

在其看來,作為一個創業公司,相比于技術,他們比之其他公司的優勢更多的集中在業務上。“對于一個業務來說,友商們可能沒有分配單人來專門跟進業務合作、提供服務等等。作為初創公司,我們在這一服務方面肯定做的比他們好。”

極限元溫正棋:從前端信號處理到語音識別、合成與交互,我們要打造智能語音技術閉環

智能語音技術的行業門檻不低,語音交互不順暢的解決方案在于“特定”

今年來,像智能客服、智能服務機器人以及智能家居單品等產品與人類之間經常會發生智能交互的過程。在這其中,我們應該也注意到,有時候基于語音的人機交互過程并沒有那么的順利,常常會上下文沒有邏輯。

對于這種問題,溫正棋將原因總結為兩點,分別是語音識別不準確以及對話的不準確。至于如何解決,前者的關鍵還是在于“特定”,在收集特定領域的數據之后,再通過迭代遷移學習算法等等,不斷地將模型進行更新。“這種快速迭代的方法更適合我們這種小公司。”他表示。

至于對話,眾做周知,在具體的應用中,其中關鍵部分自然語言處理的準確率并不存在百分之百的情況,為了更好地效果,還是需要將應用場景進行固定。從本質上講,這一解決方案與語音識別的解決方案是相同的,講究專用、講究特定領域。

在采訪中,溫正棋提到,他經常會分析一個問題:智能語音技術的人才主要是由哪些隊伍來產生的?“從全國的角度來看,智能語音人才主要由這么幾個渠道產生,像科大訊飛、清華北大、中國科學院自動化研究所,以及西工大、上海交大等等,每年出來的智能語音技術方向的人才的數量其實很少,但是市場上的需求是很大。”

對于智能語音技術行業的進入門檻,溫正棋稱并不低,除了技術上存在的門檻,數據積累是一個不容忽視的重要部分,尤其是在做垂直領域的時候。

從創業角度來講,“除了單獨的技術儲備,還需要擁有對應的數據積累與運用。”如今,所在智能化的驅使下,不管是算法的訓練,亦或是產品的功能實施,數據的重要性愈加凸顯。而對于從事智能語音技術的創業者而言,如何在保證隱私、數據安全的前提下獲得大量數據,是他們時刻都需要考慮的問題。

結語

目前,基于自身定位的調整,接下來,極限元將基于智能機器人、智能客服等業務來積累數據。另外,再加以對市場的調研,以此前提到的三個業務角度為中心向外圍進行擴展,根據市場的實際需求來定制產品服務。

距離上一次天使輪融資,極限元已經走過了一年多的時間。據溫正棋在采訪中透露,雖然公司略有盈余,但也正著手準備開啟下一輪融資,希望投資方能夠帶來更多的應用場景資源。


【鎂客·請講】專注于報道科技創新項目;我們敞開心扉面對每一位創業者,力求為您呈現一群鮮活、有性格的品牌和人物;我們傾聽創業故事和人生經歷、探討商業模式和行業趨勢、對接資本市場和供需雙方,以期為產業發展注入新的活力。

歡迎做客【鎂客·請講】,欄目合作請發送郵件至:post@im2maker.com

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到