重磅!圖靈獲 NLPCC2018 競賽用戶畫像和推薦任務第1名

巫盼 7年前 (2018-05-26)

圖靈在用戶畫像和智能推薦上已經達到行業頂尖的水平,并賦能到國內 Top 50 的兒童玩具品牌,幫助他們實現智能化的產品體驗。

近日,NLPCC 2018 競賽公布評測結果,圖靈機器人NLP研究員在用戶畫像與好友推薦任務中均獲得第 1 名!

另據悉,用戶畫像與好友推薦這兩項新技術將在7月1日隨著圖靈OS新版正式上線!

重磅!圖靈獲 NLPCC2018 競賽用戶畫像和推薦任務第1名

NLPCC 是國內首個 NLP 領域的國際會議,是國際上中文計算領域的頂尖會議。會議由中國計算機學會(CCF)主辦,CCF 中文信息技術專業委員會(CCF TCCI)及高校(每年通過投票選舉)承辦。會議內容主要圍繞自然語言處理(NLP)和中文計算(CC)兩方面來進行。

本次競賽,包含 8 項任務評測,涉及情緒識別、語法糾錯、自動文摘、對話系統中的口語理解、多輪人機對話、知乎問題標注、智能問答、用戶畫像與推薦等。憑借多年的技術和數據積累,圖靈參加并拿下了用戶畫像與好友推薦任務第一名。

用戶畫像和好友推薦是什么?

用戶畫像是在給定了用戶的一些基本信息,例如:性別、地理位置、好友關系、微博信息,以及用戶的標簽信息,需要根據用戶的基本信息來預測用戶的標簽。

好友推薦任務目的是基于用戶歷史好友、用戶的個人信息、微博文本、到過的地點等,為用戶推薦新的好友。該任務中一個用戶可能和多個標簽相關聯,是一個典型的多標簽分類任務,目前比較流行的有三類方法來解決多標簽分類問題:

(1) 問題轉換,該方法的思想是將多標簽問題轉換為單標簽問題,例如二元關聯、分類器鏈、標簽Powerset等方法都是早期提出的方法,但是該方法沒有考慮標簽之間的相關性。

(2) 改編算法,該方法的思想是將多標簽分類問題轉化為多分類問題。該方法跟問題轉換方法一樣沒有考慮標簽的相關性,而且當標簽數量比較大的時候,分類組合的數量會很大,增加了模型的復雜性,并降低了精確度。

(3) 集成方法,該方法的思想通過組合多個模型,以獲得更好的效果,使集成的模型具有更強的泛化能力,但是該方法需要大量的維護工作。

由于之前的方法都有各種各樣的缺點,考慮到任務中標簽之間有比較強的關聯性,利用深度學習能夠自主學習特征的特性,我們提議了新的模型,考慮到用戶基本信息的組合特征和標簽之間的相關性,從而提高了預測的準確率。

好友推薦任務在大部分研究好友推薦的文章中,大部分是基于特征挖掘實現的,需要充分的用戶和好友的微博文本,個人信息,興趣愛好甚至生活習慣等信息,還有一些基于社交信息進行圖挖掘。

在準備過程中,我們首先尋找了相似的數據,并嘗試了從專門用于好友推薦的多種,包括傳統的FOF、協同過濾、矩陣分解等。在發布正式數據后,對適用各類特征的方法進行了評估和比較。最終根據用戶歷史社交信息的多少,分別選擇了合適的方法。

就像人類的智慧行行程需要依賴于知識和經驗,機器人想要聰明也需要有足夠豐富的“知識”和“經驗”。

為此,圖靈建立了大量的知識圖譜——在這其中,圖靈不僅有知識圖譜數量上的累積,更強調圖譜中每個節點的關聯性和跳躍性。在對話過程中,機器利用知識圖譜來理解人的話題,并找到話題圖話題的關聯性,實現在相互關聯的話題之間自然跳轉。

你是誰?我們發生過什么?

搭載了圖靈大腦的機器人,可以把每一個用戶作為一個實體,在使用中不斷關聯與用戶相關的信息,反向刻畫出精準的用戶畫像?;诤腿说慕换祿?,機器人會再形成新的知識圖譜,并完成跨越間維度的上下文對話。

——換句話講,你家的機器人不再是個沒有故事的“傻孩子”,它不僅知道自己是誰,也知道你是誰,甚至記得你喜歡什么、你說過什么話,并有可能在日后的對話中,用你的說過的話“懟”回你。

你喜歡什么?我能為你做什么?

在解決“我是誰”、“你是誰”這樣的認知問題之后,接下來就需要考慮“聊得來”的問題了——機器人需要知道你喜歡什么,并根據你的興趣向你主題推薦聊天話題和內容服務。

在對話狀態下,基于前面的精準用戶畫像,圖靈會通過智能推薦算法,按照用戶的特征來選擇其感興趣的話題。而在非對話狀態下,圖靈則會主動篩選內容和服務,幫助用戶快速找到。

簡單來講,就是同一款搭載了圖靈大腦的產品,在不同用戶的家里可能會有完全不一樣的表現——小女孩的機器人喜歡講白雪公主和哆啦A夢的故事;小男孩的機器人對超級飛俠和奧特曼的故事如數家珍。

在人機交互的過程中,精準的用戶畫像可以為機器「理解」用戶打下基礎,幫助機器更加清晰地了解用戶的意圖;同時,通過智能推薦的方式,在操作層面上,可以減少用戶的操作成本,而在對話過程中,可以預先圈定意圖范圍,避免了“答非所問”之類的尷尬。

憑借圖靈在人工智能領域多年的積累,圖靈在用戶畫像和智能推薦上已經達到行業頂尖的水平,并賦能到國內 Top 50 的兒童玩具品牌,幫助他們實現智能化的產品體驗。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到