糟了!算法說它懂你
俗語有云:內容平臺,能力越大,責任越大。
2018年夏天的《中國好聲音》,清華大學的學霸以改編版的《止戰之殤》贏得了周杰倫的轉身。在問答環節,這位選手特意向大家介紹了歌曲的“合作者”——AI算法。
他說,主體歌詞的創作是由AI算法完成的,而他做的事,是“賦予歌詞人類的溫度”。
這是深度學習算法首次以如此華麗的姿態出現在綜藝節目上,像是AI在向世界宣告自己的“霸主”地位。事實上,它對我們生活的滲透早在多年前已經開始。
算法勾魂術
2000年,國內互聯網時代正式開啟。智能算法隨著互聯網對生活的滲透,也開始進入到各個公司的產品設計中。這種算法從早期的打標簽方式開始,強調對用戶的“內在個性”的關注,使用戶在產品體驗過程中釋放訴求,進入到特別推薦、社區等被算法充分了解的領域,進一步提升了用戶的黏性。
對早期用戶而言,這樣的算法,是充滿新鮮感又刺激的。
文娛領域通過算法實現個性化推薦功能的開山鼻祖,當屬于2005年成立的豆瓣。早期,它基于用戶社交屬性,即人群喜好的重合度因素,利用算法進行分類與關聯推薦,實現對書籍、音樂和電影內容的個性化推薦。當時的豆瓣還是社區模式,針對的也是有固定特性的垂直用戶,這樣的算法非常巧妙地在形成了口碑效應,在短期內用戶量急速增長,成為了當時的“流量”大平臺。這種由算法帶來的超強用戶黏性使得在未來十年中,即便豆瓣幾經飄搖,也依然有其影響力的重要原因。
令人惋惜的是,雖然如今的豆瓣電影被看成中國的IMDB,但是就整個平臺而言,由于十年間計算機覆蓋率呈指數級增長,用戶覆蓋到社會各個角落,廣告、不良內容的逐漸滲入,豆瓣曾經引以為傲的算法帶動優質內容的初衷也不再存在。同時2010年以后,知乎、網易云音樂等內容平臺的出現,借助更加優質的AI智能算法迅速吸粉,瓜分了豆瓣原有的用戶陣地。
然而無論是曾經的豆瓣社區,還是現在號稱智能算法的各大內容平臺,推薦同質化嚴重的同時,也讓人質疑,這些算法開始不懂用戶了。
智能算法到底是什么
當下AI推薦機制下催生的內容平臺大致可分為四類,分別是以今日頭條為代表的新聞內容平臺,以知乎為代表的知識問答平臺,以抖音、快手為代表的短視頻平臺和以網易云音樂為代表的流媒體音樂平臺。
盡管應用領域有所不同,各款產品的特性和生態布局也有差異,但是在個性化推薦機制的設計上,萬變不離其宗,它們的心思如出一轍。
總體來看,AI推薦機制的框架設計基于三個維度。
第一個維度是內容,即基于音視頻或文本本身的內容提取標簽并以此分類。如在音樂領域,可依據音頻中的頻率、歌曲名、歌手、音樂風格特征等信息來將內容歸類為布魯斯、藍調或者搖滾等;
第二個維度是用戶,即對用戶行為數據進行提取和分析。如在各大平臺上,都會見到喜歡、收藏等選項,這里面,用戶的操作會折合成一定的權重,并影響最終的算法結果;
第三個維度是場景,這其中包括了時間場景和環境場景。在不同的環境和時間段,同一用戶的選擇趨向也是不同的。
事實上,算法框架衍進至今,是一步一步完善至此的。內容和用戶維度先后出現,最后才是場景,它們三者之間互為牽制和補充,從而避免推薦結果出現偏頗。
單純基于內容的算法有著明顯的問題,因其分析的是大量的數據,算法自然無法推薦新的和非主流的內容,易使推薦趨同。因而,對用戶行為的分析,自然就可以利用用戶對內容的態度來有效判斷新內容的質量,并借助用戶的差異化來使得算法推薦保持一種持續更新的狀態,這樣就彌補了內容算法的局限性。同時,這一維度的直接好處就是,幫助平臺快速得獲得用戶的喜好信息。而場景的融入,則幫助算法更加精準的把握用戶選擇的變化規律,以實現人性化。
這里面,內容與用戶行為兩項維度占主導因素,前者受限歷史數據,后者受制于用戶行為。而兩者融合,則相得益彰。
人工管理與AI算法之間的博弈
今天,將推薦機制用到極致的平臺中,不得不提今日頭條。它通過將用戶分享和AI智能推薦機制很好的融合在一起,并以此“上位”。而隨著影響力的擴大,今日頭條的算法推薦漏洞亦于無形中被放大,終被推上了風口浪尖。
但是歷經四次改版的今日頭條算法依然有著AI無可避免的通病,包括對語境的判斷、對邊界性信息的篩選等,也因此雖然它在海量信息中為用戶做出了選擇,但這樣的選擇缺乏用戶意愿的反饋,缺乏詞義多重理解帶來的有效信息判斷,可能用戶在某一時刻看了一篇具備反諷意味的文章,通篇采用了魔幻主義寫作手法,而算法就會基于這樣的無差別判斷,持續不斷地為他推送與其意愿不符的內容,而忽略了其真正想要獲得信息。
在這個層面上,算法的存在,不但沒有真的懂用戶,反而在更廣的范圍內,試圖以技術的途徑承擔媒體的職責,卻忽略了媒體社會價值的根本在于信息的全面性、觀點的多樣性,而不是重復在某一個舒適的維度。
在過去將算法設為主要運行機制,人工為輔助,今日頭條平臺的運行成本確實得到大幅的降低,商業利益得以最大化,但也因此凸顯了弊端。當然,今日頭條也在通過建立“青云計劃”等機制,廣招審核員去試圖扭轉內容的走勢,但正如其資深算法架構師曹歡歡博士所言,“平臺出于內容生態和社會責任的考量,像低俗內容的打壓,標題黨、低質內容的打壓,重要新聞的置頂、加權、強插,低級別賬號內容降權都是算法本身無法完成,需要進一步對內容進行干預” 。
事實上,完全驅除人工管理根本是個偽命題。任何一種算法都是基于平臺價值與利益而產生的,它代表的也是平臺管理者的價值觀。在某種程度上,算法可以不動聲色地讓你充分了解這個平臺的氣質、個性甚至是追求。
而關于二者之間的對峙,則有個經典的故事。自2015年開始,因立場不一,老牌流媒體音樂服務平臺Spotify與Apple Music之間就一直處于對峙狀態。作為坐擁7500萬用戶的音樂服務平臺,Spotufy堅持用大量的數據進行個性化推薦,而人工挑選和推薦音樂一直是Apple Music的重要賣點。庫克認為,“我們擔心音樂正在失去人性,擔心它正在變成一個字節一樣的世界,而不再是一個藝術和技藝的世界”。
然而,從目前的統計數據來看,位居第一的Spotify的用戶數是Apple Music(第二位)的兩倍,卻是不爭的事實。
智能反被智能誤,你并不懂我
而用戶,沒有糾結,簡單直接。
作為資深音樂愛好者和網易用戶,小乙對平臺主打的智能推薦其實存有不滿,“網易云音樂會給我推薦不同的歌單,但我只會偶爾點開,而且點開后我大致‘看’了一下,發現基本不是我想要的,它也并不懂我,很少能觸碰到我的點。”
對于今日頭條頭條的推薦機制,小甲也有類似的感受,“我只是有那么一次點開了娛樂新聞,結果平臺就狂推娛樂八卦給我,看不到我想看的,我非常反感。”
這不是算法引發的個例。如上文所言,算法在某種程度上試圖承擔媒體的介質作用,它當然也可以從設計上,通過融入用戶和場景兩項因素彌補單純基于內容分析帶來的信息同質化問題,但是,算法的設計未考慮理想與現實之間的差距因素。
受用戶群體素養、不同領域用戶行為、人性原始欲望等因素影響,長久下來,平臺推薦的內容自然就會漸漸養成為是偏于大眾趣味的。馴化后的平臺帶來不了閱讀慣性之外的信息,無法增加技術的新鮮感,同時也“刻意”地流失了很多優質內容。優質內容的參與度低,算法的正向反饋會在無形中被削弱,而這也將極大地削弱內容創作者的動力和創新性。
當下,雖然各大平臺一直在通過資本運作等措施去阻止“個性化推薦”劍走偏鋒,但事實是,大眾文化的力量終還是把平臺的“棱角”抹平,成為了一個吸引新用戶和“懶人”的聚集地。
最后
在互聯網時代,碎片化信息無可避免成為了主流,在這樣的境況下形成有效的認知與思想體系不是一件簡單的事。AI算法也毋庸置疑,是當今各個平臺的主流技術手段,然而其弊端和優勢一樣,都在朝相反的方向撕扯平臺的核心價值和用戶。
內容型平臺最重要的作用不見得是信息的聚攏,更多的應該是引導,廣泛的、多維度的、有溫度有思想的內容引導。這顯然不是單純的算法一統天下能夠達成的,也不是加入人工干預就能周全的。
AI算法是天然趨勢,它懂用戶的前提是,尊重用戶。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
