【深度解析】谷歌搜索算法如何排名醫療廣告?

鎂客 9年前 (2016-05-03)

提到搜索引擎,必須想到谷歌,那么谷歌是如何處理醫療廣告的呢,答案是使用機器學習的RankBrain算法。

青年魏則西的不幸病逝,激起了國內公眾對搜索引擎虛假醫療網絡廣告問題的熱議。根據《商業價值》微信公眾號今日文章《谷歌也曾涉足醫療廣告,美國司法是如何監管的呢?》,可以發現在谷歌搜索“滑膜肉瘤”也會出醫療廣告,但都有明顯的“Ad”標識。同時,與百度相比,谷歌的付費廣告并不影響排名。

【深度解析】谷歌搜索算法如何排名醫療廣告?

谷歌關于滑膜肉瘤治療的搜索廣告,有明確的廣告標志。來源:商業價值

此外,《商業價值》文中提到,根據谷歌的搜索廣告政策,要投放藥品廣告需要獲得 FDA 以及美國藥房理事會(NABP)認證。也就是說,只有獲得政府審批的正規網上藥店、藥品與治療才能在網站投放藥品類廣告。同時,谷歌的自動廣告過濾機制,在很大程度上也能有效杜絕虛假醫療廣告出現。根據谷歌發布的報告,他們 2015 年總計預先屏蔽了 7.8 億條違規廣告,封殺 21.4 萬家廣告商,其中包括 1250 萬條違規的醫療和藥品廣告,涉及藥品未獲批準或者虛假誤導性宣傳等原因。

谷歌如何用算法排名

據統計,每天向 Google 提交的查詢中有約 15% 是其未曾見過的。公司的資深研究科學家 Greg Corrado 透露,為了更好回答這些問題,Google 利用了 RankBrain 來將海量的書面語嵌入到計算機可以理解的向量里面。

如果 RankBrain 看到自己不熟悉的單詞或短語,它會去猜測其類似的意思并對結果進行相應過濾,從而有效地處理一些從未見過的搜索查詢。比方說 RankBrain 能夠有效回答 “What’ s the title of the consumer at the highest level of a food chain?(食物鏈當中最高級的消費者的頭銜叫做什么?)” 這樣的問題。

對于 Google 的搜索處理機制來說,RankBrain 只是為其搜索算法提供輸入的數百個信號之一,但這種信號跟別的信號的不同之處在于它懂得學習,而別的只是別人在信息獲取中的發現和洞察。Google 內部曾讓做算法的工程師人工去猜測搜索算法會選擇哪個頁面作為排名第一的結果,其準確率為 70%,然后 RankBrain 去做了同樣的事情,準確率達到了 80%,超過了做算法的工程師的平均水平。

隨著時間的推移,RankBrain 可能能夠處理越來越多的當前通過手寫代碼分析來改善 Google 算法的各種各樣的信號。Google 的各項業務也會發展地越來越智能。機器學習將會以各種有意義的方式整合進 Google 的搜索引擎中。Google 這所有的舉動將會繼續保持其搜索引擎的領頭地位。

RankBrain 運行原理解析

RankBrain 是 Google 蜂鳥搜索算法的一部分。蜂鳥是整個搜索算法,就好比車里面有個引擎。引擎本身可能由許多部分組成,比如濾油器、燃油泵、散熱器等。同理,蜂鳥也由多個部分組成,RankBrain就是其中一個組成部分。

蜂鳥同時包含其他的部分,這些名字對 SEO圈的人來說已經耳熟能詳了,比如 Panda、 Penguin 和 Payday 用于垃圾郵件過濾, Pigeon 用于優化本地結果, Top Heavy 用于給廣告太多的頁面降級,Mobile Friendly 用于給移動友好型頁面加分,Pirate 用于打擊版權侵犯。

Google 用于排序的“信號”是什么?

Google 使用信號來決定如何為網頁排序。比如,它會讀取網頁上的詞語,那么詞語就是一個信號。如果某些詞語是粗體,那么這又是一個值得注意的信號。計算的結果作為PageRank的一部分,給一個網頁設定一個PageRank分數,這作為一個信號。如果一張網頁被檢測到是移動友好型的,那么這又會成為一個信號。所有的這些信號都由蜂鳥算法中的各個部分處理,最后決定針對不同搜索返回哪些網頁。

一共有多少種信號?

Google 稱進行評估的主要排序信號大約有 200多種,反過來, 可能有上萬種變種信號或者子信號。如果你想有一個更直觀的排序信號向導,來看看 Google SEO成功因素元素周期表:

【深度解析】谷歌搜索算法如何排名醫療廣告?

RankBrain到底做什么?

從與 Google 的來往電子郵件之中,RankBrain 主要用于翻譯人們可能不清楚該輸入什么確切詞語的搜索詞條。

Google 很早就找到不根據具體詞條搜索頁面的方式。比如,許多年前,如果你輸入“鞋”(shoe), Google 可能不會找到那些有“鞋”(shoes)的頁面,因為從技術上來說這是兩個不同的詞匯,但是“stemming”使得 Google 變得更聰明,讓引擎了解shoes的詞根是shoe,就像“running”的詞根是“run”。 Google 同樣了解同義詞,因此,如果你搜索“運動鞋”,它可能知道你想找“跑鞋”。它甚至有概念性的知識,知道哪些網頁是關于“蘋果”公司,哪些是關于水果“蘋果”的。

參考資料:

http://mp.weixin.qq.com/s?__biz=MTA2MTMwNjYwMQ==&mid=2650693625&idx=1&sn=8ab532faa66e69cc447e250f58807dda&scene=1&srcid=0502LFwayyLBIMhASaZX4zrt#rd

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到