AI時代:匿名不等于隱私保護

鎂客 9年前 (2016-06-22)

蘋果在WWDC 2016的主題演講中,講到“差分隱私 (Differential Privacy)”這個密碼學專有名詞的時候,只有少數人意識到,蘋果又走在了時代前列。

蘋果獨辟蹊徑!“差分隱私”完爆匿名搜集數據

匿名電話、匿名信息、匿名用戶••••••“匿名”仿佛已經成為隱私安全的防護欄。

然而在AI時代,匿名真的能保護隱私安全嗎?來看看蘋果怎么說!

在 WWDC 2016 的主題演講中,當蘋果講到“差分隱私 (Differential Privacy)”這個密碼學專有名詞的時候,只有少數人意識到,蘋果又走在了時代前列。

但是大部分中外觀察者都認為,蘋果為人工智能時代所做的努力不夠,它依然是一家以硬件設備為核心的公司,對于為更大規模的用戶提供服務不感興趣(例如 iMessage 等軟件均沒有 Android 版),所以當人工智能技術得以真正嶄露頭角的時候,很可能難以追趕 Google、Facebook、亞馬遜和微軟。

從這個方面來說,蘋果確實不如Google、Facebook等行業巨頭,但是蘋果在解決人工智能時代的隱私保護難題上,又似乎比其他科技巨頭走得更遠。

在發展的需求方面,人工智能依賴于機器學習(深度學習)算法,而機器學習又需要大規模的訓練數據,所以向用戶搜集數據比以往更加重要。這也是搜集數據的原始意圖?;ヂ摼W時代,搜集數據主要以匿名為擋箭牌,但AI時代,匿名還可靠嗎?

匿名VS差分隱私

有句話說得好,“內行看門道,外行看熱鬧”?;ヂ摼W行業搜集信息的標準答案:一、收集用戶信息是必要的,這樣有助于改善產品或服務。二、我們是匿名收集用戶信息的,并不保存任何用戶的身份信息。有了這個擋箭牌,外行很容易被唬住,認為匿名就聯系不到用戶信息。

但是內行都應該清楚,匿名并不能完全保證用戶的隱私安全。最經典的案例莫過于,Netflix 曾放出“經過匿名處理的”上億條電影評分數據,“僅僅保留了每個用戶對電影的評分和評分的時間戳”,希望通過競賽的形式,找到更好的影片推薦算法。但是 2009年,德州大學的兩位研究人員,通過這些匿名數據與公開的IMDB數據做對比,成功將匿名數據與具體的用戶對應了起來。Netflix 不得不取消了,這項原計劃每年舉行的競賽。

這樣的匿名還有的玩?必將壽終正寢??!

這不,拯救AI時代隱私保護的高手出場,“差分隱私”通過蘋果高調亮相!其實差分隱私不是蘋果的首創,因為學者們已經就這個概念進行了多年的研究。但當蘋果將它隨著 iOS 10 一起發布后,差分隱私就將走進人們的視野里,幫助公司收集和分析不同來源的用戶數據。

這項密碼學前沿技術的基本原理,就是向包含個體信息的大量數據集里注入噪音(或者說擾動),通過算法來打亂個體用戶數據,讓任何人都不能憑此追蹤到具體的某一名用戶,但又可以允許機構成批分析數據以獲得大規模的整體趨勢。最終保證每個個體信息都無法泄露,同時這個數據集的統計學信息依然可以被外界分析。

這簡直甩了“匿名”好幾條街??!蘋果此舉,可謂是不鳴則已,一鳴驚人。

差分隱私的未來前景如何?

差分隱私并不是某一項單獨的技術,而是一種以避免在數據與特定個人之間建立聯系為前提的數據處理方案。它允許數據以聚合的形式被分析,但同時還要將干擾注入那些數據中,使得處理數據的過程中個人隱私不會被侵害。

但是強調安全性是有代價的,在加入這些干擾因素之后,獲取的信息就不會有那么清晰和準確了。在這個取舍之間,蘋果毫不讓人驚訝地選擇了注重隱私。很明顯,蘋果遵守了注重隱私的承諾,利用自己獨特的方式在AI大戰中首次告捷!

蘋果將成為第一個真正大規模使用這項“差分隱私 (Differential Privacy)”算法的公司。即便有些學者認為這項技術前景可期,還沒有成熟到大規模商用的時候。但差分隱私的引入仍將會為我們帶來更好的體驗,讓更多的人擺脫匿名的“欺騙”。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到