慧安金科黃鈴:減少對標注數據的依賴,做規避用戶隱私的AI風控
慧安金科主要通過自主研發的半監督主動式機器學習技術來構建金融風控方面的預測模型和決策引擎。
洗錢、金融欺詐、各種黑產……
移動互聯網帶來諸多便利的同時,也是懸在我們頭上的達摩克利斯劍,稍有不慎,便會跌入圈套損失慘重。
“金融領域新的應用場景和產品不斷涌現,隨之而來的各種風險、欺詐行為也是層出不窮。”這些促成了慧安金科的創始人黃鈴回國投身于AI風控事業。
確實,在越來越頻繁的金融欺詐行為下,智能風控是趨勢,也是必然,借助AI技術的特性,它能做到及時預警、將損失最小化。
國內有AI技術的極佳落地場景
2017年,國內的創業氛圍都彌漫著AI的味道,彼時還在國外從事大數據、計算機安全工作的黃鈴,也看到了國內發展智能風控的機會。
“當時很多國內用的方法,在面對這些新型的應用場景時存在不足,我們的機會還是很大。”
作為AI領域的創業者,黃鈴的個人履歷可以說非常亮眼,這也是諸多AI明星創企的標配。黃鈴是美國加州大學伯克利分校的計算機科學博士,師從Anthony Joseph和Michael Jordan,一直從事機器學習算法研究以及計算機網絡建模應用,在英特爾研究院擔任過資深科學家……所以,他極為擅長借助AI技術解決網絡、數據和業務安全問題,這也是慧安金科專注于智能風控的原因。
圖 | 慧安金科創始人黃鈴
“我們希望把在硅谷、加州伯克利研究積累的技術,應用在國內的風控場景下。”黃鈴表示。
正好當時國內移動支付之類的線上金融產品面臨著風控上的巨大挑戰,天時地利人和下,黃鈴果斷與另外兩位伯克利的同窗,成立了主打金融風控的慧安金科。
黃鈴強調,回國創業最關鍵的不是把國外現成的模式拷貝到國內,“我們更重要的是創新,國外有很好的技術,但是在國內有更好的應用和落地場景。”
一方面是國外積累多年的機器學習研究,一方面是國內移動互聯網發展下不斷涌現出的金融領域新場景、新應用,黃鈴領導下的慧安金科發展迅猛。
成立一年后,他們就完成了由創新工場領投,高瓴資本、丹華資本、長風智清等投資機構跟投的1億元A輪融資。
高額融資背后也是對他們技術特性的肯定,目前,慧安金科主要通過自主研發的半監督主動式機器學習技術來構建金融風控方面的預測模型和決策引擎。
減少數據標注的需求,用技術說話
正所謂道高一尺魔高一丈,傳統的風控方式已經無法對抗現在全球范圍內的團伙作戰、狡猾多變的風險行為。
黃鈴舉了個例子,“以前你需要大量的人工,以及歷史風險樣本來訓練模型,積累黑白名單生成風控的規則系統,這種方法面對新的風險威脅和攻擊,防范起來非常吃力。”
他進一步指出,如果我們采用黑白名單、IP信譽庫、規則系統這些方法,會涉及到大量數據的收集,也必然會關乎個人隱私問題。所以,慧安金科采用了半監督主動式機器學習技術,在盡可能少的數據標注下,融合圖關聯分析、用戶行為建模等方法,準確快速地判斷交易行為和賬戶可能存在的風險,進行預警和控制。
所謂的半監督學習,也就是讓學習器不依賴外界交互、自動地利用未標記樣本來提升學習性能,它的關鍵就在于利用少量的標注樣本和大量的未標注樣本進行數據模型的訓練。
同時,由于風控反欺詐領域里每個標注過的案例都意味著血淋淋的代價,所以從這個角度看,AI風控也應該用盡量少的歷史案例訓練出合適的機器學習模型。
“用標注很少的數據進行建模,就得對海量未標注的數據進行交叉分析查詢、異常檢測,相應的計算復雜度會比有監督機器學習高的多,從而對算力提出更高的要求。所以我們需要設計很好的算法,既能夠利用沒有標注數據的特性,又能夠降低處理這些數據的計算量。”這也是慧安金科獨特在算法上的獨特優勢。
AI公司更要接地氣
黃鈴對公司的定位非常清晰明確,他強調AI只是一種技術手段,一個公司賴以生存的根本還是要“接地氣”,即用技術解決客戶的實際業務問題,這樣才能體現技術的價值。
目前,慧安金科的業務也非常聚焦,主要集中在金融風控場景,包括交易反欺詐、反洗錢、營銷風控和操作風險識別等等,他們也和不少股份制銀行、電商平臺達成了深度合作。
“在這些場景里我們有自己核心的產品和平臺,既能兼顧客戶的需求,也會在解決方案的基礎上做一些定制。”黃鈴認為,智能風控的核心就是讓數據說話,但是我們也急需好的制度去規范管理這些數據。
而且金融領域最為敏感的便是個人的數據隱私安全,智能風控系統做到“監守不自盜”尤為重要,這也是黃鈴再而三強調的,不涉及個人數據隱私的情況下去建立好的風控模型,通過算法提高對抗狡猾多變的欺詐行為的能力。
所以,慧安金科的目標是在不完全依賴歷史數據情況下,或者存在數據孤島的情況下,依然能夠建立出非常準確的風控模型。
“我們一直朝這個方向努力,現在用的模型會更關注用戶的行為數據,你不需要知道這個人是誰、他的電話等等信息,我們是根據他一系列行為去建模,而不是根據本人的身份來判斷風險。”
黃鈴之前在采訪中曾舉過一個例子,用戶填寫賬號或者輸入密碼時的速度、填寫的順序、手指按下的力度等行為數據,都可以作為“數據原料”,通過對這些數據進行特征的衍生處理和關聯分析,可以檢測出不同緯度上的異常。
從鎂客網和黃鈴的采訪中可以明顯感受到,這是一家強技術驅動的公司,真正做到用人工智能技術解決傳統方法無能為力的問題。不過,當前智能風控到底能規避多少可能存在的風險行為,還是亟待更為先進的技術去推動。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
