那個唯一贏過AlphaGo的棋手,今天退役了

伶軒 6年前 (2019-11-20)

在技術的不斷突破極限的同時,研發者們的工作重心也開始向商用轉移。

李世石宣布退役了,就此結束了在韓國棋院共計24年零7個月的職業圍棋生涯,而他也是迄今為止唯一戰勝過AlphaGo的棋手。

那個唯一贏過AlphaGo的棋手,今天退役了

“神之一手”,5番大戰的一次勝利,是人類棋手的“唯一”

2016年3月的那場“人機大戰”,各中精彩至今仍歷歷在目,而這場比賽也成就了李世石職業生涯最輝煌一戰——5番大戰,李世石在第4局下出“神之一手”,取得人類棋手對陣AlphaGo正式比賽中的唯一一局勝利。

如果要用一個詞形容這場比賽,“盛況空前”再合適不過了,因為這場比賽在正式開始之前,就已獲得了全球范圍內的關注。而當時有關這場比賽最終勝負爭論的爭論,遠勝于曾經的“深藍”。

那個唯一贏過AlphaGo的棋手,今天退役了

實際上早在1997年,IBM就曾憑借“深藍”擊敗了等級分排名世界第一的棋手加里·卡斯帕羅夫,讓很多業內人士認識到了機器的強大。

可能正是因為有了這支“預防針”,面對AlphaGo大多數人不再自信和篤定認為“人腦無敵”,反而更加期待機器的表現。而當時已是世界冠軍、圍棋九段的李世石能夠接受邀約,不僅令人詫異也更加讓人期待,這場比賽也因此獲得了全球范圍內極高的關注,更將人工智能和深度學習徹底地推到了大眾面前。

作為谷歌全力打造的人工智能程序,AlphaGo所依賴的是兩個不同神經網絡“大腦”——監督學習的策略網絡和價值網絡合作進行下棋的,它們均由多層神經網絡構成,通過多層啟發式二維過濾器處理圍棋棋盤的定位,并通過十幾個完全連接的神經網絡層進行信息分類和邏輯推理,產生局面判斷。

而相較于“深藍”觸及的國際象棋領域,圍棋的復雜程度遠超想象。在共計361格的圍棋棋盤中,黑白棋子隨著戰局的不斷推進越來越多,這也就意味著每多一顆棋子未知的可能就會有指數倍的增加,變化是無止盡的。甚至有人夸張的認為,圍棋的復雜度數量遠超于宇宙原子數量。

實際上在李世石之前,AlphaGo也曾與人類棋手對弈過。2015年10月,AlphaGo和當時連任2013-2015年歐洲圍棋冠軍的樊麾進行了5局無讓子比賽,獲得了“滿堂紅”。

在此之后,谷歌邀請樊麾加入了AlphaGo的研發工作中,這也是為什么在AlphaGO和李世石的比賽中,樊麾是總裁判長的主要原因。也正是因為有了專業棋手的加入,才讓AlphaGo有了后面的“快速進化”。

AlphaGo持續進化,Master、Zero相繼登場

作為“教練”,在AlphaGO和李世石比賽之后,樊麾幾乎每個月都會分出一半的時間飛往DeepMind總部與AlphaGo對弈,檢驗它的最新學習成果。到2016年7 月,AlphaGo出現在了世界圍棋排名網站Go Ratings排名首位,總積分超越柯潔,成為了第一個登上圍棋領域世界榜首的AI。

而就在很多人認為AlphaGo熱度正在慢慢減退之時,2016年12月29日到2017年1月4日,短短5天時間,棋手“Master”在網絡圍棋平臺橫掃眾多圍棋名將,在快棋對決中多次擊敗了包括聶衛平、柯潔、樸廷桓、井山裕太在內的數十位中日韓圍棋高手,創下了60局全勝的戰績。

就在大家對“Master”身份一籌莫展的時候,對戰最后一天它的“馬甲”終于掉了,谷歌自爆神秘賬號“Master”就是AlphaGo的最新版本。當時聶衛平給它的評價是,“Master技術全面,從來不犯錯,這一點是它最大的優勢。”

2017年5月,在“萬眾期待”下人類排名第一的棋手柯潔與AlphaGo正式展開了對決。只是面對進化了的AlphaGo,柯潔三局皆敗,然而這一切都并未結束。

那個唯一贏過AlphaGo的棋手,今天退役了

僅僅5個月后,Deepmind就重磅發布了“0基礎學習”的AlphaGo Zero,即“在沒有任何人類圍棋對弈數據的情況下,直接通過自我純強化學習”。更值得一提的是,AlphaGo Zero只自我訓練了3天,就以100:0的戰績擊敗曾經的AlphaGo。

面對這樣的強者,柯潔能表達的就只有這個了:

那個唯一贏過AlphaGo的棋手,今天退役了

但實際上,圍棋已經“圍不住”AI和深度學習技術的發展了。

人機大戰領域擴散,商用落地正在進行時

可以看到,在AlphaGo于圍棋領域一戰成名后,德撲、游戲甚至是“國粹”麻將,都被AI攻克了,如DeepStack成為首個在一對一無限注德撲中戰勝人類玩家的人工智能、AlphaStar稱霸星際爭霸2、Suphx成為國際知名的專業麻將平臺“天鳳”第一個榮升十段的AI系統等,這也讓越來越多的人認識到深度學習前景的可觀性。

IDC今年下半年發布的《中國深度學習平臺市場份額調研》的報告顯示,在AI技術使用方面,接受調研的企業和開發者中,86.2%選擇使用開源深度學習框架,在AI不斷走向產業化的過程中,深度學習平臺已經成為企業和開發者應用AI技術必備的助攻武器。而在技術的不斷突破極限的同時,研發者們的工作重心也開始向商用轉移。

以AlphaGo為例,DeepMind CEO哈薩比斯就曾在被問及未來發展方向時表示,“AlphaGo是人工智能,會自己學習,是可以‘移植’的,所以我們已經開始將它和醫療、機器人等進行結合了。”

當前,除谷歌Facebook、百度、亞馬遜、阿里、騰訊等頭部廠商之外,包括科大訊飛、商湯、曠視、思必馳、地平線等創企均有深度學習相關產品推出,并在醫療、芯片、自動駕駛、機器人、計算機視覺、語音識別等領域落地商用??梢灶A見,未來有關深度學習的市場規模將快速擴展。

關于李世石

李世石,1983年生,韓國著名圍棋棋手,世界頂級圍棋棋手。

1995年入段,1998年二段,1999年三段,2003年因獲LG杯冠軍直接升為六段,2003年4月獲得韓國最大棋戰KT杯亞軍,升為七段,2003年7月獲第16屆富士通杯冠軍后直接升為九段,2006、2007、2008獲韓國圍棋大獎最優秀棋手大獎(MVP)。

李世石屬于典型的力戰型棋風,善于敏銳地抓住對手的弱處主動出擊,以強大的力量擊垮對手,他的攻擊可以用“穩,準,狠”來形容,經常能在劣勢下完成逆轉。

最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!

鎂客網


科技 | 人文 | 行業

微信ID:im2maker
長按識別二維碼關注

硬科技產業媒體

關注技術驅動創新

分享到