繼人工智能攻陷圍棋,德州撲克也淪陷了
相對于圍棋,德州撲克的非完美信息給了人工智能更大的壓力。
繼AlphaGo披著“Master”在中韓圍棋界大獲全勝后,德州撲克也不幸淪陷,只不過這次的主角并不是AlphaGo。
近日,來自加拿大Alberta大學、捷克Charles大學、布拉格捷克理工大學的10位研究員在arXiv網站(一個收集物理學、數學、計算機科學與生物學論文預印本的網站)上傳了一篇題為《DeepStack:無限注德撲的專業級人工智能玩家》的論文,介紹了一種能在一對一無限注德州撲克中擊敗人類玩家的新算法“DeepStack”。
在圍棋等棋類游戲中,玩家能夠獲得的確定性信息是對稱的,而德州撲克不同,這是一種包含了欺騙、推測的非完美信息游戲。在德州撲克的游戲中,玩家只能掌握自己手上的牌,通過推理非對稱的信息,從而與對手進行博弈。而這里就是該論文的意義所在,論文中提到“DeepStack是一種通用算法,可用于一大類非完整信息的序列博弈 ”。
不同于過去研究人員所采用的一種壓縮型的策略,這個加拿大和捷克的合作團隊在開發新算法“DeepStack”過程中更注重培養人工智能出牌時的“直覺”。在運用深度學習,反復自我博弈之后,“DeepStack”學會了在每一個具體情境出現時進行推理,這種做法非常接近于人類玩家的習慣。
去年年末,該團隊邀請了33名專業撲克選手與“DeepStack”進行了44852次博弈。在最后的結果中,DeepStack成為了首個在一對一無限注德撲中戰勝人類玩家的人工智能,并且平均勝率達到了492mbb/g(milli-big-blinds per game,用于衡量撲克玩家表現的指數,一般職業玩家認為50mbb/g是個門檻,750mbb/g就是對手每局都棄牌的贏率)。
最后,記得關注微信公眾號:鎂客網(im2maker),更多干貨在等你!
硬科技產業媒體
關注技術驅動創新
