風暴再次來襲,人機撲克大戰,人類勝算只有10%?

-AI風暴再次來襲。6日開始,卡內基梅隆大學知名撲克機器人Libratus將化身「冷撲大師」,與「龍之隊」在海南展開為期5天、長達45小時的人機撲克大戰。主辦方在5日的賽前發布會上宣布,獲勝一方將獲得200萬元表演賽獎勵。




先介紹下參賽選手。「冷撲大師」是卡內基梅隆大學開發的無限德州撲克人工智慧系統。今年1月,它擊敗了人類頂尖玩家。在這次比賽中,每當這些玩家發出一個動作,它就會被傳送到卡內基梅隆大學的計算機伺服器上。Libratus則一次發出8個動作——每個對手應對兩個。最終,當20天的比賽結束時,人類已經損失了180萬美元。


「龍之隊」華人頂尖牌手由2016年世界撲克大賽金手鏈冠軍得主杜悅領軍。杜悅估計,雖然「冷撲大師」是目前撲克界最強的人工智慧,但人類頂尖牌手仍有10%的勝率。


創新工場CEO暨人工智慧工程院院長李開復之所以發起這場人機撲克對戰,和他1988年在母校卡內基梅隆大學開發「奧賽羅」,成為第一個擊敗黑白棋世界冠軍的人機對弈系統背景息息相關。





「德州撲克是創投圈人士愛玩的一項活動,AI更是創投圈近年來關注的重點,這次活動對AI的宣傳和推動將起到重要作用。」賽事協辦方春光里運營總監董冬告訴科技日報記者。


「我當然希望人類能贏,但『冷撲大師』畢竟曾打敗過美國頂尖的德撲選手。」董冬說。



人工智慧專家一直將這些遊戲作為開發和測試的工具,在此之前,計算機已經在國際象棋、跳棋、西洋雙陸棋和圍棋中擊敗了人類,去年的AlphaGo更是名聲大噪。「撲克則有些不同,因為你不知道你的對手拿的是什麼牌。」作為德州撲克愛好者,董冬分析。


這種所謂的不完美信息類遊戲需要人類的智能,比如欺騙對手和體察到對手在欺騙自己,而這是計算機所缺乏的。談到與圍棋比賽、AlphaGo的不同,李開復表示,德州撲克更接近人性,因為信息是有隱藏的,牌手可以誠實或欺騙地表達。這些種種的推敲,更像是人與人之間的商業、外交博弈,「冷撲大師」的技術都與這些因素相關。


心理戰是德州撲克相當重要的一部分,通過對手的動作表情判斷對手牌的強弱,是德州撲克相當重要的一種遊戲技巧,而「冷撲大師」作為一個冷冰冰的人工智慧系統,是如何應對人類棋手複雜的心理戰呢?

對此,李開復表示,對於「冷撲大師」來說,心理戰其實是基於一個優化結果最大化的一個計算,它是去計算該怎樣去做才能得到最多的積分牌。他說,撲克機器人的研發基於博弈論,並且結合了大量的數學和概率,撲克程序在賽前不曾研擬歷史牌譜,直接在比賽同時動態優化勝率最高的數學模型,利用戰略推理揭露玩家底牌的隱藏信息,從而建構出智能化的AI談判策略套路。在技術研發的背後,其實電腦並不對人類玩家的心理戰術進行任何模擬或分析,反倒以博弈論加上大量數學打敗了頂尖牌手。




卡內基梅隆大學計算機學院院長安得烈·穆爾教授則認為,「冷撲大師」表面呈現是撲克,背後實際是一個大型的談判演算法。撲克AI並沒有用到神經網路和機器學習這兩種技術,而是用了比較古典的線性規劃。背後沒有心理戰的機制,完全是大量運算。所以撲克中的虛張聲勢,實際演算法里並不是讓機器學習唬人的招數,而且是算出最優化的唬人次數來提高勝率,歸根結底還是數學。


李開復認為,現今這套人工智慧撲克程序背後的模型,將適用於需要用到戰略推理和多方談判的場景。從企業談判、商務談判、外交談判、甚至到生活面的房屋買賣談判,10年內都將會部分或全面被人工智慧所取代。


董冬還透露,4月10日賽事最後一天晚間,來自科技圈、投資圈、媒體圈等共36位名人嘉賓將參與別開生面的 「冷撲大師名人體驗賽」。
首頁
娛樂城
遊戲規則
遊戲技巧