AI風暴再次來襲。6日開始,卡內基梅隆大學知名扑克機器人Libratus將化身“冷扑大師”,與中國“龍之隊”在海南展開為期5天、長達45小時的扑克人機大戰。主辦方在5日的賽前發布會上宣布,獲勝一方將獲得200萬元表演賽獎勵。
“冷扑大師”是卡內基梅隆大學開發的無限德州扑克人工智能系統。今年1月,它擊敗了人類頂尖玩家。在這次比賽中,每當這些玩家發出一個動作,它就會被傳送到卡內基梅隆大學的計算機服務器上。
中國“龍之隊”華人頂尖牌手由2016年世界扑克大賽金手鏈冠軍得主杜悅領軍。杜悅估計,雖然“冷扑大師”是目前扑克界最強的人工智能,但人類頂尖牌手仍有10%的勝率。
創新工場CEO暨人工智能工程院院長李開復之所以發起這場扑克人機對戰,和他1988年在母校卡內基梅隆大學開發“奧賽羅”的經歷息息相關,后者成為第一個擊敗黑白棋世界冠軍的人機對弈系統。
“德州扑克是創投圈人士愛玩的一項活動,AI更是創投圈近年來關注的重點,這次活動對AI的宣傳和推動將起到重要作用。”賽事協辦方春光裡運營總監董冬則告訴科技日報記者。“我當然希望人類能贏,但‘冷扑大師’畢竟曾打敗過美國頂尖的德扑選手。”董冬說。
人工智能專家一直將這些游戲作為開發和測試的工具,在此之前,計算機已經在國際象棋、西洋雙陸棋中擊敗了人類,去年的AlphaGo更是名聲大噪。“扑克則有些不同,因為你不知道你的對手拿的是什麼牌。”作為德州扑克愛好者,董冬分析。
談到與圍棋比賽、AlphaGo的不同,李開復表示,德州扑克更接近人性,因為信息是有隱藏的,牌手可以誠實或欺騙地表達。這些種種的推敲,更像是人與人之間的商業、外交博弈,“冷扑大師”的技術都與這些因素相關。
通過對手的動作表情判斷對手牌的強弱,是德州扑克相當重要的一種游戲技巧,而“冷扑大師”作為一個冷冰冰的人工智能系統,如何應對人類棋手復雜的心理戰呢?
對此,李開復表示,對於“冷扑大師”來說,心理戰其實是基於一個優化結果最大化的一個計算,它計算該怎樣去做才能得到最多的積分牌。他說,扑克機器人的研發基於博弈論,並且結合了大量的數學和概率理論,扑克程序在賽前不曾研擬歷史牌譜,直接在比賽同時動態優化勝率最高的數學模型,利用戰略推理揭露玩家底牌的隱藏信息,從而建構出智能化的AI談判策略套路。在技術研發的背后,其實電腦並不對人類玩家的心理戰術進行任何模擬或分析,反倒以博弈論加上大量數學打敗了頂尖牌手。
卡內基梅隆大學計算機學院院長安得烈·穆爾教授則認為,“冷扑大師”表面呈現的是扑克,背后實際是一個大型的談判算法。扑克AI並沒有用到神經網絡和機器學習這兩種技術,而是用了比較古典的線性規劃。
李開復認為,現今這套人工智能扑克程序背后的模型,將適用於需要用到戰略推理和多方談判的場景。從企業談判、商務談判、外交談判、甚至到生活方面的房屋買賣談判,10年內都將會部分或全面被人工智能所取代。(記者 操秀英)