人工智能赢得德州扑克“人机大战” “非完整信息博弈”取胜意义重大

【博闻社】当地时间1月30日,在美国宾夕法尼亚州匹兹堡的Rivers赌场,美国卡耐基梅隆大学开发的人工智能Libratus与4名人类顶尖德州扑克选手之间的“人机大战”结束,人工智能取得胜利。这是人工智能在各种棋牌游戏中对人类取得的又一个胜利。

这场“人机大战”在匹兹堡一家赌场中进行,从1月11日持续到30日,人工智能与4名人类选手共玩了12万手一对一不限注的德州扑克。据当地媒体报道,到比赛结束时,人工智能领先人类选手共约177万美元的筹码。在4名人类顶尖选手中,输得最少的一位也落后人工智能约8.6万美元的筹码。

在2015年举行的一次德州扑克“人机大战”中,卡耐基梅隆大学开发的一个较早版本的人工智能Claudico输给了人类选手。不过卡耐基梅隆大学认为,当时扑克职业玩家与Claudico仅进行了8万手牌的比赛,就统计学角度来讲并无法证明人类职业扑克玩家或人工智能具有优势。这也是本轮巡回赛中比赛的牌局数量增加50%的原因。

今年早些时候,加拿大阿尔伯塔大学和捷克两所高校的研究人员说,他们研发的人工智能DeepStack首次在一对一无限注德州扑克中击败人类职业扑克玩家。但Libratus主要研究人员、卡耐基梅隆大学教授桑德霍尔姆在接受媒体采访时认为,DeepStack并未与最顶尖的人类选手比赛。

德州扑克的玩法:每个玩家有2张牌作为“底牌”,同时还有5张公共牌。玩家用自己的2张底牌和5张公共牌结合在一起,选出5张牌,不论手中的牌使用几张(甚至可以不用手中的底牌),凑成最大的成牌,跟其他玩家比大小。按照“Card Ranking”决定最后的胜者。

近年来,人工智能发展迅猛,在国际象棋、中国象棋、围棋等游戏中击败人类顶尖选手。与棋类游戏中对战方可以看见所有棋子不同的是,德州扑克玩家手中的底牌是其他玩家看不到的,这种游戏属于不完整信息博弈,要求更复杂的推理能力,对人工智能也更有挑战性。Libratus此次战胜顶级人类德州扑克选手,具有非常重要的意义。

研究人员表示,如果让“阿尔法围棋”来进行德州扑克比赛,系统可能不会用虚张声势的策略来迷惑对手,而Libratus与“阿尔法围棋”的算法不同,能通过平衡风险与收益来决定出牌策略。能够在这种不完整信息博弈中战胜人类,这种人工智能也许能被用于商业等领域,例如在双方进行价格谈判时,一方借助这种人工智能也许可以获得更多的利益。

新华社/雷锋网

Add a Comment

發佈留言必須填寫的電子郵件地址不會公開。