扑克牌是是AI首次在超过两个人的游戏中击败人类玩家

电子说

1.2w人已加入

描述

还记得AlphaGo在围棋上战胜人类那时候的轰动吗?现在一个名叫Pluribus的AI,在和世界扑克牌冠军对战的时候,完胜了人类。

也许你会认为AI能战胜人类在今天已经是司空见惯的事了。但这次具有突破性的是,这场对战不再是一对一,对手是15名人类顶尖扑克玩家。这也是AI首次在超过两个人的游戏中击败人类玩家。

这次的德州扑克比赛为期12天,比赛扑克牌有超过10,000,以六人无限制玩法,Pluribus和15名顶尖玩家以两种模式开展比赛。

▲Pluribus和五名职业扑克玩家对抗

第一种模式是1个Pluribus和5个人类玩家组赛,第二种模式是1个人类玩家和 5个Pluribus 组赛(每个Pluribus独立并没有相互配合)。第二种模式参赛的是2名作为扑克的传奇人物——Darren Elia和Chris Ferguson,后者曾获得6次世界冠军。

比赛的结果是,Pluribus全盘获胜。

假如它是人类玩家,按一个筹码值1美元,便能以每小时1,000美元的惊人速度不断赢钱。

Pluribus由Facebook的人工智能团队和卡内基梅隆大学计算机科学系人员共同研发,早在两年前他们已经研发出了Libratus的扑克游戏系统,一直都是德州扑克的单挑赛中的世界赢家。

在和单个人类比赛中,博弈论能为AI提供最佳策略, 因此 AI 可以完全掌控通往胜利的“特定路线”,通过预测每次游戏结束的结果,从而为下一步的行为作决定。

但这对于涉及多方利益且没有明确条件的多人游戏场景并不适用。

由于Libratus难以确定所有玩家手里有什么牌,也不能了解对手的内心想法,从而无法捉摸对手是试探或是虚张声势,不能准确预知他们的每一个投注决定,因此游戏可以说是呈指数级地复杂化。

研究人员在Libratus的基础上构建了Pluribus,它的不同之处在于新使用了一种称为搜索功能的机制,能够对接下来的未知行为进行展望,而不是在预测最终结果后反推。

在同时应对其余几名玩家的复杂性之下,这种短期的敏锐性恰恰是最大的优势。

从Libratus到Pluribus的进步,可以发现AI随着进步,能够使用更少的资源和更低的成本去制造。

比起动辄十万美元的先进系统,Pluribus短短8天内创建,在云服务器上培训也只用了不到150美元的费用。如今的Pluribus只用两个CPU就能运行,而2016年的AlphaGo系统需要使用1,920个CPU才赢得游戏,而且Pluribus占用内存不到 128 GB,平均只需20秒就能下决定,速度是职业扑克玩家的两倍。

这次的成果也是展现了AI研究的巨大进展。由于扑克游戏隐藏了信息和运气元素,与人对弈时,它不能只是计算人类行为,而是要超越人类的行为。目前证明Pluribus已经可以对抗多个该领域内的顶尖人类,研究人员表示,客观上来说,AI已经被证明可以称为“超人”了。

对于后续的发展,联合开发者Noam Brown认为Pluribus已经到达了扑克游戏的极限,完成了最后一个挑战。接下来,这个技术将在更多场景被用到。例如网络安全、欺诈检测、金融谈判等等,甚至还可以帮自动驾驶汽车导航交通。

毕竟AI能在多人场景中使用,还能处理隐藏信息的能力,才更符合现实生活中的挑战。扑克游戏只是提供了一个现实世界的模型。

不过它的算法代码就不会公开了,毕竟一旦公开,可能会毁掉所有扑克牌的世界了。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分