近年来,人工智能获得数次突破,在诸如国际象棋和围棋等游戏中战胜人类。不过,这些游戏的一个共同特点是,棋手可能有完全信息。但扑克不同,让这种游戏难得多的原因是每个玩家对可能的玩法有着不对称的信息。
近日,加拿大阿尔伯塔大学计算机系的Matej Morav ík研发了一个被称为DeepStack的AI系统,它在每3000次无限德州扑克比赛后,具有统计意义地打败了11名职业扑克选手中的10名(它也打败了第11名选手,但结果不具有统计学显著意义)。
研究人员表示,在游戏的每个时间点,DeepStack会重新计算游戏策略,而不是将可能玩法计算到,它对允许进行的玩法深度和类型做了限制。这将可能的决策点从超过10160个减少至大约107个(160和7是上标),DeepStack的电脑芯片能在5秒钟内完成决策。
这种AI系统将有助于解决涉及信息不对称的现实世界问题,例如捍卫战略资源和做出重要的医疗建议等。