game-theory-poker扑克游戏
这是根据 2005 年的 game-theoretic, heads-up limit Texas Hold'em poker player 理论编写的扑克游戏,大约有 6000 行 Java 代码。
操作理论
玩任何游戏的最佳策略都可以确保您至少达到该游戏的预期价值。在扑克中,假设没有佣金,则期望值为零,因此,如果您可以计算出最佳策略,则可以保证不会平均损失。
考虑剪刀石头布。该游戏的最佳策略是投掷rock
1 / 3、1 paper
/ 3和scissors
1/3的时间。如果您采用这种策略,那么无论对手采用哪种策略,都可以确保自己不会平均损失。(请注意,即使您的对手rock
每次掷球,您平均也会平局(而不输)。但是在其他游戏中,最佳策略可以主导某些对手的策略,而扑克就是其中之一。)
即使是两个玩家限制的扑克,也很难计算出最佳的扑克策略。但是我们可以为抽象版本的扑克计算出最佳策略,例如,在翻牌前的下注过程中,成对的ace与国王对使用相同的方式。
该代码根据在不同情况下不同手牌的强度来计算其构建的抽象扑克的最佳策略。
关于这种想法的更详细的描述在《面向全尺寸扑克的博弈论最佳策略》(Billings,2003)一书中给出。
评论