AI攻陷多人德扑再登Science,训练成本150美元,每小时赢1000刀 | 机器之心

尽管在任何有限制游戏中都存在纳什均衡,但通常在具有三个或更多玩家的游戏中,难以有效地计算纳什均衡。(对于两人一般和游戏也是如此。)此外,在两个以上玩家的游戏中,即使作出精确的纳什均衡策略,也有可能输掉比赛。例如在游戏 Lemonade Stand game 中,每个玩家同时在一个圆环上选择一个点,并且想尽可能远离任何其他玩家。纳什均衡是所有参与者沿着环间隔相等的距离,但是有很多方法可以实现。如果每个玩家独立计算其中一个平衡点,则联合策略不太可能导致所有玩家沿着该环间隔开同等距离。如下图所示:

Source: AI攻陷多人德扑再登Science,训练成本150美元,每小时赢1000刀 | 机器之心