无偏博弈 (Impartial Game) 是一类满足以下性质的回合制二人游戏:

  • 无偏性:玩家可用的决策仅受当前局势,而不受玩家身份限制
  • 有限性:在有限次行动后游戏必将以非平局终止
  • 非随机性:对于目前局势的任意行动,下一局势都唯一确定
  • 信息完全性:所有玩家都时刻知晓当前局势的所有信息

无偏博弈的无偏 (Impartial) 并不是指游戏机制的公平 (Fair),而是指可用决策与玩家身份无关。例如,五子棋等机制公平的棋类游戏不是无偏博弈,因为落白子仅限白方,落黑子仅限黑方;Nim 游戏等机制不公平的游戏却是无偏博弈,因为双方取石子的规则完全相同。

无偏博弈一定是机制不公平的,即在某一方按某种方式决策时,其一定可以获胜,另一方一定失败,游戏的结果在游戏开始前就已由孰先手孰后手决定了。策梅洛定理指出该性质不只适用于无偏博弈,而适用于所有具有有限性、非随机性、信息完全性的二人回合制游戏。对于无偏博弈,我们最常研究哪一方有必胜策略。

必胜和必败局势

我们定义,在无偏博弈中,先手有必胜策略的局势为必胜局势;先手没有必胜策略的局势 (此时后手一定有必胜策略) 为必败局势;对于某个局势,其后继局势为当前局势下某个玩家单次行动后能得到的所有局势。

显然,一个局势为必胜局势,当且仅当其后继局势中的某一个为必败局势,或其本身为游戏规定的必胜局势;一个局势为必败局势,当且仅当其后继局势均为必胜局势,或其本身为游戏规定的必败局势。这种递归的定义使得游戏中所有无后继局势的局势都必须被事先规定为必胜或必败局势。

我们研究无偏博弈中先后手玩家谁有必胜策略,其实就是研究其初始时的局势是必胜局势还是必败局势。

最基本的无偏博弈

尼姆游戏是最基本的无偏博弈。一个尼姆游戏包含 $n$ 个含有特定数量道具的堆,玩家轮流选取一个堆,从中取走至少一个道具;最终无道具可取的玩家负。尼姆游戏中含有特定数量道具的堆称作尼姆堆。

结论指出,含有 $n$ 个尼姆堆 $\left\{a_1, a_2, \ldots, a_n\right\}$ 的尼姆游戏结果与单个含 $\bigoplus\limits_{1\le i \le n}a_i$ 个道具的尼姆堆组成的游戏相同。

由于在单个含 $0$ 个道具的尼姆堆组成的游戏中后手有必胜策略,单个含非零个道具的尼姆堆组成的游戏中先手有必胜策略,结合上述结论,则某个尼姆游戏 $\left\{a_1, a_2, \ldots, a_n\right\}$ 为先手必胜,当且仅当 $\bigoplus\limits_{1\le i \le n}a_i \neq 0$。

这个结论是易证的。我们只需用以下四点说明:

  1. 必败局势 $\{0, 0, \ldots, 0\}$ 属于 $\bigoplus\limits_{1\le i \le n}a_i = 0$ 的形式。
  2. 总是不存在将 $\bigoplus\limits_{1\le i \le n}a_i = 0$ 保持为 $\bigoplus\limits_{1\le i \le n}a_i = 0$ 的行动。
  3. 总是存在一种将 $\bigoplus\limits_{1\le i \le n}a_i \neq 0$ 转为 $\bigoplus\limits_{1\le i \le n}a_i = 0$ 的行动。
  4. 经过有限次行动,游戏将以非平局结束。

Sprague–Grundy 定理

Sprague–Grundy 定理又称斯普莱格–格隆第定理或 SG 定理,其指出任何无偏博弈都可以按如下规则等效为单个尼姆堆的尼姆游戏:

定义关于游戏状态 $X$ 的函数 $\operatorname{SG}(X)$:

  • 若 $X$ 是终止局势,$\operatorname{SG}(X)=0$。要求此时 $X$ 总为必败状态。
  • 否则,设 $X$ 所有后继局势的集合为 $S$,$\operatorname{SG}(X)=\operatorname{mex}\{\mathrm{SG}(Y) | Y \in S\}$。

状态 $X$ 可以等效为单个大小为 $\operatorname{SG}(X)$ 的尼姆堆。特别地,若状态 $X$ 由若干个互相独立的子状态 $P_1, P_2, \ldots, P_n$ 组成,也有 $\operatorname{SG}(X) = \bigoplus\limits_{1\le i \le n}\operatorname{SG}(P_i)$。

证明如下:由 $\operatorname{mex}$ 函数的性质可知,对于 $i = 0, 1, \ldots, \operatorname{SG}(X) - 1$,$X$ 均有一个满足 $\operatorname{SG}(Y) = i$ 的后继局势 $Y$。对于走向可能存在的 $\operatorname{SG}(Y) > \operatorname{SG}(X)$ 的后继局势 $Y$ 的行动,后手方也总可以在下一次行动中将局势的 $\operatorname{SG}$ 值变回 $\operatorname{SG}(X)$ 来抵消这种影响。

对于必胜方来讲,只需要将各个子状态 $X$ 视作大小为 $\operatorname{SG}(X)$ 的尼姆堆即可。若必败方进行使某堆 $\operatorname{SG}$ 值减小的行动,则必胜方可按尼姆博弈策略应对;若必败方进行使某堆 $\operatorname{SG}$ 值增大的行动,则必胜方只需在下一次行动中恢复该堆的 $\operatorname{SG}$ 值。故原游戏与按 Sprague–Grundy 定理等效得出的尼姆游戏总有相同的必胜方,即为等效。