经典数学问题:Nim游戏
Nim游戲的數學理論論述
Nim游戲是博弈論中最經典的模型,是組合游戲(Combinatorial Games)的一種,屬于“Impartial Combinatorial Games”(以下簡稱ICG)。
滿足以下條件的游戲是ICG:
1、有兩名選手;
2、兩名選手交替對游戲進行移動(move),每次一步,選手可以在(一般而言)有限的合法移動集合中任選一種進行移動;
3、對于游戲的任何一種可能的局面,合法的移動集合只取決于這個局面本身,不取決于輪到哪名選手操作、以前的任何操作、骰子的點數或者其它什么因素;
4、如果輪到某名選手移動,且這個局面的合法的移動集合為空(也就是說此時無法進行移動),則這名選手負。
通常的Nim游戲的定義是這樣的:有若干堆石子,每堆石子的數量都是有限的,合法的移動是“選擇一堆石子并拿走若干顆(不能不拿)”,如果輪到某個人時所有的石子堆都已經被拿空了,則判負(因為他此刻沒有任何合法的移動)。
分析
從簡單情況開始研究
如果輪到你的時候,只剩下一堆石子,那么此時的必勝策略肯定是把這堆石子全部拿完一顆也不給對手剩,然后對手就輸了。
如果剩下兩堆不相等的石子,必勝策略是通過取多的一堆的石子將兩堆石子變得相等,以后如果對手在某一堆里拿若干顆,你就可以在另一堆中拿同樣多的顆數,直至勝利。
如果你面對的是兩堆相等的石子,那么此時你是沒有任何必勝策略的,反而對手可以遵循上面的策略保證必勝。
深入研究
定義P-position和N-position,其中P代表Previous,N代表Next。
直觀的說,上一次move的人有必勝策略的局面是P-position,也就是“后手可保證必勝”或者“先手必敗”,現在輪到move的人有必勝策略的局面是N-position,也就是“先手可保證必勝”。
更嚴謹的定義是:
1.無法進行任何移動的局面(也就是terminal position)是P-position;
2.可以移動到P-position的局面是N-position;
3.所有移動都導致N-position的局面是P-position。
按照這個定義,如果局面不可能重現,或者說positions的集合可以進行拓撲排序,那么每個position或者是P-position或者是N-position,而且可以通過定義計算出來。
比如剛才說的當只有兩堆石子且兩堆石子數量相等時后手有必勝策略,也就是這是一個P-position,下面依靠定義證明一下(3,3)P-position。
首先(3,3)的子局面有(0,3)(1,3)(2,3),只需要計算出這三種局面的性質就可以了。
(0,3)的子局面有(0,0)、(0,1)、(0,2),其中(0,0)顯然是P-position,所以(0,3)是N-position(只要找到一個是P-position的子局面就能說明是N-position)。
(1,3)的后繼中(1,1)是P-position(因為(1,1)的唯一子局面(0,1)是N-position),所以(1,3)也是N-position。
同樣可以證明(2,3)是N-position。
所以(3,3)的所有子局面都是N-position,它就是P-position。
通過一點簡單的數學歸納,可以嚴格的證明“有兩堆石子時的局面是P-position當且僅當這兩堆石子的數目相等”。
根據上面這個過程,可以得到一個遞歸的算法——對于當前的局面,遞歸計算它的所有子局面的性質,如果存在某個子局面是P-position,那么向這個子局面的移動就是必勝策略。
當然,有大量的重疊子問題,所以可以用DP或者記憶化搜索的方法以提高效率。
但問題是,利用這個算法,對于某個Nim游戲的局面(a1,a2,…,an)來說,要想判斷它的性質以及找出必勝策略,需要計算O(a1a2…*an)個局面的性質,不管怎樣記憶化都無法降低這個時間復雜度。
所以我們需要更高效的判斷Nim游戲的局面的性質的方法。
(Bouton’s Theorem):對于一個Nim游戲的局面(a1,a2,…,an),它是P-position當且僅當a1a2…an=0,其中表示異或(xor)運算。
證明
證明一種判斷position的性質的方法的正確性,只需證明三個命題:
1、這個判斷將所有terminal position判為P-position;
2、根據這個判斷被判為N-position的局面一定可以移動到某個P-position;
3、根據這個判斷被判為P-position的局面無法移動到某個P-position。
第一個命題顯然,terminal position只有一個,就是全0,異或仍然是0。
第二個命題,對于某個局面(a1,a2,…,an),若a1^ a2^ …^ an!=0,一定存在某個合法的移動,將ai改變成ai’后滿足a1^ a2^ …^ ai’^ …^ an=0。不妨設a1^ a2^ …^ an=k,則一定存在某個ai,它的二進制表示在k的最高位上是1(否則k的最高位那個1是怎么得到的)。這時ai^ k<ai一定成立。則我們可以將ai改變成ai’=ai^ k,此時a1^ a2^ …^ ai’^ …^ an=a1^ a2^ …^ an^ k=0。
第三個命題,對于某個局面(a1,a2,…,an),若a1^ a2^ …^ an=0,一定不存在某個合法的移動,將ai改變成ai’后滿足a1^ a2^ …^ ai’^ …^ an=0。因為異或運算滿足消去率,由a1^ a2^ …^ an=a1^ a2^ …^ ai’^ …^ an可以得到ai=ai’。所以將ai改變成ai’不是一個合法的移動。證畢。
根據這個定理,我們可以在O(n)的時間內判斷一個Nim的局面的性質,且如果它是N-position,也可以在O(n)的時間內找到所有的必勝策略。Nim問題就這樣基本上完美的解決了。
Nim游戲的形象具體論述:
Nim取子游戲是由兩個人面對若干堆硬幣(或石子)進行的游戲。
設有k>=1堆硬幣,各堆分別含有N1,N2,……NK枚硬幣。
游戲的目的就是選擇最后剩下的硬幣。
游戲法則如下:
1.兩個游戲人交替進行游戲(游戲人I和游戲人II);
2.當輪到每個游戲人取子時,選擇這些堆中的一堆,并從所選的堆中取走至少一枚硬幣(游戲人可以取走他所選堆中的全部硬幣);
3.當所有的堆都變成空堆時,最后取子的游戲人即為勝者。
這個游戲中的變量是堆數k和各堆的硬幣數N1,N2,……Nk。對應的組合問題是,確定游戲人I獲勝還是游戲人II獲勝以及兩個游戲人應該如何取子才能保證自己獲勝(獲勝策略)。
思路
首選考查某些特殊情況。
如果游戲開始時只有一堆硬幣,游戲人I則通過取走所有的硬幣而獲勝。
現在設有2堆硬幣,且硬幣數量分別為N1和N2,游戲人取得勝利取決于它們是否相等。
設N1!=N2,游戲人I從大堆中取走的硬幣使得兩堆硬幣數量相等,于是,游戲人I以后每次取子的數量與游戲人II相等而最終獲勝。
但是如果N1= N2,則:游戲人II只要按著游戲人I取子的數量在另一堆中取相等數量的硬幣,最終獲勝者將會是游戲人II。
這樣,兩堆的取子獲勝策略就已經找到了。
每個正整數都有對應的一個二進制數,例如:57(10) =111001(2) ,即:57(10)=25+24+23+20。
于是,我們可以認為每一堆硬幣數由2的冪數的子堆組成。
這樣,含有57枚硬幣大堆就能看成是分別由數量為25、24、23、20的各個子堆組成。
現在考慮各大堆大小分別為N1,N2,……Nk的一般的Nim取子游戲。
將每一個數Ni表示為其二進制數(數的位數相等,不等時在前面補0):
N1 = as…a1a0
N2 = bs…b1b0
……
Nk = ms…m1m0
如果每一種大小的子堆的個數都是偶數,我們就稱Nim取子游戲是平衡的,而對應位相加是偶數的稱為平衡位,否則稱為非平衡位。
因此,Nim取子游戲是平衡的,當且僅當:
as + bs + … + ms 是偶數
……
a1 + b1 + … + m1 是偶數
a0 + b0 + … + m0是偶數
于是,我們就能得出獲勝策略:
游戲人I能夠在非平衡取子游戲中取勝,而游戲人II能夠在平衡的取子游戲中取勝。
總結
以上是生活随笔為你收集整理的经典数学问题:Nim游戏的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Codeforces Round #55
- 下一篇: LeetCode 292. Nim Ga