java开发爱恩斯坦棋,爱恩斯坦棋计算机博弈关键技术研究
愛恩斯坦棋計算機博弈關鍵技術研究
【摘要】:計算機博弈是人工智能領域的重要研究方向之一,被譽為人工智能學科的“果蠅”。愛恩斯坦棋屬于完備信息博弈棋種,是一種棋局信息完全透明的博弈類型,即博弈雙方在任何時候都能完全掌握當前的棋局信息。然而,它不同于其它的完備信息博弈棋種,在雙方行棋過程中需通過投擲骰子來確定可走的棋子,具有隨機性,這使博弈系統對棋盤局勢的分析和決策帶來一定的挑戰。自2012年愛恩斯坦棋被列為中國大學生計算機博弈大賽項目之后,國內越來越多的人專注于研究針對愛恩斯坦棋的博弈技術。現有估值函數的研究往往是從進攻、防守和概率三個因素分析局勢的優劣,將這些因素以不同權重線性相加來組成估值函數。通過這種方式構造的估值函數一般會受到設計者自身博弈水平的限制,而且很難得到一個最優的權重。此外,搜索算法的研究大多是針對Alpha-Beta搜索算法和期望極大極小搜索算法的改進,但是這些搜索算法過于依賴估值函數,估值函數的好壞決定了整個博弈系統的水平。本文以愛恩斯坦棋為研究對象,研究愛恩斯坦棋計算機博弈的關鍵技術。在搜索算法方面,本文引入蒙特卡洛樹搜索(Monte-Carlo tree search,MCTS)算法,提出了概率啟發的并行MCTS算法,用概率節點表示投骰子事件,以多對多的方式連接其子節點,并對概率節點進行并行效率優化。在估值方面,本文設計愛恩斯坦棋特征向量的表示方法,使用基于多層感知機的價值網絡進行估值,并在訓練過程中將價值網絡與概率啟發的MCTS算法結合,提高樣本質量和棋力。在博弈系統方面,設計并實現了愛恩斯坦棋博弈系統,具有人機交互、自動化對弈、棋譜存取以及訓練網絡等功能,建立了計算機博弈算法設計與分析的驗證工具。本文的主要創新點如下:(1)在博弈樹搜索方面,設計了用于表示隨機事件的數據結構,并提出了概率啟發的并行蒙特卡洛樹搜索算法。一方面,在博弈樹中使用概率節點來表示擲骰子事件,使用多對多的形式連接概率節點和最大值或最小值節點;另一方面,將蒙特卡洛樹搜索算法用于上述博弈樹中,并對該算法的并行化方法做優化。通過實驗分析和實踐證明,概率啟發的并行蒙特卡洛樹搜索算法具有較高的搜索效率和智能水平,并在2018年中國大學生計算機博弈大賽榮獲亞軍(一等獎);(2)在估值方法方面,本文研究并設計了基于多層感知機的價值網絡,以評估棋盤對當前行棋方的價值。首先,本文從棋盤盤面中提取48維的特征向量,設計價值網絡模型,并與概率啟發的并行蒙特卡洛樹搜索算法結合。其次,從AlphaGo Zero程序中得到啟發,設計了樣本采集、網絡訓練和棋力評估三個階段的價值網絡的訓練過程。通過實驗分析,本文提出的價值網絡模型經過訓練后有較高的智能水平,并且結合價值網絡的概率啟發并行蒙特卡洛樹搜索算法以55.3%的勝率戰勝未結合價值網絡的算法;(3)在博弈系統方面,本文設計并實現了愛恩斯坦棋博弈系統,包括訓練子系統和對弈交互子系統。訓練子系統用于執行和管理價值網絡的訓練進程,根據用戶輸入的相關參數訓練神經網絡,查看和保存訓練過程中的誤差和勝率變化,存取訓練完成的網絡模型;對弈交互子系統提供用戶與系統中的算法進行對弈的功能,用戶可選擇系統中已有策略,手動設置策略參數,實現人-人、人-機和機-機自動對弈,將對弈過程可視化,并存儲對弈棋譜。綜上所述,本文在搜索、估值與系統三個方面進行愛恩斯坦棋計算機博弈技術的研究。首先,針對隨機性的問題對蒙特卡洛樹搜索算法進行了修正和并行優化,提升算法的搜索效率和智能水平;其次,設計了基于多層感知機的價值網絡模型及其訓練方法,進一步提升棋力;最后,實現了愛恩斯坦棋博弈系統,建立計算機博弈算法設計與分析的驗證工具。
【相似文獻】
中國期刊全文數據庫
前18條
1
梅險;侯利元;謝文;高旭;孫偉;李冬平;;計算機博弈創新教育的研究與實踐[J];黑龍江教育(理論與實踐);2017年12期
2
關寧;;基于java的五子棋游戲設計[J];青春歲月;2016年21期
3
;《名手軟件》[J];棋藝(象棋版);2017年08期
5
湯云雄;董從民;;計算機博弈系統在中國象棋教學中的應用[J];科技信息;2011年19期
6
;全國計算機博弈錦標賽落幕[J];棋藝(象棋);2010年01期
7
蔣澤文;;博弈名譜(66)[J];棋藝(象棋版);2015年12期
8
傅瑤;;計算機博弈平臺搭建技術策略[J];電腦迷;2017年11期
9
北方好漢;;博弈名譜(50)[J];棋藝(象棋);2014年05期
10
楊昌杰;陳柯成;劉躍元;王京;;愛恩斯坦棋計算機博弈算法研究與改進[J];無線互聯科技;2018年15期
11
王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統評估函數的自適應遺傳算法實現[J];東北大學學報;2005年10期
12
蔣澤文;;博弈名譜(76)[J];棋藝(象棋版);2016年10期
13
徐心和;王驕;;中國象棋計算機博弈關鍵技術分析[J];小型微型計算機系統;2006年06期
14
北方好漢;;博弈名譜[J];棋藝(象棋);2010年02期
15
蔣澤文;;博弈名譜(63)[J];棋藝(象棋版);2015年09期
16
蔣澤文;;博弈名譜(67)[J];棋藝(象棋版);2016年01期
17
周瑋;王友政;馬慶增;;利用局勢變化攫取優勢博弈[J];系統仿真學報;2008年17期
18
北方好漢;;博弈名譜(46)[J];棋藝(象棋版);2013年12期
中國重要會議論文全文數據庫
前2條
1
馮聞捷;彭力;;牛角棋計算機博弈系統的實現[A];第二十七屆中國控制會議論文集[C];2008年
2
徐心和;;計算機博弈是作戰模擬的關鍵技術之一[A];新觀點新學說學術沙龍文集37:仿真是基于模型的實驗嗎[C];2009年
中國博士學位論文全文數據庫
前1條
中國碩士學位論文全文數據庫
前10條
1
陸夢軒;愛恩斯坦棋計算機博弈關鍵技術研究[D];安徽大學;2019年
2
王宛宛;軍棋機器人UCT算法及計算機博弈行為研究[D];重慶理工大學;2019年
3
李琴;愛恩斯坦棋計算機博弈算法的研究與實施[D];重慶理工大學;2018年
4
5
6
劉明慧;計算機博弈的估值方法研究[D];東北大學;2008年
7
李翠珠;六子棋計算機博弈系統的研究與實現[D];重慶理工大學;2010年
8
王楊;基于計算機博弈的五子棋算法研究[D];沈陽理工大學;2017年
9
閔文杰;六子棋計算機博弈關鍵技術研究[D];重慶交通大學;2010年
10
林菡;TAC-SCM計算機博弈系統的研究與實現[D];南京航空航天大學;2009年
中國重要報紙全文數據庫
前6條
1
記者 陳鈞;全國大學生計算機博弈大賽在渝舉行[N];重慶日報;2017年
2
本報記者 陳鈞;人工智能還可推演戰爭輸贏[N];重慶日報;2017年
3
本報記者 瞿劍;計算機圍棋戰勝人類:20年還是100年[N];科技日報;2015年
4
本報記者 張蕾;向中國象棋冠軍發起挑戰[N];光明日報;2005年
5
記者 何鑫 通訊員 張燕霖;高交會“中國象棋人機大戰”今開戰[N];深圳商報;2009年
6
;中國版“深藍人機大戰”烽火點燃[N];人民郵電;2006年
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的java开发爱恩斯坦棋,爱恩斯坦棋计算机博弈关键技术研究的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php算法在线刷题,c,算法_每日一道算
- 下一篇: java tomcat jndi,Tom