什么是博弈论 运筹学的一个重要学科
博弈論又被稱為對策論(Game Theory)既是現代數學的一個新分支,也是運籌學的一個重要學科。
博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有斗爭或競爭性質現象的數學理論和方法。 博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。
博弈論已經成為經濟學的標準分析工具之一。在生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。
基本概念中包括局中人、行動、信息、策略、收益、均衡和結果等。其中局中人、策略和收益是最基本要素。局中人、行動和結果被統稱為博弈規則。
理論歷史
博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。
博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優化策略。
近代對于博弈論的研究,開始于策梅洛(Zermelo),波萊爾(Borel)及馮·諾依曼(von
Neumann)。
1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統地應用于經濟領域,從而奠定了這一學科的基礎和理論體系。
1950~1951年,約翰·福布斯·納什(John Forbes Nash
Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。
類型
(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。
(2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。
(3)完全信息/不完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有充分了解稱為完全信息;反之,則稱為不完全信息。
(4)靜態博弈和動態博弈
諾貝爾獎
從1994年諾貝爾經濟學獎授予3位博弈論專家開始,共有6屆的諾貝爾經濟學獎與博弈論的研究有關,分別為:
1994年,授予加利福尼亞大學伯克利分校的約翰·海薩尼(J.Harsanyi)、普林斯頓大學約翰·納什(J.Nash)和德國波恩大學的賴因哈德·澤爾滕(Reinhard
Selten)。以表彰這三位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻,對博弈論和經濟學產生了的重大影響。
1996年,授予英國劍橋大學的詹姆斯·莫里斯(James A. Mirrlees)與美國哥倫比亞大學的威廉·維克瑞(William
Vickrey)。前者在信息經濟學理論領域做出了重大貢獻,尤其是不對稱信息條件下的經濟激勵理論,后者在信息經濟學、激勵理論、博弈論等方面都做出了重大貢獻。
2001年,授予加利福尼亞大學伯克利分校的喬治·阿克爾洛夫(George A. Akerlof )、美國斯坦福大學的邁克爾·斯賓塞(A. Michael
Spence )和美國哥倫比亞大學的約瑟夫·斯蒂格利茨(Joseph E.
Stiglitz)。他們的研究為不對稱信息市場的一般理論奠定了基石,他們的理論迅速得到了應用,從傳統的農業市場到現代的金融市場,他們的貢獻來自于現代信息經濟學的核心部分。
2005年,授予美國馬里蘭大學的托馬斯·克羅姆比·謝林(Thomas Crombie
Schelling)和耶路撒冷希伯來大學的羅伯特·約翰·奧曼(Robert John Aumann)。二者的研究通過博弈論分析促進了對沖突與合作的理解。
2007年,授予美國明尼蘇達大學的里奧尼德·赫維茨(Leonid Hurwicz)、美國普林斯頓大學的埃里克·馬斯金(Eric S.
Maskin)以及美國芝加哥大學的羅杰·邁爾森(Roger B. Myerson)。三者的研究為機制設計理論奠定了基礎。
2012年,授予美國經濟學家埃爾文·羅斯(Alvin E. Roth)與羅伊德·沙普利(Lloyd S.
Shapley)。他們創建“穩定分配”的理論,并進行“市場設計”的實踐[3] 。
作為一門工具學科能夠在經濟學中如此廣泛運用并得到學界垂青實為罕見。
2014年,授予法國經濟學家梯若爾。他在產業組織理論以及串謀問題上,采用了博弈論的思想,讓理論和問題得以解決。在規制理論上也有創新。
要素
(1)局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為“兩人博弈”,而多于兩個局中人的博弈稱為
“多人博弈”。
(2)策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。
(3)得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函數,通常稱為支付(payoff)函數。
(4)對于博弈參與者來說,存在著一博弈結果
。
(5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處于穩定值。在供求關系中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。
博弈類型
博弈的分類根據不同的基準也有不同的分類。
一般認為,博弈主要可以分為合作博弈和非合作博弈。合作博弈和非合作博弈的區別在于相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。
從行為的時間序列性,博弈論進一步分為靜態博弈、動態博弈兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但后行動者并不知道先行動者采取了什么具體行動;動態博弈是指在博弈中,參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。通俗的理解: 囚徒困境 就是同時決策的,屬于靜態博弈;而棋牌類游戲等決策或行動有先后次序的,屬于動態博弈
按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特征、策略空間及收益函數有準確的信息。不完全信息博弈是指如果參與人對其他參與人的特征、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特征、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。
經濟學家們所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博弈論復雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四種博弈相對應的均衡概念為:納什均衡(Nash
equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash
equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。
博弈論還有很多分類,比如:以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;以表現形式也可以分為一般型(戰略型)或者展開型;以博弈的邏輯基礎不同又可以分為傳統博弈和演化博弈。
納什均衡
納什均衡(Nash
Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當局中人A采取其最優策略a*,局中人B也采取其最優策略b*,如果局中人仍采取b*,而局中人A卻采取另一種策略a,那么局中人A的支付不會超過他采取原來的策略a*的支付。這一結果對局中人B亦是如此。
這樣,“均衡偶”的明確定義為:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱之為均衡偶,對任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(a,
b*)≤偶對(a*,b)≤偶對(a*,b*)。
對于非零和博弈也有如下定義:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:對局中人A的偶對(a,
b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。
有了上述定義,就立即得到納什定理:
任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。
納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價于找到博弈的不動點。
納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構里尋找比較有意義的結果。
但納什均衡點定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。
塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。
總結
以上是生活随笔為你收集整理的什么是博弈论 运筹学的一个重要学科的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 国寿英才少儿保险99版是什么险种
- 下一篇: 房屋二次抵押贷款应注意什么问题呢