子博弈精煉納什均衡
子博弈精煉納什均衡是全國科學技術名詞審定委員會公布的科技類名詞。
在漢字的歷史上,人們通常把秦代之前留傳下來的篆體文字和象形文字稱為「古文字[1]」,而將隸書和之後出現的字體稱為「今文字」。因此,「隸變[2]」就成為漢字由古體(古文字)演變為今體(今文字)的分界線。
目錄
名詞解釋
完全信息動態博弈——子博弈精煉納什均衡(subgame perfect Nash equilibrium)
子博弈精煉納什均衡概述
子博弈精煉納什均衡的創立者. ——1994年諾貝爾經濟學獎獲獎者、萊茵哈德·澤爾騰(Reinhard Selten).
澤爾騰則在60年代中期將納什均衡概念引入動態分析。在1965年發表《需求減少條件下寡頭壟斷模型的對策論描述》一文,提出了「子博弈精煉納什均衡」的概念,又稱「子對策完美納什均衡」。這一研究對納什均衡進行了第一次改進,選擇了更具說服力的均衡點。海薩尼在60年代末把不完全信息引入博弈分析。
將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時點上都是最優的,決策者要「隨機應變」,「向前看」,而不是固守舊略。
由於剔除了不可置信的威脅,在許多情況下,精煉納什均衡也就縮小了納什均衡的個數。這一點對預測分析是非常有意義的。
用動態博弈理論來討論實際究竟發生哪個納什均衡。
給定「歷史」,每一個行動選擇開始至博弈結束構成了一個博弈,稱為「子博弈」。
只有當參與人的策略在每一個子博弈中都構成納什均衡叫做精煉納什均衡。或者說,組成精煉納什均衡的策略必須在每一個子博弈中都是最優的。
子博弈精煉納什均衡的定義
子博弈:一個擴展式表示博弈的子博弈G是由一個單結信息集x開始的與所有該決策結的後續結(包括終點結)組成的能自成一個博弈的原博弈的一部分。
對於擴展式博弈的策略組合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的納什均衡;它在每一個子博弈上也都構成納什均衡,則它是一個子博弈精煉納什均衡。
博弈論專家常常使用「序慣理性」(Sequential rationality):指不論過去發生了什麼,參與人應該在博弈的每個時點上最優化自己的策略。子博弈精練納什均衡所要求的正是參與人應該是序慣理性的。對於有限完美信息博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便的方法。因為有限完美信息博弈的每一個決策結都開始一個子博弈。求解方法:最後一個結點上的子博弈(納什均衡)→倒數第二個(納什均衡) → ······ → 初始結點上的子博弈(納什均衡)。
完全信息動態博弈
動態是世間萬物的基本特徵。完全信息靜態博弈只是一種獨特的理想狀態。在現實中,當後一個參與人行動時,自然會根據前者的選擇而調整自己的選擇,而前者也會理性地預期到這一點,所以不可能不考慮自己的選擇對他人的影響。1965年,澤爾騰通過對動態博弈的分析,提出了「子博弈精煉納什均衡」的概念,它要求任何參與人在任何時間、地點的決策都是最優的,決策者應該隨機應變,而不是固守前謀。這就推導出子博弈的概念。當參與人的戰略在每一個子博弈中都構成納什均衡時,則形成「子博弈精煉納什均衡」。也就是說,組成「子博弈精煉納什均衡」的戰略必須在每一個子博弈中都是最優的。
動態博弈的納什均衡的意義
子博弈精煉納什均衡用於區分動態博弈中的"合理納什均衡"與"不合理納什均衡",將納什均衡中包含有不可置信威脅策略的均衡剔除出去,就是說,使最後的均衡中不再包含有不可置信威脅策略的存在。
子博弈精煉納什均衡求法——逆向歸納法求解
逆向歸納法(Backward Induction)是求解子博弈精煉納什均衡的最簡便方法。在求解子博弈精煉納什均衡時,從最後一個子博弈開始逆推上去,這就是逆向歸納法。所以逆向歸納法就是從動態博弈的最後一個階段或最後一個子博弈開始,逐步向前倒推以求解動態博弈均衡的方法。
用逆向歸納法求解子博弈精煉納什均衡;承諾行動與子博弈精煉納什均衡;逆向歸納法與子博弈精煉均衡存在的問題。
參考文獻
- ↑ 什麼是古文字,古文字是如何識別出來的,搜狐,2021-03-26
- ↑ 隸變,變什麼了?,搜狐,2021-05-06