求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

正則形式的博弈檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋

來自 搜狐網 的圖片

正則形式的博弈是全國科學技術名詞審定委員會審定、公布的一個科技名詞術語。

語言文字是一個民族文化的結晶。這個民族[1]過去的文化靠着它來流傳,未來的文化也仗着它來推進,從大約是在公元前14世紀,殷商後期的「甲骨文」被認為是「漢字」的第一種形式[2]西周後期,漢字發展演變為大篆,後秦始皇統一中國,中國文字才逐漸走上了發展的道路,直至今天。

名詞解釋

正則形式的博弈(Normal form game)

正則形式的博弈

在博弈論中,正則形式是描述博弈的一種方式。與延展形式不同,正則形式不用圖形來描述博弈,而是用矩陣來陳述博弈。與延展形式的表述方式相比,這種方式在識別出嚴格優勢策略和納什均衡上更有用,但會丟失某些信息。博弈的正則形式的表述方式包括如下部分:每個參與者所有顯然的和可能的策略,以及和與其相對應的收益。

在非完美信息的完全靜態博弈中,正則形式的表述方式詳細地說明了參與者策略空間和收益函數。策略空間是某個參與者的所有可能策略的集合。策略是參與者在博弈的每個階段——不管在博弈中這個階段實際上是否會出現——將要採取的行動的完整計劃。每個參與者的收益函數,是從參與者策略空間的向量積到該參與者收益集合(一般是實數集,數字表示基數效用或序數效用——在正則形式的表述方式中常常是基數效用)的映射。也就是說,參與者的收益函數把策略組合(所有參與者策略的清單)作為它的輸入量,然後輸出參與者的收益。

正則形式的使用

占優策略

合作 背叛

合作 2, 2 0, 3

背叛 3, 0 1, 1

收益矩陣有助於剔除劣勢策略,而且經常被用於說明這個概念。例如,在囚徒困境中(右圖),參與者會發現因為其他人的背叛,合作成了嚴格劣勢策略。參與者會比較每列的第一個數字,在這個例子中,3>2且1>0。這表明無論橫排參與者怎樣選擇,豎排參與者選擇背叛都比較好些。類似地,參與者會比較每列的第二個數字,同樣也是3>2且1>0。這說明無論豎排參與者怎麼做,橫排參與者選擇背叛都比較好些。這就證明了此博弈唯一的納什均衡是(背叛,背叛)。

正則形式的連續博弈

一個連續博弈

左,左 左,右 右,左 右,右

頂 4, 3 4, 3 -1, -1 -1, -1

底 0, 0 3, 4 0, 0 3, 4

這些矩陣只表述同時(或者更一般地,信息不完美的)做出行動的博弈。上述矩陣不能表述甲先做出行動,被乙觀察到,然後乙再做出行動的博弈。因為在這個例子中,無法確定乙每次的策略。為了表述這種連續博弈,我們要列出乙在博弈進行期間所有的行動——儘管根據實際情況,某種行動決不會出現。和前面一樣,在這個博弈中乙有兩種選擇,左和右。與前面不一樣的是,視甲的行動不同而定,乙有四種策略。這些策略是:

1. 如果甲選擇頂,選擇左;否則,選擇左

2. 如果甲選擇頂,選擇左;否則,選擇右

3. 如果甲選擇頂,選擇右;否則,選擇左

4. 如果甲選擇定,選擇右;否則,選擇右

右圖是這個博弈的正則形式的表述方式。

參考文獻