隨機博弈
隨機博弈是中國的一個專有術語。
漢字是世界上最古老的文字之一[1],已有六千多年的歷史。從倉頡造字的古老傳說到公元前1000多年前甲骨文的發現,漢字有着深厚的歷史底蘊。後來的演變經歷了幾千年的漫長曆程,在形體上逐漸由圖形變為筆畫,象形[2]變為象徵,複雜變為簡單;在造字原則上從表形、表意到形聲。
目錄
名詞解釋
隨機博弈(Stochastic games)
什麼是隨機博弈
20世紀50年代早期,Lloyd Shapley提出了隨機博弈的概念。Neyman和Sorin所著的書籍是最完備的有關隨機博弈的參考材料。Filar和Vrieze所著的書更為基礎,在書中給出了嚴密的關於馬爾可夫決策過程和雙人隨機博弈的標準處理方法。他們創造了Competitive MDPs這個術語來概括單人和雙人隨機博弈這個概念。
隨機博弈是指的是這樣的一個博弈遊戲,目前有任意堆石子,每堆石子個數也是任意的,雙方輪流從中取出石子,規則如下:
1、每一步應取走至少一枚石子;每一步只能從某一堆中取走部分或全部石子。
2、如果誰取到最後一枚石子就勝。
隨機博弈的闡析
在博弈論中,隨機博弈是一種包含一個或多個參與者進行的具有狀態概率轉移的動態博弈過程。隨機博弈由多個博弈階段組成。在每一個階段的開始,博弈處在某個特定狀態下。參與者選擇自身的策略並獲得相應的由當前狀態和策略決定的報酬。然後博弈按照概率的分布和參與者策略隨機轉移到下一個階段。在新的狀態階段,重複上一次的策略選擇過程,然後博弈繼續進行。參與者在隨機博弈中獲得的全部報酬一般用各個階段報酬的貼現值來計算,或者用各個階段報酬平均值的下限來計算。
如果隨機博弈中參與者的數量有限並且每個博弈階段可能的狀態數量有限,那麼一個具有有限博弈階段的隨機博弈一般都存在一個納什均衡。同樣的,對於一個具有無窮階段的隨機博弈,如果使用各個階段報酬的貼現值來計算整個博弈階段的報酬,那麼這個隨機博弈也是具有納什均衡的。Vieille已經證明具有有限階段和有限狀態的兩人隨機博弈當中,如果博弈過程的報酬使用各個階段報酬平均值的下限來計算的話,是具有逼近納什均衡的。然而,包含2個以上的參與者的隨機博弈是否存在納什均衡,仍然是個未決的問題。
隨機博弈在經濟學和演化生物學中都有應用。事實上,隨機博弈是重複博弈的一般化過程(重複博弈是指在每個博弈階段都處於相同的狀態)。
參考文獻
- ↑ 雲端超市•第407期┃「說文解字,中國最古老的一種文字」——篆書研究 主講人:倪文東,搜狐,2022-10-28
- ↑ 為什麼中國人會發明象形文字?,搜狐,2020-10-06