『壹』 納什均衡的計算!
純策略:劃線法
(4,1) (3,0)
(3,2) (7,3) 每個括弧第一個數為Player1的收益,第二個數為Player2的收益。 當局中人2選擇策略1時,比較縱向兩個括弧內第一個數,可知局中人1最大收益為4,在4下劃線 當局中人2選擇策略2時,同上,可知局中人1最大收益為7,在7下劃線 當局中人1選擇策略1時,比較橫向兩個括弧內第二個數,可知局中人2最佳收益為1,在1下劃線 當局中人1選擇策略2時,同上,可知局中人2最大收益為3,在3下劃線 所以有純策略那是均衡,雙方都取策略1或雙方都取策略2 (4,1)及(7,3)
拓展資料
納什均衡是指博弈中這樣的局面,對於每個參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。納什證明了在每個參與者都只有有限種策略選擇並允許混合策略的前提下,納什均衡定存在。以兩家公司的價格大戰為例,價格大戰存在著兩敗俱傷的可能,在對方不改變價格的條件下既不能提價,否則會進一步喪失市場;也不能降價,因為會出現賠本甩賣。於是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分攤方案。相互作用的經濟主體假定其他主體所選擇的戰略為既定時,選擇自己的最優戰略的狀態,也就是納什均衡。
命名原因
約翰·福布斯·納什(John Forbes Nash Jr)1948年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士論文。該博士論文導致了《n人博弈中的均衡點》(1950)和題為《非合作博弈》(1951)兩篇論文的發表。納什在上述論文中,介紹了合作博弈與非合作博弈的區別。他對非合作博弈的最重要貢獻是闡明了包含任意人數局中人和任意偏好的一種通用解概念,也就是不限於兩人零和博弈。該解概念後來被稱為納什均衡。
納什均衡的定義:在博弈G={S1,…,Sn:u1,…,un}中,如果由各個博弈方的各一個策略組成的某個策論組合(s1*,…,sn*)中,任一博弈方i的策論si*,都是對其餘博弈方策略的組合(s1*,…s*i-1,s*i+1,…,sn*)的最佳對策,也即ui(s1*,…s*i-1, si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1, sij*,s*i+1,…,sn*)對任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個納什均衡。
假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年.關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程:假如他坦白,我抵賴,得坐10年監獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。
納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。