1. 你認為什麼是最佳的博弈論方法
案例研究 囚犯兩難處境的比賽
假想你正與被關在另一個屋子裡的「嫌疑」人進行囚犯兩難處境的博弈。而且,再設想這種博弈不是進行一次而是多次。你博弈最後的得分是你被監禁的總年數。你希望使這種得分盡可能地少。你應該用什麼戰略?你應該從坦白還是保持沉默開始?另一個參與者的行動會如何影響你以後的坦白決策?
多次的囚犯兩難處境是極為復雜的博弈。為了鼓勵合作,參與者應該相互懲罰不合作行為。但以前描述的傑克和吉爾的水卡特爾的戰略——只要另一方違約,一方就永遠違約——得不到寬恕。在反復許多次的博弈中,在不合作時期之後,允許參與者回到合作結果的戰略,可能是較合人意的。
為了說明哪一種戰略最好,政治學家羅伯特?阿克塞爾羅德(Robert Axelrod)進行了一場比賽。人們通過輸人為反復進行囚犯的兩難處境而設計的電腦程序進入比賽。每個進行博弈的程序都對應於所有其他程序。得到獄中總年數最少的程序的是「贏家」。
贏家結果是被稱為一報還一報的簡單戰略。根據一報還一報,參與者應該從合作開始,然後上一次另一個參與者怎麼作自己也怎麼做。因此,一報還一報參與者要一直合作到另一方違約時為止;他違約到另一方重新合作時為止。換句話說,這種戰略從友好開始,懲罰不友好的參與者,而且,如果對方改變就給予原諒。令阿克塞爾羅德驚訝的是,這種簡單的戰略比人們輸人的所有較復雜的戰略都好。
2. 如何用博弈論來解決生活中的問題
在我們所學的專業課《商務談判》中就有這么一節是來講博弈論的,博弈論用英語解釋就是「game theory」,也就是游戲中的理論,在我看來就是兩人或多人之間的心理戰。
老師在上課時給我們講了一個警察與兩個小偷的故事,這個警察雖然知道兩個小偷是慣犯但其實是沒有證據來制裁他們兩的,所以這個警察想了一個辦法,就是運用博弈論來讓他們主動坦白,首先兩個小偷被關在兩個不同的封閉空間中,他們之間不能進行任何的交流,如果一個小偷坦白另一個小偷拒絕坦白則坦白的小偷被判半年有期徒刑,不坦白的那個則被判十年;如果兩個都拒不坦白,則兩個小偷都被判一年;如果兩個都坦白則兩個都被判五年。
在這種情況下兩個小偷不能進行充分的交流而且存在著僥幸的心理,希望自己坦白的同時另一個人不坦白,那麼他就可以獲得更少的刑罰能夠早日出來重見天日,結果兩人都超出了自己的預料同時坦白,最終的結果大家也肯定是有所預料,他們都被判了五年的刑罰。這個事例就是警察與小偷之間的「游戲規則」,小偷與小偷之間的心理戰,這個博弈論就解決了現實中警察在沒有證據的情況下還能夠把小偷繩之以法。
生活中就是有許多人因為有僥幸心理,對於一些事情不會主動坦白,所以會有心理專家甚至是咨詢師的出現,因此博弈論一般常用在犯罪心理學上、生意場上的談判上、以及政治上的談判各方各面,我也覺得想要用博弈論來解決問題首先還是需要學好心理學,多看一些《孫子兵法》之類的書,學習一些謀略,在下圍棋的時候也會有所用處。
3. 博弈論簡單入門 基本概念解釋以及具體案例分析
博弈論也也 稱為 對策論 或 賽局理論 ,是研究具有斗爭或競爭性質現象的數學理論和方法。博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構,所以它們是同一個游戲的特例。其中一個著名有趣的應用例子是囚徒困境。
具有競爭或對抗性質的行為稱為博弈行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最為有利或最為合理的方案。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數學理論和方法。
約翰·馮·諾伊曼是個超級跨界牛人——他同時在「數學、物理學、經濟學、計算機」等多個領域作出了劃時代的貢獻,並留下一大堆以他命名的東西,比如程序員應該都聽說過「馮諾依曼體系」,比如數學領域有「馮諾依曼代數、馮諾依曼遍歷定理……」,理論物理領域有「馮諾依曼量子測量、馮諾依曼熵、馮諾依曼方程……」。另外還有很多東西,雖沒有以他命名,也是他先搞出來的,比如:量子力學的公理化表述、希爾伯特第5問題、連續幾何(其空間維數不是整數)、蒙特卡洛方法、歸並排序演算法1944年,他與奧斯卡·摩根斯坦合作發表了《博弈論與經濟行為》一舉奠定博弈論體系的基礎,所以他也被稱作博弈論之父。
合作博弈 & 非合作博弈
不論是合作博弈與非合作博弈,在博弈過程中都可能會出現合作的現象。差別在於——對於合作博弈,存在某種外部約束力,使得背叛的行為會受到這種外部約束力的懲罰。對於非合作博弈,沒有上述這種外部約束力,對背叛的懲罰只能依靠博弈過程的其它參與者。通常所說的博弈大都指非合作博弈。
同時博弈 & 順序博弈
同時博弈有時也稱作靜態博弈,指的是——博弈的任何一個參與者在選擇自己的行為之前,並不知道其它參與者的行為信息。順序博弈有時也稱作動態博弈。在這類博弈中,參與者的動作有時間上的先後,並且後一個執行動作的博弈者可以看到其他博弈者之前的動作,然後根據別人的動作,思考自己的行為。
零和博弈 & 非零和博弈
零和博弈這個名稱具有誤導性,使得很多人以為各方的收益總和為零。零和博弈指的是——在博弈結束之後,參與各方的利益總和為常量(可以是零,也可以是正值或負值)。非零和博弈指的是——在博弈結束之後,參與各方的利益總和為變數。所以這類博弈有時候稱為變和博弈。對於這類博弈,在某些情況下可能會讓參與各方的利益總和變大,從而使得各方存在合作的可能性。
非重復博弈 & 重復博弈
非重復博弈有時也稱作單次博弈;相應的,重復博弈也被稱作多次博弈。重復博弈還可以進一步細分為有限重復博弈與無限重復博弈。更嚴謹的說法是:有限重復博弈——重復次數確定的博弈,無限重復博弈——重復次數不確定的博弈
收益矩陣 & 決策樹
這兩個概念都是為了更直觀地描述博弈過程,並幫你看清各方的利弊得失。收益矩陣通常用來描述靜態博弈(同時博弈)而且一般是用來描述雙人的靜態博弈,更多人的靜態博弈也可以用收益矩陣表述,但畫起來會復雜很多;由於動態博弈(順序博弈)比較復雜,通常不用「收益矩陣」描述。決策樹既可以用來描述靜態博弈,也可以用來描述動態博弈。
策略 & 策略集合
以象棋為例,完成一局需要經歷很多個步驟,對每個步驟,你都有多個決策選項(要走哪個棋子,走到哪)。而策略指的是——從第一步到最後一步的所有決策選項的總和。你可以把策略通俗理解為某種演算法 指導思想,它指導你從第一步走到最後一步。所有可能的策略,構成了策略集合。
有限策略集合 & 無限策略集合
石頭剪刀布是典型的有限策略集合,該集合只有3個元素。為了說明無限策略集合這種集合,舉個分蛋糕博弈的例子,其中一人先把蛋糕隨意分為兩塊,然後另一個人先挑選其中一塊。對於負責分蛋糕的人而言,其策略集合是無窮大。很多人憑直覺會認為:具有無限策略集合的博弈比有限策略集合的博弈更復雜。其實不然,圍棋雖然很復雜,但其策略集合依然是有限滴。作為對比,分蛋糕博弈比圍棋簡單多了,但分蛋糕博弈反而具有無限的策略集合。
純策略 & 混合策略
在實際博弈時,如果你總是固定選擇策略集合中的某一個策略,這種情況稱之為純策略。如果你在博弈時,總是隨機選擇策略集合中的某幾個策略,這種情況稱之為混合策略。如果某個混合策略包含了策略集合中的每一個元素,稱之為完全混合策略。
支配策略
假設你有兩個策略 A & B。如果在任何情況下,A 都比 B 更優,稱作 A 支配 B 或者 B 被 A 支配。支配策略又稱優勢策略。如果某個策略能夠支配所有其它策略,那麼它就是支配策略。通俗地說,不論你的對手採用何種策略,你的支配策略總是比你的其它策略有更好的結果。有時候會把支配策略進一步細分為強支配和弱支配。對於前者,它在任何情況下都比其它策略更好;對於後者,它在某些情況下比其它策略更好,某些情況下與其它策略一樣好。制勝策略也稱必勝策略,它通常只用於零和博弈,指的是——只要你採用這個策略,不論對方如何應對你總是贏。制勝策略肯定是支配策略;但支配策略不一定是制勝策略。
最小最大定理
比較繞口的陳述是:最小化最大損失,更通俗的表述是在最壞情況下最小化損失。該定理及演算法最早由馮·諾依曼在《博弈論與經濟行為》一書中提出。
反向歸納法 & 概念該方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每個決策,以及對方在應對你的決策時,會採用何種決策,這個思維過程類似於決策樹的展開,這個展開過程要一直推演到最後一步,也就是決策樹的葉子節點。此時你就可以看清雙方在最後一步各自的最優選擇;然後再反向回推到第一步。當你要用反向歸納進行展望與推理,前提是——你要獲得充分的信息;或者說,如果某個博弈者所知的信息不夠充分,就無法運用該方法。
問題描述
5個海盜搶了100個金幣,討論如何分贓。這5個海盜有等級高低(不妨假設 A>B>C>D>E)。先由等級最高的海盜提出分贓方案,然後投票。如果半數以上(含半數)同意,就按這個方案分,游戲結束;如果同意的不到半數,把提出方案的海盜扔進海里喂鯊魚,然後由次一等級的海盜提出新的方案;以此類推。每個海盜的特點是:足夠理性(追求個人利益最大化)並且知道別人也足夠理性;足夠殘忍(在個人利益等同的情況下,傾向於把更多同伴扔進海里)。
策略分析
為了進行反向推理,假設最後只剩下2個海盜(D & E)。此時的投票肯定過半(D 肯定投票贊同自己的方案)。在這種局面下,D 可以採用最極端的方案——自己全拿100個金幣,E 則一個也拿不到。
現在回推一步。當只剩下3個海盜(C、D、E),由 C 提出方案。他只需要分1個金幣給 E,E 就會投票支持(否則的話,等到由 D 來提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99個金幣,E 拿1個金幣。
再往前一步。只剩下4個海盜(B、C、D、E),B 提方案,他當然也能想到剛才那些推理。他只需給 D 1個金幣,D 就會支持他(如果等到 C 來提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同樣能得到半數支持。
基於上述分析,再看 A 的方案,就很顯然了——A:98,B:0,C:1,D:0,E。
美國數學家納什在1951年發表了一篇小論文名叫《非合作博弈》,其中提出了納什均衡的概念並給出了相應的基於不動點定理數學證明。通俗地說是指在多人的非合作博弈中,如果每個博弈者都無法單方面改善自己的境地,此時的局面稱作納什均衡。馮·諾伊曼已經在《博弈論與經濟行為》一書中證明了:零和博弈必定存在這樣的均衡點。納什的貢獻在於他從零和博弈推廣到非零和博弈,並證明了:這樣的均衡點依然存在。當博弈的局面處於納什均衡,此時的系統是穩定滴,如果每個博弈者都足夠理性,他們都不願意主動改變當前的策略。
換位思考
前面聊的很多博弈相關技能都依賴於換位思考這個能力,你需要站在對手的角度進行思考,才能看清局面,從而更好地選擇自己的策略。一般來說,那些換位思考能力越強的人,也越善於進行強批判思維。
理性人假設
微觀經濟學在進行數學建模的時候,通常都會引入一個理性人假設,假定市場的行為主體是充分理性,此處的充分理性還隱含著掌握充分的信息,引入這個假設是為了數學建模的需要。對任何一個國家大多數人都很平庸,他們的共同點之一是非常不理性。充分理性並且掌握了充分信息的個人,那也絕對是鳳毛麟角,而理性人假設竟然設定市場的行為主體全都是充分理性的。有了博弈論之後,這個非常扯蛋的理性人假設就可以丟到垃圾桶里。
舊的經濟學理論(理性人的解釋)會說——所有公司的老闆都充分理性,也掌握了充分的信息,知道應該生產何種商品,才能滿足市場需求。新的經濟學理論(博弈論的解釋)會說——公司的老闆既有優秀的,也有平庸的。平庸公司生產的商品沒人要,自然會虧損並倒閉。隨著時間的推移,經過自然選擇,活下來的公司當然是那些聰明的。
裝瘋策略
理性的博弈者把自己偽裝成非理性的博弈者,這么干可以獲得某種虛張聲勢的唬人效果。對這種手法,俺稱之為裝瘋策略。
經濟學
談博弈論的影響,當然首先要談它對經濟學的影響。有了博弈論,就不再需要那個扯蛋的理性人假設了,這是博弈論誕生後對微觀經濟的重大影響,還有很多其它的影響。比如說:博弈論誕生前傳統的微觀經濟學以供給需求來建立價格的數學模型。這個模型只考慮了供應量需求量的變化對價格的影響,而完全不考慮供給雙方的力量對比。如果供給雙方中,一方變得強勢或另一方變得弱勢。即使供應量與需求量都維持不變,價格也會發生變動,朝著對強勢方有利的方向移動。
生物學
生物學受博弈論影響最大的分支估計是演化生物學,也就是的進化論。藉助博弈論的研究成果,演化生物學家可以更好地建立物種演化的數學模型。
4. 關於博弈論,你了解多少呢
博弈論又被稱為對策論(Game Theory),既是現代數學的一個新分支,也是運籌學的一個重要學科。
博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有斗爭或競爭性質現象的數學理論和方法。 博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。
博弈論已經成為經濟學的標准分析工具之一。在金融學、證券學、生物學、經濟學、國際關系、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。
博弈論[2]是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。
博弈論考慮游戲中的個體的預測行為和實際行為,並研究它們的優化策略。
近代對於博弈論的研究,開始於策梅洛(Zermelo),波萊爾(Borel)及馮·諾依曼(von Neumann)。
1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統地應用於經濟領域,從而奠定了這一學科的基礎和理論體系。
1950~1951年,約翰·福布斯·納什(John Forbes Nash Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。
5. 博弈有哪些分類方法
弈論是二人或多人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝目標的理論.博弈論是研究互動決策的理論.博弈可以分析自己與對手的利弊關系,從而確立自己在博弈中的優勢,因此有不少博弈理論,可以幫助對弈者分析局勢,從而採取相應策略,最終達到取勝的目的.博弈的類型分為:合作博弈、非合作博弈、完全信息博弈、非完全信息博弈、靜態博弈、動態博弈,等等.現代博弈論的發展 數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化.現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》,標志著現代系統博弈理論的初步形成.1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法.他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡.從而揭示了博弈均衡與經濟均衡的內在聯系.納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的.早在20世紀初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經開始研究博弈的准確的數學表達,直到1939年,馮·諾依曼遇到經濟學家奧斯卡·摩根斯特恩(Oskar Morgenstern),並與其合作才使博弈論進入經濟學的廣闊領域.1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經濟行為》出版,標志著現代系統博弈理論的的初步形成.馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標准型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎.納什是繼馮·諾依曼之後最偉大的博弈論大師之一.他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用.博弈分類博弈分為靜態博弈和動態博弈.靜態博弈是指在博弈中,兩個參與人同時選擇或兩人不同時選擇,但後行動者並不知道先行動者採取什麼樣的具體行動.對雙方來說,都容易形成混沌的行為重組,由於規則的嚴密與精細,任何人因時間問題、資金問題、心理問題等等,致使在多次均衡後直到不明不白地造成大輸,參與靜態博弈和動態博弈的大部分都是這種人.動態博弈是指在博弈中,兩個參與人有行動的先後順序,且後行動者能夠觀察到先行動者所選擇的行動.根據參與者能否形成約束性的協議,以便集體行動,博弈可分為合作性博弈和非合作性博弈.納什等博弈論專家研究得更多的是非合作性博弈.所謂合作性博弈是指參與者從自己的利益出發與其他參與者談判達成協議或形成聯盟,其結果對聯盟方均有利;而非合作性博弈是指參與者在行動選擇時無法達成約束性的協議.人們分工與交換的經濟活動就是合作性的博弈,而囚徒困境以及公共資源悲劇都是非合作性的博弈.博弈又分靜態博弈和動態博弈.靜態博弈指參與者同時採取行動,或者盡管參與者行動的採取有先後順序,但後行動的人不知道先採取行動的人採取的是什麼行動.動態博弈指參與者的行動有先後順序,並且後採取行動的人可以知道先採取行動的人所採取的行動.從知識的擁有程度來看,博弈分為完全信息博弈和不完全信息博弈.信息是博弈論中重要的內容.完全信息博弈指參與者對所有參與者的策略空間及策略組合下的支付有「完全的了解」,否則是不完全信息博弈.嚴格地講,完全信息博弈是指參與者的策略空間及策略組合下的支付,是博弈中所有參與者的「公共知識」的博弈.對於不完全信息博弈,參與者所做的是努力使自己的期望支付或期望效用最大化.以此博弈哲學語言也可體現出以下四種博弈分類:完全信息靜態博弈、完全信息動態博弈、不完全信息靜態博弈、不完全信息動態博弈其中策略性博弈應屬於完全信息靜態博弈,而完全信息動態博弈則包括擴展性博弈和重復博弈等;不完全信息靜態博弈則是以貝葉斯均衡等理論完成對混合策略的重新解釋,不完全信息動態博弈則是完美貝葉斯均衡為核心概念的信號博弈.
6. 如何用博弈論的方法進行問題分析
博弈論是一種被大家已經傳說的很玄一種理論,作為理財師我今天給大傢具體的說明一下,博弈論實際就是一種方法,但是也只是運用方法的一種,博弈論是現代數學的一個新分支,也是運籌學的一個重要組成內容,用博弈論分析問題有下面幾個方法:
第一、科學的利用數據優勢,進行傳統的企業數據分析,這樣可以比較精確的進行企業的一些數據化的考量,有利於企業的發展。
第二、我們可以利用博弈論在平等的企業交往中發揮優勢,在企業之間的對局中,每一個企業都有各自利用的數據,我們要做的是通過博弈論的數據使對方的策略變換成為,一種自己的對抗策略,達到取勝的一種分析問題的途徑。
第三、博弈論在個人處理事情的時候,其實就是我們需要在決策的時候,必須將其他人的決策和一些個人的想法,納入自己的決策考慮之內,當然也需要把別人對於自己的考慮也要納入考慮之中,做到一個圓滿的解決和分析問題的依據。
第四、我們在生活中也可以利用博弈論解決問題,那就是把一件事情的正反兩面,轉化為合理的數據,然後進行迭代考慮的情形,然後我們進行決策的時候,選擇最有利於自己的戰略【也就是strategy】,這樣可以更好的分析問題和解決問題。
第五、博弈論分析問題的時候會十分的全面,必須把一些普遍和普及的事情,計算在其中,也就是說我們必須知道人人都會在約束條件下,最大化自身的利益,這時候你要做的是分析這件事情的利益,把各放的利益全部衡量進去。
上面我們說的就是利用博弈論分析問題的一些基本的方法和理論,但是需要說明的是,博弈論不是萬能的,還要看你的心態,看你做事情的思考角度,以及你如何運用自己得到的數據,博弈論分析和研究的問題,主要是讓大家如何使得人們在市場經濟中,自願做出大家都遵守和實施的有效制度安排,以增進社會的福利的機制,並沒有大家想像中的那麼神奇。
7. 博弈論 Day1
博弈論的基本觀點是,人是利己主義的,爭奪利益是無可避免的。博弈論指的是,推測對手的行動,從而做出對自己最為有利的戰略。一場博弈,由三個最基本的要素組成:局中人,策略,收益。局中人指的是參與爭奪利益的主體,策略是指局中人為了爭奪自己的利益而作出的行動,收益是指在局中人實施了相應的策略,綜合了各方博弈主體的策略後,各局中人能夠獲得的相應的利益。分析博弈論的基本方法有兩種,第一種是策略型收益表,第二種是展開型樹狀圖。根據局中人執行策略的順序分為,靜態博弈和動態博弈。靜態博弈是指各個局中人同時採取行動的博弈。動態博弈是指,局中人的博弈有先後順序。根據局中人的合作關系可分為,非合作關系的博弈和完全合作關系的博弈,主要以局中人是否遵循一定的規則,具有一定的約束。根據利益的總和可分為定和博弈和非定和博弈,是以局中人利益總和是否為一個固定值進行區分。根據局中人對信息的掌握程度可分為完全信息和非完全信息博弈。強支配性策略指的是不管對手採取什麼樣的策略,己方的某一策略都可以獲得比其他策略更大的收益。
感想:博弈論的基本理念是建議人在採取策略時學會推測其他人將會採取的策略,以及這些策略會對自己的收益產生何種影響,在權衡了各種影響之後,判斷自己採取何種策略才可以將自己的利益最大化。其中分析博弈過程涉及一定的排列組合思維解答方式,要學會分析在博弈中,局中人採取的所有策略以及劃定局中人採取策略後可能的收益,並將每個局中人策略進行組合,綜合考量兩者之間利益的變化關系。對強支配性策略和納什均衡理論,暫時理解不夠。在下一次閱讀時要盡可能的溫習,並且通過閱讀新的知識來透析。
8. 博弈論有哪些分類方法,有哪些主要類型
博弈論中最常見的均衡理論主要有:Nash均衡、子博弈精煉的Nash均衡、貝葉斯Nash均衡、貝葉斯精煉Nash均衡。Nash均衡是完全信息靜態博弈的解;子博弈精煉的Nash均衡是完全且完美信息動態博弈的解;貝葉斯Nash均衡是不完全信息靜態博弈及完全且不完美信息動態博弈的解;貝葉斯精煉Nash均衡是不完全信息動態博弈的解。
9. 逆推歸納法 博弈論
逆推歸納法是解析動態博弈的一般方法。其方法是∶從博弈樹最後的決策結為起點,求出對應的參與人的最優選擇;然後在給定這種選擇的情況下,倒推至該決策結的前一個決策結求出對應的參與人的最優選擇;然後再向前倒推,直至初始的決策結。當這個倒推過程完成後,則得到一個路徑,這個路徑給出了每一個參與人一個特定的戰略,所有這些戰略構成一個納什均衡就是動態博弈的解,這個納什均衡被稱為子博弈精煉納什均衡。
例如「海盜分寶」中,最先提分配方案的1號海盜是這樣思考的∶該博弈的最後階段是剩下4號、5號兩個海盜,由4號提分配方案,5號表決。很顯然,無論4號提出的任何分配方案(哪怕提出5號得全部100塊寶石),5號都會否決,因為輪到5號時,他會理直氣狀的得到全部寶石,故在最後階段,4號被扔進大海,5號獨吞全部寶石。倒推到剩下3個海盜的情形,這時由3號提分配方案,由於3號預見到最後階段的結局,他知道4號會力阻博弈進入最後階段,自己提出的任何方案4號都會同意而保住性命,故3號提出自己得100塊寶石,4號、5號什麼都不得的方案會通過。倒推到剩下4個海盜的情形,這時由2號提分配方案,由於2號預見到下一階段的結局,故2號提出自己得98塊寶石,4號、5號各得1塊寶石,3號什麼都不得的方案會得到4號、5號的同意而通過。倒推到博弈的開始階段,這時由1號提分配方案,由於1號預見到後面各階段的結局,他提出的方案只要有2人支持就能通過。故1號提出自己得97塊寶石,3號得1塊寶石,4號或5號得2塊寶石,2號什麼都不得的方案會得到2個人的同意而通過。這就是在「完全理性」假設下,1號海盜得以通過而又使自己得益最多的分配方案。
10. 博弈論(二):如何突破困境,實現共贏
博弈較量中不是「你輸我贏」的結局,而是共同追求彼此的利益。如果只顧自己單方面的利益,最後導致的問題往往是兩敗俱傷。
博弈論聚焦合作策略,為日常生活中的矛盾紛爭找出最優解。想在博弈中取勝,我們可以通過一些策略,幫助我們去爭取自己的利益。
主要通過兩種方式第一,達成合作協議,第二,讓各方不變卦不作弊。具體方法如下:
1、公平分配 我切你選方法
對於公平的嚮往深植入我們的內心,是我們的動物本能,在面對資源有限的情況下,在和人性抗衡的過程中,想要公平分配「我切你選」能化解這個難題。總結來說,是指一方提出方案,另一方來選擇。當然,這個方案必須基於兩個方案都是均衡的條件。一方擁有分配權,而另一方享受優先選擇權,彼此為了保證自己的利益盡量少受損失,會在分配時就盡量的均衡。
這種方法也叫大中取小原則,就是說在一段博弈中你需要先衡量局勢,考慮各種不同的選擇造成的最大損失或最壞結果是什麼,然後再決定如何讓損失最小化。發展中國家和發達國家發生公海海域糾紛,聯合國就用這種「你切我選」的辦法,確保盡量公平。比如遺產分割,離婚沖突,這種情況下用這種方法能在一定程度上減少損失,如果持久戰則會消耗和損失更多。
2、有爭議的部分平分法
過去一些一夫多妻的部落,丈夫死後,大老婆堅持說自己應該擁有丈夫的全部財產,小老婆說自己擁有一半財產,結果部落長老的判決法為75:25,遵循的原則就是「爭議部分均分法」,就是先處理沒有爭議的部分,在處理有爭議的一部分,所以爭議的部分是小老婆說自己應該擁有一般財產,按平均下來是25:25,再加上原來沒有爭議的部分,結果就是75:25。
3、調整贏家法
基本原理就在於對於同一項資產,不同的人可能會定出不同的價值,假如雙方要劃分所有權,就可以動些手腳,讓雙方感覺自己都拿到超過一半的所有權,達到雙贏的局面。而且不管是什麼情境都能夠適用,這個叫調整贏家法,雙贏。生活中房屋中介賣房常常使用的方法,互相調節,買方會覺得自己買到了便宜的房子,賣主會覺得自己賣的值。
4、石頭剪刀布的應用
如果雙方無法達成共識,那就交給命運吧,用猜拳來決定。博弈雙方同意以隨機方式來解決問題,猜拳不敗重點就在於:找出一個另對方無法預測的隨機出拳策略,就是不要讓對方看出你出拳的套路,這個看似簡單的方法卻非常實用和廣泛應用,雖然簡單卻有很深奧的規律。
日本一家公司要拍賣所收藏的所有印象派畫作,有兩家拍賣行同時競拍,日本公司也不知道把生意交給誰好,便發電子郵件讓兩家拍賣行自己解決,並使用剪刀石頭布方法。生活中常用的足球比賽,開場時裁判用拋硬幣方式來決定哪方先開球。用這樣的方法在博弈中勝敗幾乎都是隨機的,所以很容易被接受。
5、用溝通協商建立聯盟
博弈中常見的解決方式是威脅和獎勵,比如在職場中,領導對於下屬所採用的管理方式常用的就是威脅和獎勵,再比如在父母與孩子的博弈較量中,也是威脅和獎勵,或者強制手段去贏得最終勝利。
溝通是解決問題是本質,而不是靠威脅和獎勵,最有效的是通過溝通和對方建立聯盟,達成合作方案,那遇到的問題基本都能夠得到解決。聯盟建立的關鍵是信任,一旦有了信任,聯盟很容易建立。如果能夠形成聯盟,最終會達成的解決方案就叫作帕累托最優。大家就都能夠沿著這個方式,沿著一套規矩去做,當然如果外部的條件在發生改變、在引入新的博弈方,格局就會發生改變。
6、建立有效的信任機制
我們天生就很難信任他人,因為不信任更接近於我們原始的本性。原始社會,到處都是危險,但如果一個人完全跟別人不合作,也沒法生存下去。信任是原始人類後天發展出來的東西,這個底層邏輯就是不信任是風險導向策略,信任是報酬導向策略。
信任是一種能力,我們要變得明智,並不是放棄相信他人,而是多去了解被騙的案例和套路。我們被騙的成本有限的,因為可以認清一個人一件事,以後避開,但如果一招被蛇咬十年怕井繩因此不信任任何人,那就會失去很多機會,那付出是成本是一輩子的。現在這個年代,很多時候都是需要團隊協作,需要各種各樣的合作,而非單打獨斗,畢竟每個人的能力、時間、精力有限,如果對他人都不信任,則無法達成合作,導致無法在社會上生存。
不管是在生活中還是社會博弈中,如果雙方選擇信任,就能克服困境。但讓彼此信任,並不是一件容易的事情。這樣的情況下,我們可以使用一些增強信任的策略來增強合作的信任感,關於增強信任感的4招:
第一招可信的承諾: 在生活中,父母為鼓勵孩子達成合作,慣用假定條件給予獎勵。比如,假如你成績考到前三名,我將帶你去看海;假如你每天按時運動,我將給多給你50塊錢的零花錢等等。可信的承諾前提是「有效」,比如「去看海」和「多給50元零花錢」實現起來比較容易,但是假如給孩子承諾「把天上的星星摘下來」就超出了可實現的范疇,最終失去了鼓勵合作的效用。
第二招直接信任: 直接信任對方,正所謂,大度能容,讓對方看到我們的合作態度和開放的胸懷,這樣要更容易面對合作中的阻礙,如果保持「你不合作,我也不合作」的態度,並不利於我們在一場博弈中取得預期利益。
第三招潛在的信任培養: 潛在信任需要通過共同的經歷或者事實支撐建立起來。生活中,直接信任的發生概率往往低於潛在信任,所以我們要有意識地培養潛在意識,為自己贏得資源和支持,培養潛在的信任在於「慷慨大方和利他主義」,當我們報以真誠之心和利他思維,最後也將獲得他人的信任而成就自己。
第四招儀式的力量 :為了取得對方的信任,可以將彼此的約定以及限制自己選擇的一些條約或要求等等,通過某種儀式的方式「昭告天下」。古時出征的沙場點兵,除了鼓舞士氣,從另一個層面上來說也是一種建立信任的儀式。帝王通過點兵儀式傳遞決心和支持,將領們立軍令狀將他們的決心傳遞給所有的人。
個人在博弈中扭轉全局的十大要訣
1.贏則守,輸就變。不主動做壞人,也不事事心機,但是人不犯我我不犯人,人若犯我我必犯人。
2.帶入新的參與者。引入另外一方進來,這樣博弈的局面就會改變,三方在一起博弈就能夠互相制衡了。在這樣的局面中要學會退出來讓兩者先博弈,自己成為那個受益者,「螳螂捕蟬,黃雀在後」就是這個道理。
3.建立互惠形式。相信博弈不是一次性的,給自己留一條後路。
4.限制你自己的未來選項,讓自己一旦背叛合作,就會受損失。類似破釜沉舟的方法。
5.付出你的信任。建立信任別人的聲譽,讓別人知道說你有包容度,而且你很重視自己的承諾。
6.定下特殊條件,雙方如果想單方面背叛,就會承受損失。雙方如果想單方面背叛就會承受損失,像現在簽的很多對賭協議,就是這樣的方式。
7.使用補償給付,來建立並維持合作的聯盟。補償的可以是金錢、情感、尊重等,如果能夠找到更多的效用,就能夠引入更多談判籌碼。
8.注意七大困境(具體內容在 博弈論(一):生活無處不博弈 ),考量各參與者的利益與成本,讓困境不復存在。
9.分攤各種責任、工作、懲罰等,讓人人都覺得結果公平。
10.將團隊化整為零。人太多,博弈方過多,博弈變得很復雜,很難擺得平。如果把它們變成一個一個的小團隊,在小團隊之間達成共識可能比較容易產生更高的效率。
天下熙熙攘攘,皆為利來利往,我們個體想要在錯綜復雜的相互影響中取得最優策略,必須要懂得一點博弈論。博弈論很好地給我們提供了一種解決問題的思維方式,博弈論的觀點告訴我們,面對利益的相互制約,最佳的應對策略不是沖突,而是合作,不是競爭,而是互助。