導航:首頁 > 解決方法 > 囚徒困境例子及解決方法

囚徒困境例子及解決方法

發布時間:2022-04-24 05:09:41

什麼是「囚徒困境」,舉出你在社會生活中觀察到的「囚徒困境」的例子。

囚徒困境(prisoner's dilemma)是指兩個被捕的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。

囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護、人際關系等方面,也會頻繁出現類似情況。

例子:北大清華的狀元之爭是一個典型的囚徒困境。囚徒困境是社會合作面臨的最大難題,它深刻揭示了個體理性和集體理性之間的矛盾和沖突:個體按照自身利益最大化的原則採取對自己最有利的占優戰略,得到的卻不一定是自己最想要的結果,相反可能導致集體的非理性。

就生源競爭而言,對於北大來說,無論清華搶不搶狀元,搶狀元都是北大的最好選擇,即最優戰略;對於清華來說也是一樣。

用博弈論的專業術語來表述,(搶狀元,搶狀元)構成了北大清華招生博弈的納什均衡。納什均衡是一個僵局,給定對手不改變行為,自己就沒有激勵改變行為,因而無法打破或單獨偏離均衡。

納什均衡最深刻的悲劇性在於,北大和清華都意識到搶狀元是毫無意義的,但搶狀元卻是他們必然的選擇。

即使兩所大學都認同不搶狀元是最好的,但這個結果卻得不到,因為每所大學都不得不採取對自己最有利的行動——搶狀元。除非引入第三方力量改變博弈結構,否則囚徒困境就不可能被打破。

(1)囚徒困境例子及解決方法擴展閱讀

相關應用:封閉交易

霍夫施塔特曾提出,像囚徒困境一類的問題,若以簡單博弈的形式來說明,人們會較容易理解。例如他以「封閉袋子交易」的簡單博弈來說明此論題:

兩人面對面互相交換封閉的袋子,共同了解其中一方放錢,另一方放商品。雙方可以誠實的依照承諾,把東西放到袋子里交換;又或者交空袋子給對方,選擇背叛。

在這場博弈中,由於背叛可獲得巨大利益,必然有多人選擇背叛。這意味著理性的商人不會進行這種交易,因而「封閉袋子交易」將由於逆向選擇而失去市場。

㈡ 囚徒困境的典型例子

1、警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監1年。

若二人都互相檢舉(相關術語稱互相「背叛」),則二人同樣判監8年。

兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:

若對方沉默時,背叛會讓我獲釋,所以會選擇背叛。

若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑8年。

2、軍備競賽

在政治學中,兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達成削減武器協議(合作)。

兩國都無法肯定對方會遵守協議,因此兩國最終會傾向增加軍備。似乎自相矛盾的是,雖然增加軍備會是兩國的「理性」行為,但結果卻顯得「非理性」(例如會對經濟造成損壞等)。這可視作遏制理論的推論,就是以強大的軍事力量來遏制對方的進攻,以達到和平。

3、關稅戰

兩個國家,在關稅上可以有以兩個選擇:

提高關稅,以保護自己的商品。(背叛)

與對方達成關稅協定,降低關稅以利各自商品流通。(合作)

當一國因某些因素不遵守關稅協定,獨自提高關稅(背叛),另一國也會作出同樣反應(亦背叛),這就引發了關稅戰,兩國的商品失去了對方的市場,對本身經濟也造成損害(共同背叛的結果)。然後二國又重新達成關稅協定(重復博弈的結果是將發現共同合作利益最大)。

4、廣告戰

商業活動中亦會出現各種囚徒困境例子。以廣告競爭為例。

兩個公司互相競爭,二公司的廣告互相影響,即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告,收入增加很少但成本增加。但若不提高廣告質量,生意又會被對方奪走。

此二公司可以有二選擇:

互相達成協議,減少廣告的開支。(合作)

增加廣告開支,設法提升廣告的質量,壓倒對方。(背叛)

若二公司不信任對方,無法合作,背叛成為支配性策略時,二公司將陷入廣告戰,而廣告成本的增加損害了二公司的收益,這就是陷入囚徒困境。在現實中,要二互相競爭的公司達成合作協議是較為困難的,多數都會陷入囚徒困境中。

5、自行車賽

自行車賽事的比賽策略也是一種博弈,而其結果可用囚徒困境的研究成果解釋。例如每年都舉辦的環法自由車賽中有以下情況:選手們在到終點前的路程常以大隊伍(英文:Peloton)方式前進,他們採取這策略是為了令自己不至於太落後,又出力適中。

而最前方的選手在迎風時是最費力的,所以選擇在前方是最差的策略。通常會發生這樣的情況,大家起先都不願意向前(共同背叛),這使得全體速度很慢,而後通常會有二或多位選手騎到前面,然後一段時間內互相交換最前方位置,以分擔風的阻力(共同合作)。

使得全體的速度有所提升,而這時如果前方的其中一人試圖一直保持前方位置(背叛),其他選手以及大隊伍就會趕上(共同背叛)。而通常的情況是,在最前面次數最多的選手(合作)通常會到最後被落後的選手趕上(背叛),因為後面的選手騎在前面選手的沖流之中,比較不費力。

㈢ 「囚徒困境」有哪些現實的例子

先解釋下囚徒困境是什麼

「囚徒困境」是1950年美國蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述,並命名為「囚徒困境」。

囚徒困境(prisoner'sdilemma ):兩個被捕的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇。本身只屬模型性質,但現實中的價格競爭、環境保護、人際關系等方面,也會出現類似情況。

雖然困境本身只屬模型性質,個人做出理性選擇卻往往導致集體的非理性,但現實中也都會頻繁出現類似情況。了解囚徒困境還是有一定現實意義的

㈣ 囚徒困境的生活例子是什麼

一、廣告戰。

兩個公司互相競爭,兩個公司的收益很大程度靠廣告的影響,即一公司的廣告更被顧客接受則會奪取對方的部分收入。

但若兩家公司同時發出質量類似的廣告,收入增加很少但廣告成本增加很大。但若不提高廣告質量,生意又會被對方搶走。

所以兩個公司都會面臨兩個選擇:

1、互相達成協議,減少廣告的開支。(合作)

2、增加廣告開支,設法提升廣告的質量,壓倒對方。(背叛)

若兩家公司不信任對方,無法合作,背叛成為支配性策略時,兩家公司將陷入廣告戰,而廣告成本的增加損害了兩者的收益,這就是陷入囚徒困境。而恰恰在現實中,兩家互相競爭的公司要達成合作協議是較為困難的,多數都會陷入囚徒困境中。

二、碳排放。

這幾年比較火的碳排放話題,降低碳排放可能會直接導致國家發展降速,但如果不降,溫室效應會越來越嚴重,到時影響整個地球生態,結局更嚴重。

那麼誰先帶頭把這個碳排放降下來?每個國家都會思考,如果我們降下來,其他國家不降怎麼辦呢?其他國家如果搭我們的便車,我這邊降低了,他那邊燒,那他財富增加得比我快得多,我這邊成本高了很多怎麼辦?這時候該怎麼樣帶領全世界的人走出囚徒困境,是各個國家領導人所要思考的問題了。

還有很多此類的例子,滴滴與快的在初期打價格戰,不補貼就被淘汰,所以都在拼背後的資本,大家都知道是虧本,但為了搶奪市場都陷入了囚徒困境,與之一致的還有,美團-餓了么,ofo-摩拜單車,風口來的時候各類妖魔鬼怪。

然而與之不同的是,中國的各大快遞公司,因為各個快遞公司的老闆基本都是親戚或者是老鄉,所以在發展過程中達成了一致,就沒有這種惡性競爭,也就沒有陷入囚徒困境。

如何破解囚徒困境:

囚徒困境,說到底是一個承諾問題、信任問題,雙方承諾了,並彼此信任對方會信守承諾,那麼困境也就解開了。信任,是破解囚徒困境的關鍵。

美國著名的行為分析及博弈論專家阿克塞爾羅德通過重復囚徒困境博弈計算機程序奧林匹克競賽實驗研究,提出了互惠策略:即一方首先以合作的姿態對待他者,之後便根據對方的反應而做出選擇,如果對方合作,則合作;如果對方背叛或欺騙,則懲罰或威懾。所以在囚徒困境中,彼此守諾,雙方得到的結果都是最好的。

㈤ 囚徒困境例子

摘要 囚徒困境的例子太多了,以我們成年人的工作為例,如果我選擇加班,那麼升職的機會就是我的,但如果我不選擇加班,而同事選擇加班,那麼升職加薪的機會就是他的

㈥ 《博弈論》里的囚徒困境怎麼解決

當兩個參與者Player同時有對對方的最佳反饋時(即達到納什均衡,也就是同時認罪),就可以得到囚徒困境的最佳結果。

其實兩個囚犯如果都否認犯罪,那麼便能獲得最少的判刑。但是兩個囚犯都在關在不同的地方,雙方也無法碰面,所以無法確信對方是否會背叛自己。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低,所以二人的理性思考都會得出相同的結論——選擇背叛。

因此,這場博弈中只有一種可能能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑8年。

相關如下

囚徒困境經典例子

1950年,由就職於蘭德公司的梅里爾·弗勒德(MerrillFlood)和梅爾文·德雷希爾(MelvinDresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(AlbertTucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監1年。

若二人都互相檢舉(相關術語稱互相「背叛」),則二人同樣判監8年。

㈦ 什麼是囚徒困境

一件嚴重的縱火案發生後,警察在現場抓到兩個犯罪嫌疑人。事實上,正是他們一起放火燒了這座倉庫。但是,警方沒有掌握足夠的證據,只得把他們隔離囚禁起來,要求他們坦白交代。

在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥——即與警察合作,從而背叛他的同夥;或者保持沉默——也就是與他的同夥合作,而不是與警察合作。這兩個囚犯都知道,如果他倆都能保持沉默的話,就都會被釋放,因為只要他們拒不承認,警方無法給他們定罪。

但警方也很明白這一點,所以就決定對兩個囚犯來點刺激:如果他們都承認縱火,每人將被判入獄3年;如果他們都不承認,每人將因為缺乏證據而都被釋放:如果一個抵賴而另一個坦白並且願意出來作證,那麼抵賴的將被判入獄5年,還要對他施以罰款,而坦白者將被寬大處理——釋放,同時還可以得到一筆獎金。

那麼,這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?

從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果:自由。但他們不得不仔細考慮對方可能採取什麼選擇。

A犯不是個傻子,他根本無法相信同夥不會向警方提供對他不利的證據,然後帶著一筆豐厚的獎賞出獄而去,讓他獨自坐牢。這種想法的誘惑力實在太大了。但他也意識到,他的同夥也不是傻子,也會同樣來這樣設想他。

所以A犯的結論是,唯一理性的選擇就是背叛同夥,把一切都告訴警方,因為如果他的同夥笨得只會保持沉默,那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向警方交代了,那麼,A犯反正也得服審,起碼他不必服最重的刑。

一番博弈的結果就是。這兩個囚犯按照自己的邏輯做出行動,雙雙坐牢。

上面的故事反應了人們的一種博弈心理,它在心理學上被稱作「囚徒困境」,最早是由美國普林斯頓大學的數學家增克於1950年提出來的。他當時創造出這樣一個故事是為了向美國斯坦福大學的一群心理學家們解釋什麼是博弈論。後來,「囚徒困境」演繹出許多版本,成為博弈論中最著名的案例。

「囚徒困境」告訴我們,在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。

在大家都非常熟悉的國內的家電大戰中,雖然不是兩個對手之間的博弈,但由於在眾多對手當中,每一方的市場份額都很大,每一個主體人的行為後果受對手行為的影響都很大,因此,其情景大概也是如此。

因而,如果清楚這種前景,雙方勾結或合作起來,都實行比較高的價格,那麼雙方都可以因為避免價格大戰而獲得較高的利潤。有人把這樣一種合作的做法,叫做「雙贏對局」。而這樣的結果,往往雙方將都是「雙贏對局」的贏家。

可惜這些聯盟也往往處於利益驅動的「囚徒困境」。而雙贏也就成為泡影。五花八門的價格聯盟總是非常短命,道理就在這里。

在囚徒困境中,雙方不約而同地選擇背叛而坐牢,一方面的原因是與同夥合作的懲罰遠遠高於所得到的報酬,另一方面也由於這是在信息不透明的情況下進行的一次性決策,不存在更多的後果或者後續的博弈。

舉例來說,在公共汽車上,兩個陌生人會為一個座位爭吵,如果他們認識,可能就會相互謙讓。在夜市地攤、車站和旅遊景點等人群流動性大的地方,不但商品和服務質量最差,而且假冒偽劣橫行,因為在商家和顧客之間沒有後續的博弈,顧客不大可能因為飯菜可口而再次光臨。既然是一錘子買賣,不賺白不賺。

也正是這種心理所驅使,如果一廂情願地選擇合作就要受到懲罰。約翰遜總統在向一群商業界頭面人物說明需要大量資金同前蘇聯進行導彈競賽時,曾經通過下面這個故事來說明這個道理:

1861年,一位得克薩斯州人離家前去參加南軍士兵陣營。他告訴他的鄰居他很快就會回來,這場戰爭不會費力:「因為我們能用掃帚柄揍這些北方佬。」兩年後,他才重返故里,少了一條腿。

他的鄰居向這位神情悲慘、衣衫襤褸的傷兵詢問到底發生了什麼事:「你不是說過戰爭不費力,你們能用掃帚柄揍這些北方佬嗎?」

這位士兵回答:「我們當然能,但是麻煩在於北方佬不用掃帚打仗。」

可是在生活中的大部分情境中,人與人之間都會存在一些後續的接觸和博弈。那麼在這種情況下,我們又應該如何決策呢?

顯然,一味地以德報怨不可取,因為這樣只是將別人的人生成本轉嫁到自己頭上;而一味地以怨報德也不可取,因為這樣將慢慢失去大多數的博弈夥伴和機會。

所以,最好的決策方法還是囚徒困境教給我們的:以德報德、以怨報怨的反射決策。

事實上,這也是日常生活中多數人的理性選擇,也是一個很具適應性的規則。它的有效是由於其他規則預料到它的存在,並且被設計得與它很好相處。因為要和「反射決策」很好相處,就必須採取合作態度,即使那些伺機佔便宜而不被懲罰的規則,也很快改變,因為任何想占「反射決策」便宜的規則最終將傷害自己。

要使這一決策方式發生作用,必須滿足以下條件:

特徵是顯著而且容易識別的;

一旦被識別出來,就必須使對方明白會對一切背叛進行報復,並且使對方很難解脫。

數學家約翰·馮諾依曼曾說過:「在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。」

總之,反射決策能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。

㈧ 囚徒困境的生活例子有哪些。

如下:

1、比如香水,你無論用多少形容詞來描述你的香水,買家都沒法判斷它究竟是個什麼味道。所以香水品牌喜歡在雜志中提供小樣。當然,香水你只要買回來,還是可以馬上知道它的味道的。還有些商品,你買回來用了,依然很難做出評估。

2、比如減肥產品,買家無論如何事先都很難評估它的效果的,而且買回來也要過很長一段時間才能做出評估。其他比如以耐用性為主要賣點的商品,也有同樣的問題。於是「無效退款」,「延長保質期」等等承諾,都可以成為賣家發出的信號。

介紹

「囚徒困境」是個博弈理論的一個模型,它對於賣家來說,有實戰的意義。天貓,京東,亞馬遜,風水輪流轉,游戲規則常常變。伴隨著電商環境的流轉和變化,很多「干貨」很快就變得沒用了。

但是也有一些理論知識,不管中國的電商怎麼變,它都會一直發光,一直能給你帶來新的洞察和靈感。這樣的理論和知識,還是要好好研究一下。

㈨ 舉例說明囚徒困境

囚徒困境出現在非合作博弈上,比如說兩個人搶劫了一家金店,同時被逮了起來,由於是非合作博弈,所以在他們受審之前沒有謀劃,兩人在不同的地方受審問時,被告知如下內容:如果兩人都坦白,則兩人被關6年,如果一人坦白一人狡辯則坦白的人釋放,狡辯的人關10年,如果兩個人都狡辯那各自判兩年。對於這兩個犯人他們該如何選擇?最佳答案是兩個人都坦白。經濟學原理的一個基本假設是人都是理性的經濟人(即以自己的最大利益為出發點),針對這個問題,他們由於之前沒有進行合作(共謀),所以他們的考慮都是從自己的利益出發的,這兩個犯人假定為甲乙,從甲來看:自己如果坦白,乙也坦白那就是6年。如果乙部坦白,那麼自己無罪釋放。處於自己的利益,甲是不肯狡辯的,因為如此做可能會判10年。乙和甲一樣,從自己利益出發,也坦白了,2人都被關了6年。這就是很經典的囚徒困境例子,給分吧

㈩ 怎樣解決囚徒困境

從所給條件,我們可以判斷出該博弈為一個完全信息的靜態重復博弈。(這肯定是個反復進行的重復博弈,因為單次的囚徒困境只會導致雙方選擇納什均衡,即均不合作)
題設條件告訴我們彼此信息不透明也不能互相了解,我們將其理解為雙方在每次決策之前是不能交流的,但是雙方對於在上一輪次決策之後的得益是知道的,這就是完全信息,雙方可以根據自己的選擇和得益分析對方的選擇及想法。
如果我們排除完全信息的假設,這道題應該是無解的。
既然雙方知道博弈會進行多次,所以會覺得進行具有風險性的合作決策也無妨,當然這與博弈的次數也有關系。
當一方選擇合作時,如果裁判告訴他這輪的得益是最好的得益,那麼他便知道對方也選擇了合作,如果裁判告訴他這輪他得到了比雙方不合作時更差的收益,則他會明白對方選擇的是不合作。
這個原理明白之後,我們就該討論到底雙方該採取怎樣的策略原則去進行他們的策略選擇從而使雙方合作的機會增加。

答案是先人給出的,經過多年的計算機測試以及各種研究發現,
最優的策略叫做tit for tat,一報還一報策略。
即決策方在第一輪選擇合作,其後每輪決策與對手的上輪決策相同,對手合作,我下輪就合作,對手背叛我下輪就背叛。

這樣的報復性決策其實目的是為了警告對手,讓對手趨於多選擇合作。

說的比較粗略,例子也來不及舉了,要睡覺了。

推薦你看馮諾依曼的《囚徒的困境》一書,其中對該問題有十分詳細的敘述。

閱讀全文

與囚徒困境例子及解決方法相關的資料

熱點內容
中式棉襖製作方法圖片 瀏覽:63
五菱p1171故障碼解決方法 瀏覽:858
男士修護膏使用方法 瀏覽:546
電腦圖標修改方法 瀏覽:607
濕氣怎麼用科學的方法解釋 瀏覽:538
910除以26的簡便計算方法 瀏覽:805
吹東契奇最簡單的方法 瀏覽:704
對腎臟有好處的食用方法 瀏覽:99
電腦四線程內存設置方法 瀏覽:513
數字電路通常用哪三種方法分析 瀏覽:15
實訓課程的教學方法是什麼 瀏覽:525
苯甲醇乙醚鑒別方法 瀏覽:83
蘋果手機微信視頻聲音小解決方法 瀏覽:700
控制箱的連接方法 瀏覽:75
用什麼簡單的方法可以去痘 瀏覽:789
快速去除甲醛的小方法你知道幾個 瀏覽:803
自行車架尺寸測量方法 瀏覽:124
石磨子的製作方法視頻 瀏覽:152
行善修心的正確方法 瀏覽:403
土豆燉雞湯的正確方法和步驟 瀏覽:276