导航:首页 > 解决方法 > 囚徒困境例子及解决方法

囚徒困境例子及解决方法

发布时间:2022-04-24 05:09:41

什么是“囚徒困境”,举出你在社会生活中观察到的“囚徒困境”的例子。

囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

例子:北大清华的状元之争是一个典型的囚徒困境。囚徒困境是社会合作面临的最大难题,它深刻揭示了个体理性和集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是自己最想要的结果,相反可能导致集体的非理性。

就生源竞争而言,对于北大来说,无论清华抢不抢状元,抢状元都是北大的最好选择,即最优战略;对于清华来说也是一样。

用博弈论的专业术语来表述,(抢状元,抢状元)构成了北大清华招生博弈的纳什均衡。纳什均衡是一个僵局,给定对手不改变行为,自己就没有激励改变行为,因而无法打破或单独偏离均衡。

纳什均衡最深刻的悲剧性在于,北大和清华都意识到抢状元是毫无意义的,但抢状元却是他们必然的选择。

即使两所大学都认同不抢状元是最好的,但这个结果却得不到,因为每所大学都不得不采取对自己最有利的行动——抢状元。除非引入第三方力量改变博弈结构,否则囚徒困境就不可能被打破。

(1)囚徒困境例子及解决方法扩展阅读

相关应用:封闭交易

霍夫施塔特曾提出,像囚徒困境一类的问题,若以简单博弈的形式来说明,人们会较容易理解。例如他以“封闭袋子交易”的简单博弈来说明此论题:

两人面对面互相交换封闭的袋子,共同了解其中一方放钱,另一方放商品。双方可以诚实的依照承诺,把东西放到袋子里交换;又或者交空袋子给对方,选择背叛。

在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。

㈡ 囚徒困境的典型例子

1、警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。

若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。

两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

若对方沉默时,背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

2、军备竞赛

在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。

两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

3、关税战

两个国家,在关税上可以有以两个选择:

提高关税,以保护自己的商品。(背叛)

与对方达成关税协定,降低关税以利各自商品流通。(合作)

当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定(重复博弈的结果是将发现共同合作利益最大)。

4、广告战

商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

此二公司可以有二选择:

互相达成协议,减少广告的开支。(合作)

增加广告开支,设法提升广告的质量,压倒对方。(背叛)

若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

5、自行车赛

自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。

而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作)。

使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

㈢ “囚徒困境”有哪些现实的例子

先解释下囚徒困境是什么

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

囚徒困境(prisoner'sdilemma ):两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会出现类似情况。

虽然困境本身只属模型性质,个人做出理性选择却往往导致集体的非理性,但现实中也都会频繁出现类似情况。了解囚徒困境还是有一定现实意义的

㈣ 囚徒困境的生活例子是什么

一、广告战。

两个公司互相竞争,两个公司的收益很大程度靠广告的影响,即一公司的广告更被顾客接受则会夺取对方的部分收入。

但若两家公司同时发出质量类似的广告,收入增加很少但广告成本增加很大。但若不提高广告质量,生意又会被对方抢走。

所以两个公司都会面临两个选择:

1、互相达成协议,减少广告的开支。(合作)

2、增加广告开支,设法提升广告的质量,压倒对方。(背叛)

若两家公司不信任对方,无法合作,背叛成为支配性策略时,两家公司将陷入广告战,而广告成本的增加损害了两者的收益,这就是陷入囚徒困境。而恰恰在现实中,两家互相竞争的公司要达成合作协议是较为困难的,多数都会陷入囚徒困境中。

二、碳排放。

这几年比较火的碳排放话题,降低碳排放可能会直接导致国家发展降速,但如果不降,温室效应会越来越严重,到时影响整个地球生态,结局更严重。

那么谁先带头把这个碳排放降下来?每个国家都会思考,如果我们降下来,其他国家不降怎么办呢?其他国家如果搭我们的便车,我这边降低了,他那边烧,那他财富增加得比我快得多,我这边成本高了很多怎么办?这时候该怎么样带领全世界的人走出囚徒困境,是各个国家领导人所要思考的问题了。

还有很多此类的例子,滴滴与快的在初期打价格战,不补贴就被淘汰,所以都在拼背后的资本,大家都知道是亏本,但为了抢夺市场都陷入了囚徒困境,与之一致的还有,美团-饿了么,ofo-摩拜单车,风口来的时候各类妖魔鬼怪。

然而与之不同的是,中国的各大快递公司,因为各个快递公司的老板基本都是亲戚或者是老乡,所以在发展过程中达成了一致,就没有这种恶性竞争,也就没有陷入囚徒困境。

如何破解囚徒困境:

囚徒困境,说到底是一个承诺问题、信任问题,双方承诺了,并彼此信任对方会信守承诺,那么困境也就解开了。信任,是破解囚徒困境的关键。

美国着名的行为分析及博弈论专家阿克塞尔罗德通过重复囚徒困境博弈计算机程序奥林匹克竞赛实验研究,提出了互惠策略:即一方首先以合作的姿态对待他者,之后便根据对方的反应而做出选择,如果对方合作,则合作;如果对方背叛或欺骗,则惩罚或威慑。所以在囚徒困境中,彼此守诺,双方得到的结果都是最好的。

㈤ 囚徒困境例子

摘要 囚徒困境的例子太多了,以我们成年人的工作为例,如果我选择加班,那么升职的机会就是我的,但如果我不选择加班,而同事选择加班,那么升职加薪的机会就是他的

㈥ 《博弈论》里的囚徒困境怎么解决

当两个参与者Player同时有对对方的最佳反馈时(即达到纳什均衡,也就是同时认罪),就可以得到囚徒困境的最佳结果。

其实两个囚犯如果都否认犯罪,那么便能获得最少的判刑。但是两个囚犯都在关在不同的地方,双方也无法碰面,所以无法确信对方是否会背叛自己。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低,所以二人的理性思考都会得出相同的结论——选择背叛。

因此,这场博弈中只有一种可能能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

相关如下

囚徒困境经典例子

1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。

若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。

㈦ 什么是囚徒困境

一件严重的纵火案发生后,警察在现场抓到两个犯罪嫌疑人。事实上,正是他们一起放火烧了这座仓库。但是,警方没有掌握足够的证据,只得把他们隔离囚禁起来,要求他们坦白交代。

在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙——即与警察合作,从而背叛他的同伙;或者保持沉默——也就是与他的同伙合作,而不是与警察合作。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。

但警方也很明白这一点,所以就决定对两个囚犯来点刺激:如果他们都承认纵火,每人将被判入狱3年;如果他们都不承认,每人将因为缺乏证据而都被释放:如果一个抵赖而另一个坦白并且愿意出来作证,那么抵赖的将被判入狱5年,还要对他施以罚款,而坦白者将被宽大处理——释放,同时还可以得到一笔奖金。

那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?

从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他根本无法相信同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会同样来这样设想他。

所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服审,起码他不必服最重的刑。

一番博弈的结果就是。这两个囚犯按照自己的逻辑做出行动,双双坐牢。

上面的故事反应了人们的一种博弈心理,它在心理学上被称作“囚徒困境”,最早是由美国普林斯顿大学的数学家增克于1950年提出来的。他当时创造出这样一个故事是为了向美国斯坦福大学的一群心理学家们解释什么是博弈论。后来,“囚徒困境”演绎出许多版本,成为博弈论中最着名的案例。

“囚徒困境”告诉我们,在一个存在着相互作用的博弈中,最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。

在大家都非常熟悉的国内的家电大战中,虽然不是两个对手之间的博弈,但由于在众多对手当中,每一方的市场份额都很大,每一个主体人的行为后果受对手行为的影响都很大,因此,其情景大概也是如此。

因而,如果清楚这种前景,双方勾结或合作起来,都实行比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润。有人把这样一种合作的做法,叫做“双赢对局”。而这样的结果,往往双方将都是“双赢对局”的赢家。

可惜这些联盟也往往处于利益驱动的“囚徒困境”。而双赢也就成为泡影。五花八门的价格联盟总是非常短命,道理就在这里。

在囚徒困境中,双方不约而同地选择背叛而坐牢,一方面的原因是与同伙合作的惩罚远远高于所得到的报酬,另一方面也由于这是在信息不透明的情况下进行的一次性决策,不存在更多的后果或者后续的博弈。

举例来说,在公共汽车上,两个陌生人会为一个座位争吵,如果他们认识,可能就会相互谦让。在夜市地摊、车站和旅游景点等人群流动性大的地方,不但商品和服务质量最差,而且假冒伪劣横行,因为在商家和顾客之间没有后续的博弈,顾客不大可能因为饭菜可口而再次光临。既然是一锤子买卖,不赚白不赚。

也正是这种心理所驱使,如果一厢情愿地选择合作就要受到惩罚。约翰逊总统在向一群商业界头面人物说明需要大量资金同前苏联进行导弹竞赛时,曾经通过下面这个故事来说明这个道理:

1861年,一位得克萨斯州人离家前去参加南军士兵阵营。他告诉他的邻居他很快就会回来,这场战争不会费力:“因为我们能用扫帚柄揍这些北方佬。”两年后,他才重返故里,少了一条腿。

他的邻居向这位神情悲惨、衣衫褴褛的伤兵询问到底发生了什么事:“你不是说过战争不费力,你们能用扫帚柄揍这些北方佬吗?”

这位士兵回答:“我们当然能,但是麻烦在于北方佬不用扫帚打仗。”

可是在生活中的大部分情境中,人与人之间都会存在一些后续的接触和博弈。那么在这种情况下,我们又应该如何决策呢?

显然,一味地以德报怨不可取,因为这样只是将别人的人生成本转嫁到自己头上;而一味地以怨报德也不可取,因为这样将慢慢失去大多数的博弈伙伴和机会。

所以,最好的决策方法还是囚徒困境教给我们的:以德报德、以怨报怨的反射决策。

事实上,这也是日常生活中多数人的理性选择,也是一个很具适应性的规则。它的有效是由于其他规则预料到它的存在,并且被设计得与它很好相处。因为要和“反射决策”很好相处,就必须采取合作态度,即使那些伺机占便宜而不被惩罚的规则,也很快改变,因为任何想占“反射决策”便宜的规则最终将伤害自己。

要使这一决策方式发生作用,必须满足以下条件:

特征是显着而且容易识别的;

一旦被识别出来,就必须使对方明白会对一切背叛进行报复,并且使对方很难解脱。

数学家约翰·冯诺依曼曾说过:“在一个存在着相互作用的博弈中,最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。”

总之,反射决策能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。

㈧ 囚徒困境的生活例子有哪些。

如下:

1、比如香水,你无论用多少形容词来描述你的香水,买家都没法判断它究竟是个什么味道。所以香水品牌喜欢在杂志中提供小样。当然,香水你只要买回来,还是可以马上知道它的味道的。还有些商品,你买回来用了,依然很难做出评估。

2、比如减肥产品,买家无论如何事先都很难评估它的效果的,而且买回来也要过很长一段时间才能做出评估。其他比如以耐用性为主要卖点的商品,也有同样的问题。于是“无效退款”,“延长保质期”等等承诺,都可以成为卖家发出的信号。

介绍

“囚徒困境”是个博弈理论的一个模型,它对于卖家来说,有实战的意义。天猫,京东,亚马逊,风水轮流转,游戏规则常常变。伴随着电商环境的流转和变化,很多“干货”很快就变得没用了。

但是也有一些理论知识,不管中国的电商怎么变,它都会一直发光,一直能给你带来新的洞察和灵感。这样的理论和知识,还是要好好研究一下。

㈨ 举例说明囚徒困境

囚徒困境出现在非合作博弈上,比如说两个人抢劫了一家金店,同时被逮了起来,由于是非合作博弈,所以在他们受审之前没有谋划,两人在不同的地方受审问时,被告知如下内容:如果两人都坦白,则两人被关6年,如果一人坦白一人狡辩则坦白的人释放,狡辩的人关10年,如果两个人都狡辩那各自判两年。对于这两个犯人他们该如何选择?最佳答案是两个人都坦白。经济学原理的一个基本假设是人都是理性的经济人(即以自己的最大利益为出发点),针对这个问题,他们由于之前没有进行合作(共谋),所以他们的考虑都是从自己的利益出发的,这两个犯人假定为甲乙,从甲来看:自己如果坦白,乙也坦白那就是6年。如果乙部坦白,那么自己无罪释放。处于自己的利益,甲是不肯狡辩的,因为如此做可能会判10年。乙和甲一样,从自己利益出发,也坦白了,2人都被关了6年。这就是很经典的囚徒困境例子,给分吧

㈩ 怎样解决囚徒困境

从所给条件,我们可以判断出该博弈为一个完全信息的静态重复博弈。(这肯定是个反复进行的重复博弈,因为单次的囚徒困境只会导致双方选择纳什均衡,即均不合作)
题设条件告诉我们彼此信息不透明也不能互相了解,我们将其理解为双方在每次决策之前是不能交流的,但是双方对于在上一轮次决策之后的得益是知道的,这就是完全信息,双方可以根据自己的选择和得益分析对方的选择及想法。
如果我们排除完全信息的假设,这道题应该是无解的。
既然双方知道博弈会进行多次,所以会觉得进行具有风险性的合作决策也无妨,当然这与博弈的次数也有关系。
当一方选择合作时,如果裁判告诉他这轮的得益是最好的得益,那么他便知道对方也选择了合作,如果裁判告诉他这轮他得到了比双方不合作时更差的收益,则他会明白对方选择的是不合作。
这个原理明白之后,我们就该讨论到底双方该采取怎样的策略原则去进行他们的策略选择从而使双方合作的机会增加。

答案是先人给出的,经过多年的计算机测试以及各种研究发现,
最优的策略叫做tit for tat,一报还一报策略。
即决策方在第一轮选择合作,其后每轮决策与对手的上轮决策相同,对手合作,我下轮就合作,对手背叛我下轮就背叛。

这样的报复性决策其实目的是为了警告对手,让对手趋于多选择合作。

说的比较粗略,例子也来不及举了,要睡觉了。

推荐你看冯诺依曼的《囚徒的困境》一书,其中对该问题有十分详细的叙述。

阅读全文

与囚徒困境例子及解决方法相关的资料

热点内容
中式棉袄制作方法图片 浏览:65
五菱p1171故障码解决方法 浏览:858
男士修护膏使用方法 浏览:547
电脑图标修改方法 浏览:608
湿气怎么用科学的方法解释 浏览:539
910除以26的简便计算方法 浏览:806
吹东契奇最简单的方法 浏览:705
对肾脏有好处的食用方法 浏览:100
电脑四线程内存设置方法 浏览:514
数字电路通常用哪三种方法分析 浏览:17
实训课程的教学方法是什么 浏览:527
苯甲醇乙醚鉴别方法 浏览:84
苹果手机微信视频声音小解决方法 浏览:701
控制箱的连接方法 浏览:75
用什么简单的方法可以去痘 浏览:789
快速去除甲醛的小方法你知道几个 浏览:805
自行车架尺寸测量方法 浏览:125
石磨子的制作方法视频 浏览:153
行善修心的正确方法 浏览:403
薯仔炖鸡汤的正确方法和步骤 浏览:276