You are on page 1of 2

项⽬目名称: 计算机寻找囚徒困境模型中的“纳什什均衡点”

项⽬目背景:“囚徒困境”是⼀一种带有博弈性质的⼼心理理活动,体现了了个⼈人理理性和集体理理性、
个⼈人主义和道德主义的关系。⾏行行为主体⾯面临选择的两难境地时,往往会趋向于考虑相
对利利⼰己但是不不利利于集体最⼤大利利益的⽅方式。虽然这种困境本身只是属于模型的性质,但
现实中的价格竞争、环境保护等⽅方⾯面,也会频繁出现类似情况。例例如市场化条件下常
⻅见的关税战和⼴广告战等,企业家在制定经营策略略时更更多的是衡量量⾃自身的损失最⼩小化,
⽽而不不是寻求合作以维护集体利利益。针对这⼀一困境,阿克塞尔罗德(Robert Axelrod)提
出互惠策略略以更更好地整合个体资源,达到“1+1>2”的整体效益最⼤大化的⽬目标。

囚徒困境(Prisoner's Dilemma)是博弈论的⾮非零和博弈中具代表性的例例⼦子,反映个⼈人最
佳选择并⾮非团体最佳选择。或者说在⼀一个群体中,个⼈人做出理理性选择却往往导致集体
的⾮非理理性。

来源

囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不不同的屋⼦子⾥里里接受
审讯。警察知道两⼈人有罪,但缺乏⾜足够的证据。警察告诉每个⼈人:如果两⼈人都抵赖,
各判刑⼀一年年;如果两⼈人都坦⽩白,各判⼋八年年;如果两⼈人中⼀一个坦⽩白⽽而另⼀一个抵赖,坦⽩白
的放出去,抵赖的判⼗十年年。于是,每个囚徒都⾯面临两种选择:坦⽩白或抵赖。然⽽而,不不
管同伙选择什什么,每个囚徒的最优选择是坦⽩白:如果同伙抵赖、⾃自⼰己坦⽩白的话放出去,
抵赖的话判⼀一年年,坦⽩白⽐比不不坦⽩白好;如果同伙坦⽩白、⾃自⼰己坦⽩白的话判⼋八年年,⽐比起抵赖
的判⼗十年年,坦⽩白还是⽐比抵赖的好。

项⽬目内容:囚徒困境的⼀一般公式:
PD = T > R > P > S,即囚徒困境博弈中任⼀一⽅方参与者的收益应符合“单⽅方背叛”> “双
⽅方合作”> “双⽅方背叛”。

You might also like