Professional Documents
Culture Documents
博弈论中理性人假设的困境
博弈论中理性人假设的困境
016
经济学家 …… !""#$ %
博弈论中
理性人假设的困境
!潘天群
; 南京大学哲学系,江苏 南京 <899"= >
“博弈参与人是理性的”是博弈论的公设,然而理性人假定存在许多博弈
困境。囚徒困境与公共地悲剧反映的是个体理性与集体理性之间的冲突;纽
科姆难题 (?’0-+.@ #(+@$’.)体现了理性人使用占优策略原则与最大期望效
用原则时的两难;最后通牒博弈与蜈蚣博弈则表现了理性参与人选择过程是
理性的而结果是非理性的,其中蜈蚣博弈悖论又称为逆向归纳法悖论;而投
票悖论则反映了群体建立加总群体偏好的理性规则的限度。
关键词:博弈论 理性人假设 困境
中图分类号:A98 文献标识码:B 文章编号:
899=—:C:C ; <99= > 9D—99""—9C
一、个体理性与集体理性的冲突
一个熟知的博弈困境是囚徒博弈。囚徒困境 (5(*6+,’(6 7 1*$’..%)是这样
一个博弈:两个囚徒被警察抓住后单独关押,警察给他们的政策是 “坦白从
宽,抗拒从严”。每个囚徒均面临着两个策略选择“招认”和“不招认”。如果一
方 “招认”,另外一方 “不招认”,招认方无罪释放,不招认方将被重判 (比如 89
年);如果双方均 “招认”,因无立功表现,每人均被判刑 (如 : 年),而如果每人
均 “不招认”,警察抓不到足够的证据证明以前的犯罪,只能对他们目前所犯
的罪进行惩戒(如判刑半年)。
这个博弈中,两个囚徒均会选择 “招认”,因为无论对方选择什么策略,自
己选择“招认”是占优策略(1+.*,%,) 6)(%)’2&)。双方均选择“招认”的策略组合
! "" !
!"#$#%&’( …… !""#$ %
二、理性原则间的冲突 根据占优策略原则,你应当选择“取两个盒子
"<=# 年,物理学家威廉・纽科姆 (?+,,+%/ 的策略”。因为,神的预测是过去做出的。G 号盒子
$2@75/-)提出了一个策略选择难题。哲学家诺齐 里的钱的多少是不可更改的,与你现在的选择无
! "## !
经济学家 …… !""#$ %
! "#" !
!"#$#%&’( …… !""#$ %
归纳推理,其推理是演绎的,即结论是必然的。我 在这个例子中,我们看到,人的理性程度与其
衡。 使自己的收益最大的人,而在最后通牒博弈中,越
有这样一个动态博弈——
— 7、8 两个人分 "## 理性的人得到的利益越低。
元钱。规则规定:7 提出方案,8 对之进行表决。如 理性的人得益低的另一个例子是 “蜈蚣博
果 8 对 7 提出的方案表示同意的话,7、8 就按照 弈”。蜈蚣博弈也是动态博弈,蜈蚣博弈所反映的
7 提出的方案进行分配,如果 8 不同意 7 的方 问题被称为“逆向归纳法悖论”。蜈蚣博弈是由罗
案,那么 7 和 8 均将一无所有。这是一个完全且 森塞尔 @ A2B6/1:(3 C 提出的。它是指这样一个博弈:
完美信息动态博弈 (-9/(4.) 5(46 +.1: ;6,<6)1 (/- 两个参与者 7、8 轮流进行策略选择:可供选择的
)24;3616 ./<2,4(1.2/)。让我们分析这个过程。 策略有“合作”和“不合作”两种。假定 7 先进行策
7 提出方案时,他知道 8 是理性人。8 的行为 略选择,然后是 8,接着是 7,如此交替进行。7、8
是可被 7 预测的。7 将提出这么一个方案:7 和 8 之间的博弈的可 能次数为一有限次,比 如 "=D
的所得比例为 ==% ==:#% #",即给 8 留 " 分钱,而 次。这个博弈的博弈树如下:
将其余 == 元 = 角 = 分留给自己。此时 8 面临“同 7) 8 ) 7 ) ……7 8 ) @ "##E "## C
/) /) /) /) /)
意”和“不同意”的选择:如果 8“同意”,8 所得为 "
@ "E " C @ #E F C @ $E $ C @ ==E == C @ =DE "#" C
分钱;如果 8“不同意”,他将一无所得。理性的 8
将选择 “同意 ” ——
— 这个选择是 7 所能够预测 上图中,“)”表示 “合作”策略,“/)”表示 “不合
的。 作”策略。
! "#$ !
经济学家 …… !""#$ %
这个博弈的特点是,只要有人选择 “不合作” 的。
策略,该博弈即告结束。因博弈树的形状像一只 许多博弈论专家认为,蜈蚣博弈所反映的不
蜈蚣% 因而被命名成蜈蚣博弈。在蜈蚣博弈中参 是悖论,逆向归纳法作为求解动态博弈的方法是
与人 &、’ 是如何进行策略选择的? 有效的,尽管用这样的方法求得的结果不是我们
根据逆向归纳法,在博弈的最后一步即第 所期望的,但它是均衡结果,是完全理性的参与人
"() 步:’ 在 “合作”和 “不合作”之间作选择时,因 的博弈结果。
“合作”给 ’ 带来 "## 的收益,而 “不合作”带来 本文认为,该蜈蚣博弈所反映的不是悖论,而
"#" 的收益,根据理性人的假定,’ 会选择 “不合 是过程理性与结果理性之间的冲突,即每个参与
作”。在第 "() 步 ’ 选择 “不合作”的结论是 &、’ 人选择过程均是理性的,但结果却是不合理的。该
之间的公共知识。但是,要经过第 "(* 步才到第 困境反映的是多主体交互作用 (+,-./01-+2,)下个
"() 步,在 "(* 步,& 考虑到 ’ 在第 "() 步时会选 体理性的局限。
择“不合作”——
— 此时 & 的收益是 (),小于 ’ 合作
时的 "##——
— 那么在第 "(* 步,他的最优策略是 四、加总群体偏好的理性
“不合作”——
— 因为 “不合作”的收益 (( 大于 “合 规则的缺陷
作”的收益 ()。……如此推论下去。最后的结论
投票博弈 (32-+,4 405.)是一种特殊的博弈。
是:在第一步 & 将选择 “不合作”策略,这构成子
在投票博弈中,每个投票人对候选人或者候选方
博弈纳什均衡。在这点上,&、’ 各自的收益均为
案存在着偏好,并且可以对之进行排序。一个理性
",远远小于大家都采取 “合作”的策略时的收益: 人组成的群体在加总个体的选择时存在理性的方
&:"##,’:"##。 法吗?
根据逆向归纳法推得的结果是令人悲伤的, 对于理性,研究社会选择的经济学家一般将
从逻辑推理来看,逆向归纳法是严密的。但结论 之定义在偏好关系上。理性的偏好关系,体现在关
是违反直觉的。直觉告诉我们,一开始就停止的 于偏好关系“%(弱优于)”的两个基本假设即完备
策略只能获取 ",而采取合作性策略有可能获取 性和传递性之中。具体地说,如果%满足:(")完
"##,当然 & 一开始采取合作性策略有可能获得 备性。任何两个备选对象 0,6,它们的关系是或者
#,但 " 或者 # 与 "## 相比实在是太小了。直觉告 0%6,或者 6%0。二者必居其一。(7)传递性假
诉我们采取“合作”策略是好的。而从逻辑的角度 定。对于任意的三个备选对象,如果 0%6,6%1,
看,& 一开始应选择“不合作”的策略。是逆向归纳 那么 0%1。则称偏好关系%是理性的。
法错了,还是直觉错了?似乎逆向归纳法不正确。 阿罗将这两个假定看作公理。满足完备性假
然而,我们会发现,即使双方开始均采取合作策 定的偏好关系被他称为连通关系 (12,,.1-.8 ),满
略,这种合作不会坚持到最后一步。理性的人出 足传递性偏好关系被他称为传递性的
于自身利益的考虑,肯定在某一步采取不合作策 (-/0,9+-+3.)。然而,当群体加总各个个体的偏好关
略。逆向归纳法肯定在某一步要起作用。此时只 系时,会出现不合理的结果。孔多塞投票悖论反映
要逆向归纳法起作用,合作便不能进行下去。因 了这种不合理性。
此,我们不能怀疑逆向归纳法的合理性,它的推理 举一个例子。假定有 $ 个群体,他们对备选方
过程严密,符合逻辑。然而如果我们用逆向归纳 案 &,’,: 进行表决。方法是两两进行比较,即让
法来求解蜈蚣博弈,则博弈结果是我们不能接受 投票群体对他们进行表决。假定这 $ 个群体的偏
! "#$ !
!"#$#%&’( …… !""#$ %
好关系如下:
五、结语
博弈论即是研究处于互动 (-./01+2/-3.)中的
理性主体(+40./)是如何行动的。尽管博弈论发展
迅猛,但它的基础理性人假设存在着问题。正如其
我们先让投票者对 % 和 & 进行投票。我们看 他科学的发展过程所昭示给我们的,基础需要不
到,由于群体 " 和群体 ’ 均认为 “% 优于 &”,群体 断夯实一样,博弈论基础也需要进一步的夯实。对
( 认为 “& 优于 %”,这样,在这轮投票中 % 以 ( 比 理性假设困境的探讨有助于博弈论的进一步发
" 战胜 &。 展,也有助于利用博弈论的社会科学的发展。
我们再让这三个群体对 & 和 ) 进行投票。群
体 " 和群体 ( 认为 “& 优于 )”,群体 ’ 认为 “) 优 参考文献:
于 &”,投票结果是:& 以 ( 比 " 战胜 )。 5 " 6 7%89:; <= >?0 /1+40@A 3B /?0 23CC3.D 5 E 6 = F2-0.20
既然 % 战胜了 &,& 又战胜了 ),似乎是,如 "GHI,"H(J "($’=
果对 % 与 ) 进行投票,% 应当战胜 )。对于任何一 5 ( 6 ;K8L: 7= M3/-.4 N+1+@3O0D +.@ 73P /3 90+Q P-/?
定义域不受限制——
— 社会福利函数适合所有可能 学出版社,(##(:(("=
的个人偏好类型;第二,非独裁——
— 社会偏好不以 5 I 6 5美6 安德鲁・马斯—科莱尔,迈克尔・9= 温斯顿 =
微观经济学5L6= 北京:
中国社会科学出版社* (##"\ Y=
一个人或少数人的偏好来决定;第三,帕累托原则
5 G 6 肯尼思・阿罗 = 社会选择:个性与多准则 5 L 6 =
— 如果所有个人都偏好 + 甚于 ,,则社会偏好 +
——
北京:首都经济贸易大学出版社* (###,(Z ! (H=
甚于 ,;第四,无关备选对象的独立性——
— 如果社
5 "# 6 潘天群 = 博弈行为中的演绎与归纳推理及其问
会偏好 + 甚于 ,,无论个人对其他的偏好发生怎
题 5 E 6 = 自然辩证法研究 = (##’,_ ’ ‘ =
样的变化,只要 + 与 , 的偏好关系不变,社会偏好 5 "" 6 潘天群 = “游戏理论 ”将一统天下?5 % 6 = 社会学家
+ 甚于 , 不变。阿罗定理是深刻的:如果不存在着 茶座 (第 " 辑 )= 济南:山东人民出版社* (##(=
这样的福利函数,社会所使用的各种加总个体偏
好的方法(投票制度)有何合理性而言?这是不是 _ 收稿日期:(##’—#Z—"( 责任编辑:赵磊 ‘
说明,民主制度存在着天然的缺陷?
! "#$ !