囚徒困境假设:甲乙二人因偷窃被抓,检察官向他们指出如图所示的各种情况下的徒刑年数(右边为相应的纯效用结果)。我们可以看到,在这里,每个囚徒都有两种战略:坦白和抵赖。纳什均衡就是两个人都选择坦白(这甚至是占优策略均衡,即每个人的策略对别人的任何策略总是最佳应对)。换句话说,不论对方如何选择,个人最优选择是坦白。因为假设乙抵赖,如果甲不坦白,二人各判2年,如果甲坦白,甲被释放,乙判10年,所以坦白比不坦白要好;反之,假设乙坦白的情况下,如果甲抵赖,甲判10年,乙被释放,如果甲亦坦白,则二人各判5年,所以坦白还是比不坦白要好。所以不论于甲于乙,坦白总比抵赖要好,最终结果是两人都选择坦白,各判5年。其实。如果两个人都抵赖,各判2年,当然比都坦白各判5年要好,但这个帕累托改进办不到。至于如何在不同的博弈结构里“走出”囚徒困境,大抵要依赖于多次博弈和某种非完全理性,比如“一报还一报”(所谓“己所不欲,勿施于人”)策略,此处也不多讲了。 囚徒乙
囚徒甲 坦白 抵赖 背叛 合作
坦白 5,5 0,10 背叛 -5,-5 0,-10
抵赖 10,0 2,2 合作 -10,0 -2,-2
关于纳什均衡作为博弈解用以描述人类行为的合理性,至少在纳什那里有两个解释。其一,“在所讨论的博弈中,对理性地进行博弈的可预期的行为的一个合理预测是什么?通过运用一些原则,如一个合理的预测应该是唯一的,参与人应能充分推理和利用知识,并且对于每一个参与人,关于其他参与人行动的知识将不会导致他的行动偏离这个合理的预期。这样我们就得到上面我们定义的解的概念。 在这种解释下,我们需要假定参与人交接整个博弈的结构,从而能各自推导出这个预期。这是一个理性和理想化要求很强的解释”。博弈论里普遍知识方面的研究就是涉及它的。其二,“大众行为”的解释。“在经济或国际政治的一些场合,利益集团不自觉地被卷入到一个非合作的博弈之中,这种不自觉使得这个场合变成了一个非合作博弈。 在这种解释下, 假定参与人对整个博弈的结构有完全的知识或者有能力进行复杂的推理不是必需的。但是我们假定参与人能对他们的各种纯策略的相对益处积累经验性的信息。我们假定存在一定的参与人群并且这些参与人的“中间分子”运用纯策略有一个稳定的平均频率”(Nash,1951,Appendix,23,21)。现在很活跃的进化博弈理论可以认为是这个方向上的深化。
社会选择理论
社会选择理论研究一个社会的价值规范问题,其核心在于个人和社会之间的关系,正如1998年诺贝尔经济学奖得主森所说“它处理如何把个人利益,判断和福利的集合转化为社会福利,社会判断和社会选择的加总形式”(Sen, 1987, 382)。
所谓社会选择,在数学上表达为一个建立在所有个人的偏好上的函数(或对应),该函数的性质代表了一定的价值规范,比如公民主权、全体性、匿名性、目标中性,帕累托最优性,无独裁性等。社会选择最重要的问题是,这些价值规范之间是否是逻辑上协调的。在这个意义上,社会选择领域笼罩在两个不可能性定理的巨大身影之下,即阿罗的不可能性定理和森的帕累托自由不可能性定理。
众所周知,多数原则是现代社会广泛接受的决策方法。洛克认为“根据自然和理性的法则,大多数具有全体的权力,因而大多数的行为被认为是全体的行为,也当然有决定权了”。但很多在自然法学家那里是想当然正确的东西在社会选择理论中是需要证明的。
正面成果是梅(Robert May)在1952年证明的,即一个社会福利函数是多数投票型的,当且仅当它满足匿名性,目标中性和正反映性。匿名性保证不会出现某一个人的意愿受到特别重视,也就是一人一票没有特权;目标中性指在合法的和技术可行的范围内,所有社会目标都受到同样待遇;正反应性表明,如果原来社会喜欢甲胜过乙,现在有至少一个原来喜欢乙的人转而喜欢甲,那么社会还应喜欢甲。这三条都是直觉上很合理的标准,而多数投票是唯一满足它们的。
但是,早在十八世纪法国思想家孔多赛就提出了著名的“投票悖论”:假设甲乙丙三人,面对ABC三个备选方案,有如图的偏好排序。由于甲乙都认为B好于C,根据少数服从多数原则,社会也应认为B好于C;同样乙丙都认为C好于A,社会也应认为C好于A。所以社会认为B好于A。但是,甲丙都认为A好于B,所以出现矛盾。投票悖论反映了直观上良好的民主机制潜在的不协调。1972年诺贝尔经济学奖的获得者肯尼思.阿罗,在他的《社会选择与个人价值》(1951)中,证明了著名的阿罗不可能性定理,把这个投票悖论形式化了。在该书中,他运用数学工具把孔多塞的观念严格化和一般化了。阿罗证明,不存在同时满足如下四个基本公理的社会选择函数:1)个人偏好的无限制性,即对一个社会可能存在的所有状态,任何逻辑上可能的个人偏好都不应当先验地被排除;2)弱帕累托原则,3)非相关目标独立性,即关于一对社会目标的社会偏好序不受其它目标偏好序变化的影响;4),社会偏好的非独裁性。
|