博亦论
1 基础知识
博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的 学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论 和许多其他的贡献一样)是由约翰。冯诺伊曼(John von Neumann) 创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡 摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。 当然,摩根斯坦把新古典经济学的 思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其 他的贡献。
?一个科学的隐喻
由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个 科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式 的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈 论中常常讨论的问题包括:
1) 当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选 择战略意味着什么,
2) 在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益( 或避免共同损失)是否“理性”,或者,采取侵略性的行动以寻求私人利益而不顾 共同得益或共同损失,这是否是“理性”的,
3) 如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的, 在什么样的情况下合作是理性的,
4) 在特定情况下,正在持续的关系与单方退出这种关系是不同的吗,
5) 在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现 吗,
6) 在这些情况下,真正的人类行为与“理性”行为是否相符,
7) 如果不符,在那些方面不符,相对于“理性”,人们更倾向于合作,或者 更倾向于侵略,抑或二者皆是,
因而,博弈论研究的“博弈”包括:
破产
门口的野蛮人(Barbarians at the Gate)
网络战(Battle of the Networks)
货物出门,概不退换(Caveat Emptor)
征召(Conscription)
协调(Coordination)
逃避(Escape and Evasion)
青蛙呼叫配偶(Frogs Call for Mates)
鹰鸽博弈(Hawk versus Dove)
Mutually Assured Destruction
多数决定原则(Majority Rule)
Market Niche
共同防卫(Mutual Defense)
囚徒困境(Prisoner?s Dilemma)
补贴小商业Subsidized Small Business
公共地悲剧Tragedy of the Commons
最后通牒Ultimatum
视频系统协调Video System Coordination
?理性
新古典经济学与博弈论之间的关键链接就是理性。新古典经济学建基于这样一 个假设之上,即人类在其经济选择行为中是绝对理性的。确切地说,这个假设意味 着每个人在其所面临的环境中都会最大化自身的报酬——利润、收入或主观利益。 在资源配置研究中,上述假说服务于两个目的:一是稍稍缩小可能发生事物的范围 ;二是提供了一个衡量经济体制效率的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
。如果经济体制导致部分人的报酬减少 ,而又没有对其他人产生更多的报偿(宽泛地讲就是成本大于收益),那么在某些 方面就产生了失误。污染、渔业资源的过度开发、不恰当的资源用于研究(inadeq uate resources committed to research)都是这类问题的例子。
在新古典经济学中,理性的个人面临特定的体制或
制度
关于办公室下班关闭电源制度矿山事故隐患举报和奖励制度制度下载人事管理制度doc盘点制度下载
,包括产权、货币和高 度竞争的市场。这些是个人纳入最大化报酬计算的许多“情况”之一。财产权利、 货币经济以及理想化的竞争市场的隐含意义是经济个体不需要考虑自己与其他经济 个体的行为互动。他或她只需要考虑自己的境况和“市场条件”。但这导致了两个 问题:一是理论的范围受到局限。只要竞争受到限制(但没有垄断)或者产权没有 完全界定,众望所归的新古典经济学理论就不适用了,并且新古典经济学也从未产 生可接受的理论扩展以覆盖上述情况。对于新古典经学来说,决策是在货币经济之 外做出的,这也是有问题的。
博弈论正好面对上述问题:提供一个关于人们直接(而不是“通过市场”)互 动的经济和战略行为的理论。在博弈论中,“博弈”始终是针对人类社会严肃的互 动行为的一个隐喻。博弈论也许是关于纸牌游戏或者棒球运动的理论,但却不是关 于象棋的理论,它是关于这样一些严肃的互动行为比如市场竞争、军备竞赛和环境 污染的理论。只不过博弈论涉及这些问题的时候使用的是博弈的隐喻意义:在这些 严肃的互动行为中,就象在游戏中一样,个体的选择实质上是战略选择,行为互动 的结局依赖于每个参与人所选择的战略。通过这样的阐释,研究“博弈”可以真正 告诉我们关于严肃的互动行为的一些事情。但是,究竟会告诉我们多少,
在新古典经济学理论中,理性地进行选择就是要最大化自身的收益。在某种观 点看来,这是一个数学问题:在给定环境条件下选择最大化报酬的行动。因而我们 可以把理性的经济选择当作一个数学问题的“解”。在博弈论中,情况就更复杂了 。既然结局不仅依赖于自身的战略和“市场”条件,也直接依赖于其他人所选择的 战略,但我们仍然可以把理性的战略选择当作一个数学问题——最大化行为互动中 的决策制定者群体的报酬——从而我们再次称理性的结果是博弈的“解”。
2 囚徒的困境
博弈论近来的发展,特别是1994年诺贝尔纪念奖授予给三位博弈论理论家以及 89岁高龄的塔克(A. W. Tucker)在1995年1月的去世,唤起了人们对博弈论创立时 的回忆。尽管博弈论可以追索到更早的时代,但其兴起的关键时期是20世纪40年代 。当然,《博弈论与经济行为》的出版是一个特别重要的台阶。但是,在某种程度 上,塔克发明的“囚徒困境”例子更为重要。这个可以在一页纸上求解出来的例子 在20世纪下半叶的社会科学中可能是最具影响的一页。
这个杰出的创见并不是出自研究论文,而出自于课堂。正如S. J. Hagenmayer
在《费城调查者(Philadelphia Inquirer)》(“Albert W. Tucker, 89, Famed Mathematician,“ Thursday, Feb. 2, 1995, p.. B7)中写到:“在1950年,作为 访问教授,塔克在斯坦福大学向由心理学家组成的听众发表演说的时候,创造了„
囚徒困境?来说明
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
某些类型博弈的困难。塔克的简单解释导致了后来大量的文 献。这些文献来自不同的领域,比如哲学、伦理学、生物学、社会学、政治科学、 经济学,当然还有博弈论。”
?囚徒困境博弈
塔克是从这样一个小故事开始的:两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现 场附近被抓获并被警方隔离拷问。每个夜贼都必须选择是否坦白和揭发对方。如果 两个贼都不坦白,他们都将被判刑一年。如果每个贼都坦白并揭发对方,他们都将 在监狱中度过10年。但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么 与警方合作的贼将被释放而另一个贼将在监狱中度过20年。
在这个例子中的战略是:坦白与不坦白。赢利(payoff)(实际上是处罚)是 判刑。我们可以用“赢利表(payoff table) ”简洁地表达上述信息,这类赢利表 已经成为博弈论中很好的标准表达式。以下是囚徒困境博弈的赢利表。
表2-1
艾尔
坦白 不坦白
鲍伯 坦白 10,10 0,20
不坦白 20,0 1,1
这个表的读法是这样的:每个囚犯从两个战略中选择一个。即,艾尔选择一列 ,鲍伯选择一行。每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果 。逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的 人(艾尔)的赢利。因此(先阅读第一列),如果他们都选择坦白,每人将判刑10 年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。
那么:怎样求解这个博弈,如果双方都想使自己呆在监狱的时间最短,他们选 择什么战略是“理性的”,艾尔可能会做这样的推理:“两种事件可能发生:鲍伯 要么坦白要么保持沉默。假定鲍伯坦白,我不坦白的话将被判20年,我也坦白的话 则判10年。另一方面,如果鲍伯不坦白,我不坦白我被判刑1年,但在这种情况下, 如果我坦白我可以被释放。无论怎样,我选择坦白都是最好的。因此,我将坦白。 ”
但是鲍伯能够而且大概也将做同样的推理——因此他们都将坦白并且都在监狱 呆10年。然而,如果他们“不理性”地行动,都保持沉默,他们都可以在1年后被释 放。
?占优战略(Dominant Strategies)
这里发生的情况是,两个囚犯陷入了“占优战略均衡”。
定义:占优战略——让博弈的参与人单独地评估他面临的战略组合中的每一个 战略,并且,对于每一个组合,他从自己的所有战略中选择一个使他赢利最多的战 略。如果对于参与人面临的每一个不同的战略组合,参与人都选择同一个战略,这 个被选择的战略就叫该参与人在博弈中的“占优战略”。
定义:占优战略均衡——在一个博弈中,如果每个参与人都有一个占优战略, 且每个参与人都采取占优战略,那么(占优)战略组合及其相应的赢利被认为是构 成了博弈的占优战略均衡。
在囚犯困境博弈中,坦白是占优战略,当两个囚犯都选择坦白时,那就是占优 战略均衡。
?囚犯困境中需要考虑的问题
这个不同寻常的结果——两个囚犯出于自利的个体理性行动导致双方情况变得
更糟糕——在现代社会科学中产生了广泛的影响。因为在现代世界里有大量的行为 互动与此极其相似,从军备竞赛到道路拥挤,以及渔业资源贫化污染和地下水资源 的过度开发等,莫不如此。这些行为互动在细节上有很大差异,但却如我们想象的 一样,个体理性给每个人带来了更差的结果,囚犯困境暗示了它们的发展方向。这 就是“囚犯困境”的威力所在。
当然,我们也必须坦白地承认,囚犯困境对于上述行为互动来说是只一个非常 简明扼要的概括——如果你愿意,也可说它“不切实际”。囚犯困境也孕育了许多 对其进行批评的论点,这些论点构成了许多学术文献的基础:
囚犯困境是二人博弈,但是这一思想的许多应用场合是真正的多人行 为互动。
我们假定两个囚犯之间没有进行过沟通。如果他们能够相互沟通并谋 求协调战略,我们有可能得到不同的结局。
在囚犯困境中,两个囚犯仅博弈一次。重复的博弈行为可以导致大相 径庭的结果。
导致占优战略均衡的推理也许是强制进行的,但它并不是推导出问题 的唯一方式。也许它根本就不是最理性的答案。