首页 第5章_不完全信息动态博弈

第5章_不完全信息动态博弈

举报
开通vip

第5章_不完全信息动态博弈null第五章 不完全信息动态博弈第五章 不完全信息动态博弈null在不完全信息动态博弈中,至少有一个博弈参与者对博弈的结构、博弈参与者类型、博弈收益等信息不完全了解。 博弈参与者的行动存在先后顺序。 与不完全信息静态博弈类似,可以通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。一、波音与空客博弈的基本假设一、波音与空客博弈的基本假设假设波音公司先于空中客车公司进入市场。 波音公司可能是一个“有先发优势”的公司,也可能是一个“无先发优势”的公司。 波音公司“有先发优势”时,其成本函数为:C(q1)...

第5章_不完全信息动态博弈
null第五章 不完全信息动态博弈第五章 不完全信息动态博弈null在不完全信息动态博弈中,至少有一个博弈参与者对博弈的结构、博弈参与者类型、博弈收益等信息不完全了解。 博弈参与者的行动存在先后顺序。 与不完全信息静态博弈类似,可以通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。一、波音与空客博弈的基本假设一、波音与空客博弈的基本假设假设波音公司先于空中客车公司进入市场。 波音公司可能是一个“有先发优势”的公司,也可能是一个“无先发优势”的公司。 波音公司“有先发优势”时,其成本函数为:C(q1) = q1。 波音公司“无先发优势”时,其成本函数为:C(q1) = 2q1。 空中客车公司的生产函数没有不确定性。 空中客车公司的生产函数为:C(q2) = 2q2。 空中客车公司进入市场需要付出一个额外的固定成本。null假设国际市场飞机需求函数为:P = 10 – Q 其中:Q = q1 + q2。 波音公司和空中客车公司的行动存在先后顺序。 波音公司先进入市场,空中客车公司后进入市场。 波音公司和空中客车公司都明确知道空中客车公司的生产函数。 波音公司明确知道自己的生产函数,但空中客车公司不知道波音公司的生产函数。存在不完全信息。 所以,这个博弈是一个不完全信息动态博弈。专栏:“先发优势”与“规模经济”专栏:“先发优势”与“规模经济”传统经济学理论建立在完全竞争市场和规模报酬不变的前提下。 在传统经济学理论中,完全竞争条件下企业利润为零,并且企业的利润与企业进入市场的时间先后没有必然联系。 在 20 世纪 50 年代以后,伴随着机械化大生产的迅猛发展,企业生产过程中“规模经济”(Economy of Scale)特征越发明显。生产规模越大,企业生产成本越低。 规模经济的生产模式催生不完全竞争的市场结构。 具有规模经济生产特征的企业越做越大,逐渐在市场中占据一定垄断地位,进而打破完全竞争的市场结构,产生垄断竞争、寡头、甚至垄断等不完全竞争的市场结构模式。null在规模经济和不完全竞争市场结构下,先进入市场的企业具有垄断优势。 先进入的企业可以利用规模经济原理扩大规模,降低成本。 后进入的企业在发展之初,规模小、生产成本高,较难与已经具备一定规模的先发企业进行抗衡。 即:先进入的企业“有先发优势”。 如果先进入的企业没有充分利用自身的便利条件,未建立起自身的竞争优势,那么当后来者进入市场时,两家企业在将在同一个起跑线上进行竞争。 在此种情况下,先进入市场的企业常被称为“无先发优势”。null内部规模经济null学习曲线与先发优势二、博弈过程二、博弈过程波音公司先行动。 当波音公司选择产量时,可以视波音公司为一个垄断者。 当空中客车进行决策时,如果空中客车公司选择“进入”,那么波音公司和空中客车公司在市场中进行寡头博弈。 假设寡头博弈遵从古诺寡头博弈的模式。1.波音公司的决策依据1.波音公司的决策依据波音公司通过选择产量最大化自己的利润。 首先行动的波音公司如果是一个“有先发优势”的公司 均衡产量为:4.5 均衡利润为:20.25 首先行动的波音公司如果是一个“无先发优势”的公司 均衡产量为:4 均衡利润为:162.空中客车公司的决策依据2.空中客车公司的决策依据当轮到空中客车公司行动时,如果空中客车公司选择“不进入”,那么波音公司将继续自己在市场中的垄断地位。 如果空中客车公司选择“进入”,那么空中客车公司将和波音公司在市场上进行古诺寡头博弈。 寡头博弈下 首先行动的波音公司如果是一个“有先发优势”的公司 产量:q1 = 10/3; q2 = 7/3;利润:П1 = 100/9; П1 = -5/9。 首先行动的波音公司如果是一个“无先发优势”的公司 产量:q1 = 8/3; q2 = 8/3;利润:П1 = 64/9; П1 = 10/9。null如果波音公司是一个“有先发优势”的公司,那么空中客车公司与波音公司在市场上进行古诺寡头竞争时,空中客车公司的利润为负。 如果波音公司是一个“无先发优势”的公司,那么空中客车公司与波音公司在市场上进行古诺寡头竞争时,空中客车公司的利润为正。也就是说: 当波音公司是一个“有先发优势”的公司时,空中客车公司将选择“进入”; 当波音公司是一个“无先发优势”的公司时,空中客车公司将选择“不进入”。三、先验信念与策略互动三、先验信念与策略互动由于空中客车公司并不知道波音公司的成本函数,因此空中客车公司只能根据自己的先验信念进行决策选择。 先行动的波音公司可以通过自己传递的信息影响空中客车公司的信念。 空中客车公司先验的认为波音公司为“有先发优势”的公司的概率为 p,波音公司为“无先发优势”的公司的概率为 1 – p。 当 p < 2/3 时,空中客车公司选择“进入”。 当 p > 2/3 时,空中客车公司选择“不进入”。 null作为先行动的波音公司,可以通过自己的行为改变空中客车公司的信念。 具体说来,先行动的波音公司作为市场中的垄断者,如果波音公司已经建立起“先发优势”,那么波音公司选择 p = 5.5可以最大化自己的垄断利润。 如果波音公司“无先发优势”,那么波音公司选择 P = 6 可以最大化自己的垄断利润。 波音公司会考虑自己的定价传递给空中客车公司的信息。null如果波音公司把价格定在 P = 6 的水平,那么等价于告诉空中客车公司:波音公司是一个“无先发优势”的公司。 当轮到空中客车公司进行决策时,空中客车公司一定会选择“进入”。 空中客车公司的进入会攫取部分原本属于波音公司的垄断利润。 波音公司理想的结果是通过自己传递的信息,让空中客车公司“知难而退”,不进入市场。 即使波音公司是一个“无先发优势”的公司,它也有动机把自己伪装成一个“有先发优势”的公司,从而改变空中客车公司的信念,将空中客车公司排挤在市场之外。null不同情况下波音公司和空中客车公司的利润情况null当空中客车公司没有观察到波音公司的定价策略时,空中客车公司有一个先验信念。 当博弈开始后,空中客车公司可以观察到先行动的波音公司的定价策略,但观察不到波音公司的成本函数。 根据波音公司的定价策略,空中客车公司会修正自己的先验信念,产生后验概率。 空中客车公司如何根据观察到的波音公司价格的策略修改自己的先验信念呢? “后行动的博弈参与者怎样根据观察到的信息修改自己的先验概率,得到后验概率。”这是贝叶斯统计的一个经典问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 :第二节 先验概率与后验概率第二节 先验概率与后验概率在贝叶斯统计中,人们根据历史以及经验对某随机事件概率分布的先验信念称为先验概率。 先验概率形成后,根据之后得到信息对先验概率进行修正,得到后验概率。 贝叶斯公式是连接先验概率和后验概率的桥梁。一、贝叶斯公式一、贝叶斯公式贝叶斯公式(逆概公式):设试验 E 的的样本空间为 Ω。事件 A1,A2,…,An 构成样本空间 Ω 的一个划分(或构成一个完备事件组),且 P(Ai) > 0,(i = 1,2,…,n)则对任意一个事件 B(P(B) > 0),有:二、贝叶斯公式应用实例二、贝叶斯公式应用实例某公司考虑从 F 大学招聘毕业生。 经理甲认为:F 大学的毕业生为“高能力”的概率为 0.9,为“低能力”的概率为 0.1。 经理乙认为:F 大学的毕业生为“高能力”的概率为 0.7,为“低能力”的概率为 0.3。 人事主管先验概率:经理甲正确的概率为 0.4,经理乙正确的概率为 0.6。 该公司人力主管决定尝试着先招聘 5 个 F 大学的毕业生,通过观察这 5 个毕业生的实际能力,对自己的先验概率进行修正。 null如果招聘来的 5 个 F 大学的毕业生都是“高能力”的。这时,该公司人力资源主管如何修正其先验概率? 定义事件 A1 和 A2 A1 = F大学毕业生“高能力”的概率为 0.9,“低能力”的概率为 0.1。 A2 = F大学毕业生“高能力”的概率为 0.7,“低能力”的概率为 0.3。 公司人力主管的先验概率为:P(A1) = 0.4, P(A2) = 0.6 定义事件 B = 招聘了 5 个 F大学的学生,都是“高能力” 需要求解 P(A1/B) 和 P(A2/B)null根据: 根据贝叶斯公式,得到: 公司人力主管将自己的信念进行了调整,调整后的信念为:2.先验概率的再修正2.先验概率的再修正假设该公司人力主管决定再进行一次试验 。 该公司又从 F 大学招聘了 10 名毕业生。 经过一段时间的观察,发现这 10 名毕业生中,有 9 名是“高能力”,有 1 名是低能力。 定义事件 C = 招聘了 10 个 F 大学的学生,有 9 个是“高能力”,1 个是“低能力”。 根据贝叶斯公式,求解后验概率 需要求解 P(A1/C) 和 P(A2/C) null定义事件 A1 和 A2 A1 = F大学毕业生“高能力”的概率为 0.9,“低能力”的概率为 0.1。 A2 = F大学毕业生“高能力”的概率为 0.7,“低能力”的概率为 0.3。 公司人力主管的先验概率为:P(A1) = 0.7, P(A2) = 0.3 根据贝叶斯公式 公司人力主管将自己的信念再次进行了调整。 三、不断累积的经验对信念的影响三、不断累积的经验对信念的影响新增加的信息,也可能导致人力主管向另一个方向调整信念 。 假设该公司从 F 大学招聘了 5 名毕业生。 经过一段时间的观察,发现这 5 名毕业生都是低能力。 定义事件 B = 招聘了 5 个 F 大学的学生,都是 “低能力”。 根据贝叶斯公式,求解后验概率 null不完全信息动态博弈中,博弈参与者在博弈开始前具备先验信念。 当博弈开始后,后行动的博弈参与者观察到先行动博弈参与者的部分信息。根据观察到的信息,后行动的博弈参与者会修正自己的先验概率,得到后验概率。 先行动的博弈参与者知道自己透露的信息会影响后行动博弈参与者的信念。 因此,先行动的博弈参与者在透露信息时,也要经过深思熟虑、理性权衡,尽可能让自己透露的信息能诱导后行动者形成有利于先行动者的信念。第三节 不完全信息动态博弈的均衡第三节 不完全信息动态博弈的均衡与不完全信息静态博弈类似,可以通过海萨尼转换将一个不完全信息动态博弈写成博弈树的表达形式。 一、均衡概述 考虑这样一个简单的不完全信息动态博弈: 两名博弈参与者 1 和 2。 博弈参与者 1 先行动,博弈参与者 2 后行动。 参与者 1 可能选择策略 L,也可能选择策略 R。 后行动的参与者 2 不知道参与者 1 的策略选择。null后行动的参与者 2 具备关于参与者 1 选择的先验信念。 参与者 2 认为参与者 1 选择策略 L 的概率为 p,选择策略 R 的概率为 1 - p。 参与者2有两个策略可以选择:U 和 V。null参与者 2 的两个节点位于一个信息集内。 与完全信息动态博弈不同,这里假设参与者 2具有先验信念。null根据参与者 2 的先验信念,参与者 2 选择策略 U 的预期收益为: 参与者 2 选择策略 V 的预期收益为: 容易得到:对于任意的 0 <= p <= 1,参与者 2 选择策略 U的收益都高于选择策略 V 的收益。 参与者 2 会选择策略 U。 参与者 1 预期到参与者 2 的选择逻辑,参与者 1 会选择策略 L。 博弈的均衡是(L,U)。null不完全信息动态博弈的均衡应具备两个特点。 特点 1:博弈参与者在每个博弈节点上都有一个主观信念 如果某个博弈参与者的信息集为单点信息集,那么可以认为该信息集上的博弈参与者赋予此博弈节点的主观概率为 1。 特点2:均衡必须满足序贯理性(Sequentially Rational)。 序贯理性指:在博弈的每个信息集上,博弈参与者的决策都是最优的。二、精炼贝叶斯纳什均衡二、精炼贝叶斯纳什均衡完全信息动态博弈中 子博弈精炼纳什均衡是对纳什均衡的一种“精炼”, 剔除了纳什均衡中包含着“空洞威胁”的均衡。 不完全信息动态博弈中 精炼贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium)指剔除了贝叶斯纳什均衡中包含“空洞威胁”的均衡, 是对贝叶斯纳什均衡的“精炼”。1.精炼贝叶斯纳什均衡实例1.精炼贝叶斯纳什均衡实例包含“空洞威胁”的博弈null博弈参与者 1 有三个策略:L、R 和 M。 当参与者 1 选择策略 M 时,博弈结束。参与者 1 获得收益 1,参与者 2 获得收益 10。 当参与者 1 选择策略 L 或者策略 R 时,轮到参与者 2 进行策略选择。 参与者 2 能观察到参与者 1 没有选择策略 M,但参与者 2 不知道参与者 1 究竟选择了策略 L 还是选择了策略 R。 此博弈不存在子博弈。null根据“划横线法”求解博弈的纳什均衡。 博弈有两个纳什均衡:(L,U)和(M,V)。 纳什均衡仅考虑在均衡处的情况,而不考虑通往均衡的路径。 (M,V)虽然是纳什均衡,但在实际博弈中,没有通往这个纳什均衡的路径。null博弈参与者 1 先行动,但参与者 1 在选择自己的策略时,会考虑自己的策略对博弈参与者 2 决策的影响。 如果参与者 1 没有选择策略 M,那么参与者 2 会根据自己的主观信念以及收益情况选择自己的策略。可以证明:参与者 2 必然会选择策略 U。 理性的参与者 1 可以预期到:如果自己不选策略 M,而是选择策略 L 或者策略 R,那么参与者 2 必然选择策略 U。 在这种序贯理性条件下,参与者 1 会选择策略 L,参与者 1 得到收益 2,参与者 2 得到收益 3。 null如果参与者 1 选择策略 M,那么参与者 1 仅能得到收益 1。 所以先行动参与者 1 不会选择策略 M。 尽管参与者 2 不知道参与者 1 选择了策略 L 还是策略 R,但参与者 2 必然会选择策略 U。 所以,作为一个动态博弈,博弈路径必然是:参与者 1 选择策略 L,参与者 2 选择策略 U。 博弈参与者 2 最希望看到的结果是:参与者 1 选择策略 M,从而博弈结束。在这种情况下参与者 2 可以获得收益 10。但是,怎样才能让参与者 1 选择策略 M 呢? 2.不可置信的威胁2.不可置信的威胁参与者 2 如果放出这样的威胁:“如果参与者 1 没有选择策略 M,而是选择了策略 L 或策略 R,那么参与者 2 必然选择策略 V”。 参与者 2 的这种威胁如果成立,那么不管参与者 1 选择策略 L 还是策略 R,参与者 1 的收益都只有 0。如果选择策略 M,参与者 1 可以得到收益 1。 如果参与者 2 的威胁是可置信的,那么参与者 1 就会选择策略 M,得到收益 1。参与者 2 得到收益 10。null然而,参与者 2 的这种威胁是不可置信的威胁。 参与者 1 知道,如果自己没有选择策略 M,那么参与者 2 会放弃威胁,理性的选择策略 U。 博弈均衡为(L,U)。 参与者 1 得到收益 2,高于选择策略 M 的收益 1。 参与者 2 怎样将这种空洞的威胁变成可置信的威胁呢?3.可置信的威胁3.可置信的威胁如果参与者 2 找到一个具有法律约束力的公正机构,并作出承诺:如果参与者 1 没有选择策略 M,那么参与者 2 如果选择策略 U,则捐给出10,口说无凭,立字为据。 在这种情况下,博弈的收益就相应发生了变化。null容易得到:参与者 2 选择策略 U 的收益都低于选择策略 V 的收益。参与者 2 会选择策略 V。 根据序贯理性原则,参与者 1 预期到参与者 2 必然选择策略 V。 如果参与者 1 选择了策略 L 或者策略 R,那么参与者 1 只能得到收益 0。 如果参与者 1 选择策略 M,会得到收益 1。 因此理性的参与者 1 会选择策略 M。博弈的均衡为:(M,V)。 因此,当参与者 2 将自己“必然选择策略 V”的威胁变为可置信的威胁时,参与者 1 会选择策略 M 而不是策略 L。 null博弈只有一个纳什均衡:(M,V)。 这个纳什均衡也是一个精炼贝叶斯纳什均衡。“可置信威胁”下的策略型表达方式第四节 不完全信息动态博弈的应用第四节 不完全信息动态博弈的应用在不完全信息动态博弈中,一个重要的研究领域是:怎样有效传递信号(Signal)以及存在信号传递条件下的博弈均衡。 迈克尔 · 斯宾塞(Michael Spence)教授研究了劳动力市场上的不完全信息、信号传递及均衡问题,为信息经济学的发展奠定了重要基础。 一、劳动力市场信号博弈概述 在劳动力市场中,雇主不能在招聘时明确知道应聘者的能力。 即使被录用者已在工作岗位上时,雇主也往往无法立即获知劳动者的真实能力。null雇主不可能随意解聘一个已经得到雇佣合同的员工。 劳动力市场可以看作是一个具备不对称信息特征的投资市场。 雇主虽然观察不到劳动者的能力,但是能够观察到劳动者的外部特征。如:性别、年龄、种族、受教育程度等。 雇主可以通过观察劳动者的外部特征来形成对劳动者实际能力的主观信念。 像性别、年龄、种族这些不受劳动者本身控制的特征,通常被称为“指标(Indices)”,只有劳动者能自我控制的特征:如受教育程度,才被称为“信号(Signal)”。null劳动者可以通过向雇主传递信号,还改变雇主的主观信念。 通常说来,劳动者的受教育程度越到,雇主认为其是高能力的劳动者的概率越大。 因此,劳动者的受教育程度是一个信号。 劳动者的受教育程度越高,劳动者得到雇佣的可能性越大。 如果拿到高学历不需要成本,则所有的劳动者都会选择高学历。 实际上,受教育需要付出成本:体力、脑力和时间等。 为了得到某些有利于自己的信号而付出的成本,通常被称为“信号成本(Signaling Cost)”。 null假设劳动者取得高学历的成本和他的能力负相关:能力越高的劳动者获得高学历所需付出的成本越低;能力越低的劳动者获得高学历所需付出的成本越高。 由于劳动者获得高教育水平需要付出成本,即“信号成本”,因此劳动者在决定自己接受多少年教育时,会考虑“多接受一年教育”所带来的收益和所要付出的成本的相对大小。 在均衡处,应满足边际收益等于边际成本。这就是“劳动者的信号决策”过程。null劳动力市场和信号传递null虽然雇主认为:受教育程度越高,劳动者为高能力劳动者的概率越大。 但是究竟受教育程度和能力之间是怎样的量化关系呢? 雇主会根据以往的经验不断修正自己的判断。 如果以往雇佣的高学历劳动者都是高能力、低学历劳动者都是低能力,那么雇主会认为受教育程度和能力之间存在很强的相关性。反之,如果雇主以往雇佣的高学历劳动者能力并不高、低学历劳动者能力并不低,那么雇主就会逐渐认为受教育程度和能力之间不存在很强的相关性。null如果雇主认为受教育程度和能力之间存在很强的相关性,那么雇主就会更倾向于招聘那些高学历的劳动者,并更愿意为高学历的劳动者支付高工资。 反之,如果雇主认为受教育程度和能力之间不存在很强的相关性,那么雇主可能并不愿意为高学历的劳动者提供太高的工资。 雇主的信念对“劳动者的信号决策”也会产生影响。 如果劳动者预期到雇主愿意为高学历的劳动者支付高工资,那么劳动者就更有可能增加自己的受教育程度。反之,劳动者增加自己受教育程度的热情会减少。二、数理模型二、数理模型可以通过一个简单的数理模型考察不完全信息劳动力市场的博弈过程和均衡。 假设劳动人口中有两种劳动者:低能力的和高能力的。 低能力的劳动者的边际产值为 1;高能力的劳动者的边际产值为 2。 低能力劳动者占劳动者总人数的比例为:q1,高能力劳动者占劳动者总人数的比例为:1 – q1。 劳动者的受教育年数用 y 表示。低能力的劳动者要想获得 y 年教育经历需要付出的成本为 y;高能力的劳动者要想获得 y 年教育经历需要付出的成本为 y/2。null假设雇主的主观信念为:如果劳动者的受教育年数大于等于一个临界值 y*,那么雇主将按照高能力劳动者的边际产值给该劳动者付工资。 如果劳动者的受教育年数小于该临界值 y*,那么雇主将按照低能力劳动者的边际产值给该劳动者付工资。 因此,雇主付给劳动者的工资 w 与劳动者的受教育程度 y 有关。null劳动者的受教育年限只可能是两种:0年或者 y* 年。 雇主应该选择一个合适的 y*,使得低能力的劳动者选择的受教育年限为0、高能力劳动者选择的受教育年限为 y*。 这样的 y* 能够使得雇主正确的将高能力劳动者和低能力劳动者区分开,能够正确地按照劳动者的边际产值给劳动者付工资。 这样的机制满足自我确认(Self-Confirming)的特征。 求解 y* 的过程就是求解信号均衡(Signal Equilibriam)的过程。三、博弈均衡三、博弈均衡当 1 < y* < 2 时 低能力的劳动者选择的受教育年限为 0, 高能力的劳动者选择的受教育年限为 y*。 不同能力的劳动者选择的受教育年限不同。这样的均衡被称为分离均衡(Separating Equilibrium)。 当 时 y* < 1 时 不管是低能力的劳动者还是高能力的劳动者都会选择受教育程度为 y*。 当 时 y* > 2 时 不管是低能力的劳动者还是高能力的劳动者都会选择受教育程度为 0。 不同能力的劳动者选择的受教育年限相同。这样的均衡被称为混同均衡(Pooling Equilibrium)专栏:迈克尔 · 斯宾塞简介专栏:迈克尔 · 斯宾塞简介迈克尔 · 斯宾塞教授 1943 年出生于美国,1962-1966 年就读于普林斯顿大学,获得哲学学士学位。 1968年获牛津大学 数学 数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划 硕士学位,1972年获哈佛大学经济学博士学位。 斯宾塞曾供职于斯坦福大学、哈佛大学等,并曾任哈佛大学商学院院长、国家科技及经济政策研究委员会主席等职。 斯宾塞主要研究的是具有不完全信息的市场中各决策主体的经济行为。 在不完全信息市场中,往往存在逆向选择(Adverse Choice / Adverse Selection)。null在劳动力市场中,存在高能力的劳动者和低能力的劳动者。 如果信息是完全的,那么高能力的劳动者将得到高工资、低能力的劳动者将得到低工资。 但招聘方并不能直接观察到应聘者的能力。因此,每个应聘者都会宣称自己是高能力的。 作为真正的高能力的劳动者,为了使自己区别于低能力的劳动者,有必要向招聘者传递一些低能力的劳动者所无法传递的信号。 由于在不完全信息博弈和信号传递方面的突出贡献,迈克尔 · 斯宾塞教授获得了 2001 年度诺贝尔经济学奖。第五节 补充阅读第五节 补充阅读一、不完全信息动态博弈的要素 假设博弈有 n 个参与者。参与者用 i 表示,i = 1,2,…,n 每个博弈参与者都有自己的策略空间。 博弈参与者可能是多种类型中的一种。 参与者 i 明确知道自己的类型,但其他博弈参与者不知道参与者 i 的类型,但知道参与者 i 的类型空间的概率分布。 博弈参与者对其他博弈参与者具有先验信念。在博弈过程中,博弈参与者会修正自己的先验信念,得到后验概率。 博弈的收益函数为共同知识(Common Knowledge)。二、贝叶斯统计方法图示二、贝叶斯统计方法图示贝叶斯统计方法图示三、精练贝叶斯纳什均衡满足的条件三、精练贝叶斯纳什均衡满足的条件在精练贝叶斯纳什均衡中,每个博弈参与者的策略,都必须满足两个条件: 第一:给定其他博弈参与者的策略和参与者的后验概率,参与者在精练贝叶斯纳什均衡处的策略都是最大化自身预期收益的策略。 第二:任意参与者的后验概率都是根据先验概率、进而通过贝叶斯公式计算得到。本章小结本章小结在不完全信息动态博弈中,至少有部分博弈参与者对博弈的结构、博弈参与者类型、博弈收益等信息不完全了解。 博弈参与者的行动存在先后顺序。 可通过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。 对不完全信息动态博弈均衡的求解,需要用到贝叶斯公式。 贝叶斯统计的主要思路是:根据先验概率和数据信息,利用贝叶斯公式得到后验概率。随着信息量的增加,不断修正主观概率值。null今天的主观概率值既是过去主观概率值的后验概率,也是未来主观概率值的先验概率。 在精练贝叶斯纳什均衡中,各博弈参与者均最大化自己的期望效用,同时满足序贯理性。 不完全信息动态博弈的主要应用之一是信号博弈。 在劳动力市场中,雇主无法得知应聘者的能力,只能根据应聘者的特征指标和信号进行决策。 应聘者按照自身净收益最大化的原则,决策自己发出的信号。 在信号博弈均衡处,雇主和应聘者之间需要能够自我确认。习题习题
本文档为【第5章_不完全信息动态博弈】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_327010
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:经济学
上传时间:2012-01-04
浏览量:40