首页 量子博弈

量子博弈

举报
开通vip

量子博弈 本科学生毕业论文(设计) 题目 (中文): 量子博弈 (英文): Quantum game 姓 名   学 号   院 (系)   专业、年级   指导教师       2011年  5 月  8 目  录 摘要……………………………………………………………………………………0 Abstract………………………………………………………………………………0 1 引 言………………………………………………………………………………1 2 经典博弈…………………………...

量子博弈
本科学生 毕业论文 毕业论文答辩ppt模板下载毕业论文ppt模板下载毕业论文ppt下载关于药学专业毕业论文临床本科毕业论文下载 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 目 (中文): 量子博弈 (英文): Quantum game 姓 名   学 号   院 (系)   专业、年级   指导教师       2011年  5 月  8 目  录 摘要……………………………………………………………………………………0 Abstract………………………………………………………………………………0 1 引 言………………………………………………………………………………1 2 经典博弈……………………………………………………………………………3 2.1 经典博弈概念…………………………………………………………………3 2.2 Nash 均衡……………………………………………………………………4 2.3 经典“囚徒困境”……………………………………………………………4 3 量子博弈……………………………………………………………………………6 3.1 量子“囚徒困境”……………………………………………………………6 3.2 PQ博弈量子化 ………………………………………………………………10 3.3量子博弈实验验证……………………………………………………………12 4 量子博弈思想对现实世界的启迪………………………………………………13 5 总 结 ……………………………………………………………………………15 参考文献……………………………………………………………………………16 致谢…………………………………………………………………………………17 量子博弈 摘  要:博弈论在经济学,社会科学以及生物学中有着广泛的应用,近年来得到飞速的发展。量子计算和量子信息领域的发展将博弈理论的研究延伸到量子世界里。这样,博弈理论和量子理论的交叉就形成了一个新的学科——量子博弈论。本文分为五章,第一章简单地概述博弈论及量子博弈的发展历史、现状及意义。第二章介绍经典博弈的概念 ,具体介绍了经典博弈的例子“囚徒困境”,“囚徒困境”是经典博弈论中的一个极富代表性的一个著名例子。这个例子的创造本身就奠定了非合作博弈论的理论基础,并且它可以作为实际生活中许多现象的一个抽象概括。第三章描述了量子博弈过程,其中与经典博弈相对应的介绍了“囚徒困境”的量子博弈过程,另外还介绍了PQ博弈的量子过程。在量子博弈中经典博弈中的困境将不再存在,因为该均衡是Pareto有效的Nash均衡,偏离这个均衡的策略都将使得参与者的支付减少。在所有情况下,双方的支付期望值都优于经典Nash 均衡的支付值(1,1)。第四章阐述量子博弈思想对现实世界的启迪。第五章对本文进行了简要的总结并对这一领域的研究做了简要的展望。 关键词:博弈;经典博弈;量子博弈;Nash均衡;策略 Quantum game Abstract:Game theory has been widely applied to economics, social science and biology, and has made great development in recent years. On the other hand, the development of quantum computation and quantum information make it possible that study the game in the world of micro-particles of which quantum mechanics is the fundamental principle. Then, a new subject—the quantum game theory based on the quantum mechanics and information theory—is established. This paper concludes five parts. The first part briefly describes the Game Theory, and the history, current situation and significance of quantum game. The second part introduces the concept of classical game concept and describes specifically the “Prisoner's Dilemma” which is a highly representative famous example of classical game. This example of "Prisoner's Dilemma" constructs the theoretical basis of non-cooperative game theory, and it can be seen an abstract generalization of many real-life phenomenon. The third part describes the process of quantum Game, i.e., a model of quantum game, and discusses in detail the quantum process of “Prisoner's Dilemma” and the “PQ game”. The plight initially exist in classical game will vanish in quantum game, because the so-called balance is the Nash equilibrium of Pareto effect and the payment of all participants reduce if deviating from the balanced strategy. In all cases, the expect values of the payment is better than classical Nash equilibrium value of the payment (1, 1). The fourth part expatiates on the advantages of quantum game and its application prospects. The fifth part concludes the paper and makes a brief outlook of quantum game. Keywords : Game;classic game;quantum game;Nash equilibrium;strategy 1 引 言 博弈论,即游戏理论,是数学体系当中一个成熟的分支。它是一种关于人们如何从赌博或游戏当中获得最大收益的理论。而实际上,游戏理论的实际意义已经不单纯地局限于游戏本身,许多社会问题、经济问题和生物问题中的核心问题都与某种游戏有关,都可以在游戏当中找到答案。那么,游戏和物理又有什么关系呢?虽然诸如象棋、扑克之类的游戏在很大程度上需要玩家的诡计和推测等等一些非物理的要素存在,但是,Von Neumann 和Morgenstern 指出[1 ]:对于游戏理论,有意识的选择不是最基本的。所以游戏当中可能还存在着某种客观的、物理的规律。而且,Frieden曾指出:物理学当中的拉格朗日量可以从一种由人类和大自然玩的游戏当中直接推导出来。因此,游戏与物理学是密切相关的。而对于一个量子物理学家来说,通过引入量子线性叠加态而得到的量子化了的游戏可能是更具有研究价值的游戏。这体现在以下几个方面[2]:1)经典游戏是建立在应用数学原理基础之上的。应用数学已经在经济学、心理学、社会学和生物学当中得到了广泛的应用,而它在很大程度上是建立在概率论基础之上的。于是我们就有理由把这种建立在概率论基础上的经典游戏推广到量子概率领域去。2)如果真的在“自私的基因”的话,那么就很可能在由量子力学支配的分子世界里存在着某种“幸存者游戏”。3)游戏理论和量子通信理论是密切联系的。实际上,游戏的一个玩家无论是想把他的决定告诉给其他的玩家还是告诉给庄家,都要通过交流信息,那么在我们所处的这个量子世界中,我们有理由考虑他们交流的信息是量子信息的情况。比如,量子通信的各方与窃听者的对抗,对抗双方可以采用量子及经典策略。4)量子力学可能为某些不公平的游戏提供使游戏公平的策略。那么如果将游戏推广到量子领域,即允许存在量子策略,会得到什么结果呢?一个很自然的结论是量子策略不会比经典策略差,因为经典策略集是量子策略集的子集。 实际研究表明,由于量子力学的纠缠和叠加等特性[3],量子游戏要比经典游戏丰富多彩得多。因此,近些年来人们对量子博弈论及其应用展开了广泛的研究。 J1 Eisert 等人在2002 年发表在《Physical Re2 view Letters》上的一篇文章( PRL 88 , 137902(2002) ) 。表明处于最大纠缠态的量子博弈将比相应的经典博弈更具有优越性。第一次认真地研究多人量子博弈的是几个英国人Simon C. Benjamin 和Pat rick M. Hayden 。他们在2001 年的一篇Physical Review A ( Rapid communication) 上发表了一篇多人量子博弈的论文。据美国Phys. Rev. Lett .,2002,88 : 137902报道,中国科学技术大学杜江峰研究小组利用核磁共振系统率先在国际上实现了量子博弈实验,引起了国际同行的高度重视。2002年7月上旬,英国Nature 介绍了杜江峰小组的论文。在此之前,Ne2wScien2tist,欧洲物理学会的Physics Web 和美国物理学会(AIP)的News Up dates 也先后对他们的工作进行了报道。 博弈论已经广泛应用于经济、军事、生物、政治等诸多领域,并以其特有的魅力受到越来越多的学者的青睐,它是一门年轻而又有活力的学科,当之无愧地成为各个领域的核心工具。而量子信息的发展,将掀起信息领域的革命,量子现象的奇异特性,为我们展示了诱人的发展前景。量子博弈论产生于博弈论和量子信息的结合,量子信息领域的最新研究成果无疑将对博弈论的发展注入新鲜活力,而博弈论中的思想和 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 也会为量子信息的研究甚至量子物理的探索提供有益的借鉴。 2 经典博弈 2.1 经典博弈概念 博弈论[4],又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的。博弈的基本概念有:参与者、行动、信息、策略、收益函数、结果、均衡。参与者是博弈中以最大化效用选择行动的决策主体(可能是个人,也可能是国家、社会团体);行动是参与者的决策变量;策略是参与者选择行动的规则,他告诉参与者在什么时候选择什么行动;信息指的是参与者在博弈中的知识,特别是有关其他参与者(对手)的特征和行动的知识;收益函数是参与者从博弈中获得的效用水平,他是所有参与者策略或行动的函数;结果是指博弈分析者感兴趣的要素的集合;均衡是所有参与者的最优策略或行动的组合。上述概念中,参与者、行动、结果、统称为博弈规则,博弈分析的目的是使用博弈规则决定均衡。 任何博弈在数学上都可表示成以下三个要素[5] ①参与人(Players) ,以i= 1,2,…表示。 ②策略(Strategies) , 每一个参与人一般有若干策略可供选择, 它们构成了该参与人的纯策略空间。(Strategic Space),参与人i 的纯策略空间可以用S i 表示,倘若S i 由k i 个纯策略构成, 则有 。纯策略空间有时也可以是连续的。 ③每个参与人的收益(Payoff)函数,即参与人i 的收益函数为$i(s),其中s=(s1, s2, ..., s n ) 是参与人的策略组合(Strategy Profile),s j 表示参与人j 所选的策略。显然,收益函数$i (s)与s 有密切关系。 策略空间、收益函数以及参与人的与博弈有关的特征等知识构成博弈的信息, 从信息的角度,博弈可以分为完全信息与不完全信息两类。完全信息是指每一个参与人对自己以及其他局中人的策略空间、收益函数等知识有完全地了解,否则,博弈就是不完全信息的。博弈的分类还可以从参与人行动的先后次序着手,如果参与人同时选择行动,则称博弈为静态的。要求“同时”不一定等于规定大家在同一时刻一起行动。通常在时间上虽有行动的先后,但是参与人彼此不知道其他人在采取什么具体行动(直到博弈结束) 。其效果仍等价于他们在同时行动,此时我们仍称它是静态博弈。倘若参与人的行动有先后顺序,后行动者可以观察到前行动者的行动,并在这基础上采取自己最有利的策略,博弈就是动态的。上述两种划分如果两两交叉。就可以得到完全信息静态博弈( static games of complete information)、完全信息动态博弈(dynamic games of complete nformation)不完全信息静态博弈( static games of incomplete information)、不完全信息动态博弈(dynamic games of incomplete information)4种情况。完全信息静态博弈属非合作博弈范畴。非合作博弈的基础是Nash在1950年和1951年所发表的两篇论文。这两篇论文在非常一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在性。Nash本人也因在这两篇文章中所做出的突出贡献获得了1994年的诺贝尔经济学奖。他所定义的均衡称为Nash均衡(Nash Equilibrium )。 2.2 Nash 均衡 Nash均衡是什么意思呢?假设有n 个人参与博弈,给定其他人的策略的条件下,每个人选择自己的最优策略,所有参与人选择的策略构成一个策略组合。Nash均衡指的是这样一种策略组合,这种策略组合由所有参与人的最优策略组成,也就是说,给定别人的策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有人愿意打破这种均衡。 用数学语言对上述Nash 均衡的想法进行概括。我们有如下定义[6]: 纯策略的Nash均衡:完全信息静态博弈问题中,参与人以i= 1, 2,..., n 表示,n 为参与人的个数,设第i个参与人的策略空间为S i, 他的纯策略为s i∈S i,收益函数为$i (s),s 为所有参与人的纯策略组合,s= (s1,s2,...,s n) ; 如果对所有的参与人i ( i= 1,2,...,n) 均成立 ..............................(2-1) 那么,s称为该博弈的纯策略的Nash均衡。 下面我们用Nash均衡这个概念分析博弈论中的一个著名例子“囚徒困境”。 2.3 经典“囚徒困境” “囚徒困境”是经典博弈论中的一个极富代表性的著名例子。这个例子的创造本身就奠定了非合作博弈论的理论基础,并且它可以作为实际生活中许多现象的一个抽象概括。囚徒困境讲的是两个嫌疑犯(Alice和Bob)作案后被警察抓住,被分别关在不同的屋子里审讯,他们每个人都有两种选择(策略):坦白(Defect,策略D )和抵赖(Cooperate,策略C)。警察告诉他们:如果两人都坦白,各判刑4年(收益均为p = 1);如果两个都抵赖,因证据不足,各判刑2年(收益均为r=3)如果其中一人坦白,另一人抵赖,坦白地放出去(收益为t= 5),抵赖的判刑5 年(收益为s= 0)。表格2.1给出“囚徒困境”的策略式表述,表中每一个的两个数字代表对应策略组合下两个囚徒的收益。   Bob 坦白(D ) 抵赖(C) Alice 坦白(D ) (1, 1) (5, 0) 抵赖(C) (0, 5) (3, 3)         表2.1 “囚徒困境”的收益矩阵 表2.1括号中的第一个数是Alice的收益值,第二个数是Bob的收益值。 两个人的目的都是尽可能的是自己的收益最大化。在这个博弈中,坦白(D ) 是占优策略(dominant strategy),也就是说,不论对方的选择是什么,个人的最优选择是坦白。比如说,如果Bob抵赖,Alice坦白的话被放出来,抵赖的话被判2 年;如果Bob坦白,Alice坦白的话被判4年,抵赖的话被判5年。所以,A lice 的占优策略是坦白,Bob的占优策略也是坦白。结果,理性的推理将迫使每个人选择坦白,而显然此时两人的收益要比他们都选择抵赖时差。用博弈论的术语讲, 策略组合(坦白,坦白)是一个Nash均衡:任何单方面的偏离该策略组合都不能使得偏离者的收益提高;当一参与人选择坦白时,另一个参与人只有选择坦白才能使自己的收益最大化,这也正是囚徒的“困惑”之所在。 3 量子博弈 3.1 量子“囚徒困境” 前面我们已经介绍了囚徒怪圈游戏的经典形式,并在阐述了将经典游戏量子化的几个原因,下面我们要量子化上面提到的这个游戏。无论是经典游戏还是量子游戏,他们的收益计算规则是不变的。量子游戏和相应的经典游戏的区别在于:经典游戏的输入态是经典态,策略也是经典的策略(尽管有些游戏也包含了概率在里面,但那是经典的概率) ;而量子游戏的输入态是量子叠加态,甚至是纠缠态,相应的策略则变成了一个个的算符。 图3.1.1二体量子囚徒怪圈游戏示意图最早提出囚徒怪圈游戏量子化形式的是Jens Eis2ert 等人,依据该游戏的经典形式,他们提出该游戏的量子形式包含:1)能提供两个量子bit (即qubit) 的源,两个qubit 分别给Alice 和Bob;2) 能够让Alice 和Bob 操作他们各自qubit 的装置;3) 从最后的输出态中计算Alice 和Bob 的收益情况的装置。Alice 和Bob 都十分清楚地知道以上这3项。 图3.1.1 二体量子囚徒怪圈游戏示意图 用|C〉= 和|D〉= 分别表示合作态和指控态。游戏的装置如图3.1.1所 示:游戏开始时,两qubit都被制备在合作态,即|CC〉(其中,前一个字母代表Alice 的qubit 的状态,后一个字母代表Bob 的qubit 的状态,以下相同) 。J 是一个二位门操作,它的作用是使得Alice 和Bob 的qubit纠缠起来。UA和UB代表Alice 和Bob 对各自qubit的操作。由图可见,UA 和UB 是局域操作(注意局域操作不会改变一个态的纠缠度)。J +是J 的共轭算符,J + 之后的装置是输出装置,它用来计算Alice 和Bob 的收益情况。这样游戏的末态就是UA 和UB 的函数,即: (3-1) 其中 为直积符号。末态的观察结果产生相应的收益,例如,若末态为|ψf 〉= | CD〉则Alice 的收益为0,Bob 的收益为5,对于一般的末态, Alice 收益的期望值为:$A = rPCC+ pPDD + t PDC + sPCD ,              (3-2) Bob 的收益期望值为:$B = rPCC+ pPDD + sPDC + t PCD ,              (3-3) 其中r = 3,p = 1,t = 5,s = 0,而 ,其中 。假设,他们的策略空间都被限制为2参数的2×2幺正矩阵的集合,即: (3-4) 其中 , 。于是选择“合作”的算符为 (3-5) 选择“指控”的算符为 (3-6) 在Jens Eisert的文章中,J被选择为 ,其中 。前面提到J可以使Alice和Bob的qubit纠缠起来,由J的具体形式可以看出γ标识了纠缠度的大小。当 时,纠缠度为零,游戏退化到经典情形。当 时,纠缠度为1,达到了最大,这时D D不再是Nash平衡点,新的Nash平衡点为Q Q ,其中: (3-7) 相应的双方的收益从经典游戏中的1变为量子游戏中的3。我们同样可以看到,Q Q 既是Nash平衡点也是Pareto最优化策略对(最优化策略对概念,它是指这 样一对策略,游戏中任何一方对该策略对的偏离都不能在不减少对方收益的前提下增加自己的收益。),于是囚徒们通过使用量子策略走出了怪圈。对一般的幺正变换U,研究表明,不存在单纯的策略构成的平衡点,双方都要采用混合量子策略。 图3.1.2 三体量子囚徒怪圈游戏示意图 图3.1.2三体量子囚徒怪圈游戏示意图多体的囚徒怪圈游戏,装置与二体的差不多。只是有多个输入端和多个输出端以及让游戏的多个参与者操作自己的qubit 的装置,这里的 ,                    (3-8) 其中 N表示N个算符直积。I为不变操作,而 ,这里J 的作用仍然是让参与者的qubit纠缠起来。考虑三体游戏的情况,即N =3。如图3.1.2所示,如果输入端为状态|000 ,按先后的顺序分别表示三个游戏参与的qubit。这样经过J 操作,输入态变为(1P )(|000 +i|111 ),这是三个qubit的最大纠缠态。在经典游戏当中,游戏的参与者要么保留自己的输入态为0不变,要么翻转自己的输入态为1,他们的首选策略必然是翻转,但这时只能各自获得收益2,即(2,2,2) 是他们首选策略的收益。假如他们可以以一定的概率选择翻转,我们定义不翻转输入态的概率为p,p 可以取从0到1之间的任何一个数。 为了简便,我们只考虑p=0,1/2,1三种情况。这样会有33=27种可能的策略,可以分为10个类,在每个类当中交换参与者的标记,所得的结果不变。这样收益情况可以参见表3.1.3。(表中:“a”代表游戏参与者,p是不翻转输入态的概率,(…)中表示的是输入态为0态的时候,参与者的平均收益。[…]中表示的是输入态为1态的时候,参与者的平均收益。输入态有1P2的概率是0,1P2概率是1的时候的平均收益由不用括号的数字表示。$表示对于输入态是0或1的时候,收益情况对三个参与者取平均。 表示收益情况对输入态0和1取平均。)。与此对应,对于游戏的量子情况,参与者可以使用属于SU(2)群的任何一个操作来操作自己的qubit,但我们为了与经典游戏对应,我们限制每个参与者的策略空间均为I、 和 三种操作的集合,分别与经典的p =1,0,1/2可以分别表示为p≡1,p ≡0,p ≡1/2的收益情况可以参见表3.1.4(表中:“a”代表游戏参与者。p ≡0代表 ;p ≡1P2 代表 ;p≡1代表I。(…)中表示的是输入态为0态的时候,参与者的平均收益。[…]中表示的是输入态为1态的时候,参与者的平均收益。输入态有1P2 的概率是0,1P2概率是1的时候的平均收益由不用括号的数字表示。$表示对于输入态是0或1的时候,收益情况对三个参与者取平均, 表示收益情况对输入态0和1取平均。)。可以看到他们会采取表中第ⅷ类策略,即相干量子平衡点,相应的收益(5,9,5)。如果有一个精灵在游戏参与者不知情的状态下改变输入态时,参与者所获得收益的平均值的变化情况。文献[7]讨论了如果精灵以x的概率将输入态由| 0〉变为| 1〉,而以(1-x )的概率保持输入态不变,则收益情况会分成两部分,在 区间里,在量子游戏里得到的收益比在经典游戏里得到的收益多,而在 区间里,恰恰相反,其中分界点xcr=13/30=0.433。这说明并不是在任何情况下,量子策略都比经典策略优越。这里对现实物理世界有启发意义的是:精灵可以想像成环境的温度效应,如果| 1〉态的能量比| 0〉态的能量高ΔE,那么温度的升高就会导致输入状态由| 0〉到| 1〉的变化。以上的讨论启发我们可以用多体囚徒怪圈游戏来描述多个粒子的相互作用情况,可以把粒子的能量想像成囚徒们的收益,环境的影响可以想像成精灵的作用,多个粒子的动态平衡过程可以想像成量子多体囚徒怪圈游戏的演化问题。这或许是我们研究复杂物理问题的另一条路径。[5] 类 p=0 p=1P2 P=1 C $ ⅰ   aaa(1P2)[1P2]1P2   1 (1P2)[1P2] 1P2 ⅱ a(21P4)[-17P4]1P2 aa(3P4)[1P4]1P23     (9P4)[-5P4] 1P2 ⅲ aa(11P2)[-9P2]1P2 a(3P2)[1P2]1   3 (25P6)[-17P6] 2P3 ⅳ aaa(2)[0]1     1 (2)[0] 1 ⅴ     aaa(0)[2]1 1 (0)[2] 1 ⅵ a(1)[1]1   aa(9)[-9]0 3 (-17P3)[19P3] !P3 ⅶ aa(9)[-9]0   a(1)[1]1 3 (19P3)[-17P3] 1P3 ⅷ a(5)[-4]1P2 a(0)[0]0 a(-4)[5]1P2 6 (1P3)[1P3] 1P3 ⅸ   aa(1P4)[3P4]1P2 aa(-17P4)[21P4]1P2 3 (-5P4)[9P4] 1P2 ⅹ   a(1P2)[3P2]1 aa(-9P2)[11P2]1P2 3 (-17P6)[25P6] 2P3               表3.1.3  经典三体囚徒怪圈游戏中三个游戏参与者的平均收益 类 p≡0 p≡1P2 P≡1 C $ ⅰ   aaa(-15P4)[19P4]1P2   1 (-15P4)[19P4] 1P2 ⅱ a(-15P4)[19P4]1P2 aa(-15P4)[19P4]1P23   3 (-15P4)[19P4] 1P2 ⅲ aa(-7P2)[9P2]1P2 a(3P2)[1P2]1   3 (-11P6)[19P6] 2P3 ⅳ aaa(2)[0]1     1 (2)[0] 1 ⅴ     aaa(0)[2]1 1 (0)[2] 1 ⅵ a(1)[1]1   aa(-9)[9]0 3 (-17P3)[19P3] !P3 ⅶ aa(9)[-9]0   a(1)[1]1 3 (19P3)[-17P3] 1P3 ⅷ a(5)[-4]1P2 a(9)[-9]0 a(5)[-4]1P2 6 (19P3)[-17P3] 1P3 ⅸ   aa(19P4)[-15P4]1P2 a(19P4)[-15P4]1P2 3 (19P4)[-15P4] 1P2 ⅹ   a(3P2)[1P2]1 aa(-7P2)[9P2]1P2 3 (-11P6)[19P6] 2P3               表3.1.4  量子三体囚徒怪圈游戏中三个游戏参与者的平均收益 3.2 PQ博弈量子化 D.A.Meyer于1999年在Phys.Rev.Lett发表的一篇文章中首先研究了量子博弈以及它和量子算法的联系。在扩展式表述中,博弈是用“树”来表示的。这一点和量子算法十分相似。由于这种相似性,我们很容易想到用量子策略对抗经典策略可能会更加有效。在Meyer的这篇文章中,它给出了一个经典两人博弈—“PQ翻硬币”问题[8],并将它量子化。结果表明,当其中一个参与人采用量子策略时,它可以打败他的经典对手,并且获得更高的收益。 “PQ翻硬币”问题的过程如下:P首先将一枚硬币正面朝上放在一个箱子里,然后P和Q轮流(先是Q,接着是P,再是Q)对硬币进行翻转(或不翻转)的操作,在这个过程中不允许打开箱子看硬币的状态。轮流操作完成以后打开箱子,如果硬币正面朝上,那么Q获胜,否则P获胜。 这是一个两人零和策略型博弈,可以用收益矩阵的形式表示如下:   NN NF FN FF N -1 1 1 -1 F 1 -1 -1 1           表3.2.1  两人零和博弈的支付矩阵 表的最上一行是PQ两人使用的纯策略,第二行是P的收益,第三行是Q的收益。 其中行和列上的标号(N和F)分别代表P和Q的纯策略;F代表翻转(flp over),N代表不翻转(no flp over)。收益矩阵中的数字为P的收益:1意味着获胜。-1意味着失败。比如,考虑第一行第二列表予Q的策略为第一次选择翻转而第二次选择不翻转,P的策略为不翻转。如果用H表示硬币正面朝上,T表示硬币背面朝上,那么这是硬币的状态依次为:H,T,T,T所以P获胜,收益为1。 我们很容易确定P的最优策略:假如他选择小翻转,那么当Q翻转偶数次时,他就会输;假如他选择翻转,那么当Q翻转奇数次时,他也会输。因此“PQ翻硬币”问题没有确定性解,也没有确定性Nash均衡,既不存在这样的纯策略组合,使得参与人无法通过单方面改变策略提高收益。然而,这个问题却存在概率 性解,不难验证,当P以1/2的概率选择翻转,Q以1/4的概率选择它的每一个纯策略时,可以构成一个混合策略Nash均衡,此时每一个人的期望收益都是0。 在经过了以上分析后,P认为这个“游戏”是公平的,然而令他不解的是,在和Q玩过几次后,他发现自己每一次都输。 为了理解Q是怎么使得自己每一次都获胜的,我们先用扩展式表述重新分析这个博弈过程。为我们可以定义基矢为(H,T),2维向量空间V,并将参与人的策略对应为一系列的2 2矩阵。也就是说,将矩阵 ,                           (3-9) 分别对应于翻转和不翻转,而将操作对应于将矩阵左乘到表示硬币状态的向量上。混合策略实际上是F和N的凸的线性组合,可以写作: (3-10) 其中P是参与人选择翻转的概率, 。一系列的混合策略的操作将使得硬币的状态变为一个凸的线性组合aH+(1-a)T, ;也就是说,盒子中的硬币正面朝上的概率a。 然而Q采用的是量子策略,也就是一系列的酉阵的操作。采用Dirac符号,向量空间V的基矢可以写成 。硬币的纯量子态是线性迭加 , ,这意味着如果打开盒子,硬币正面朝上的概率为 。由于最开始是硬币的状态为 ,这个态就是在Q实施了如下酉阵操作后硬币的状态。 (3-11) 由于P采用的是经典的混合策略,他以概率P翻转硬币。在P操作后,硬币以概率P处于纯态 ,以概率1-P处于纯态 ,于是我们可以用密度矩阵表示混合态。开始时硬币处于纯态 ,在Q操作后态变成 (3-12) 经过P的混合策略作用后,硬币的态为: (3-13) 对于p=1/2, 的对角元都是1/2。假如博弈就在这里结束,那么P的策略确保他有期望收益0,不论Q取什么策略。事实上,如果Q采用的策略满足 ,那么当 时,P取p=0(p=1),P总是可以获得期望收益 。类似地,如果P选择 ,那么当 时,通过设置a=1(b=1),Q总可以获得收益 。因此策略组 是一个均衡,其收益和经典混合策略情况是一样的。 但是Q还有一次行动的机会, ,将硬币的态变为 。如果Q的策略为 ,在Q的第一次策略行动 ,不论P采取什么样的混合策略,都不能改变这个态,即 。在Q的第二次行动后,将有 。也就是说,硬币正面朝上的概率为1。显然这是Q的最优策略,因为他不可能获得比1还高的收益,而且,任何策略组 (3-14) 都是博弈的均衡。P的收益始终为1,这就是他每次都输掉的原因。 3.3量子博弈实验验证 “量子博弈”理论受到国际量子信息界的广泛关注。虽然目前量子博弈论的研究还处于理论研究的阶段,应用可能还是很远,但物理学家最近已向前迈进了一大步。去年年初,杜江峰小组首先在理论上研究了“囚徒困境”对局中双方手持粒子相互间的量子纠缠程度与对局中纳什均衡点的关系。他们发现,当这个纠缠程度较小时,对局与经典博弈的情况没什么不同,“两人都采取策略B”仍是局中唯一的纳什均衡点。当纠缠程度增大一些时,对局中将出现两个纳什均衡点,从某种意义上说,这时对局处在一种不稳定状态。而粒子的纠缠大到一定程度时,对局中将只有艾泽特所给出的那一个纳什均衡点。 杜江峰小组是利用核磁共振设备实现量子博弈的实验[9]。在他们的实验中,氢原子的核自旋状态充当两游戏者手中的粒子。科学家使用一系列射频磁脉冲对这些粒子的状态进行测控。他们成功制备了不同纠缠程度的粒子态,并模拟两个游戏者按不同情况下纳什均衡所对应的策略对这些粒子进行相应的幺正变换。之后,实验者测量了一个游戏者的收益。实验测得的收益与理论预言吻合得相当好。关于连续变量的囚徒困境博弈,他们也有了对应的量子化实现 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 ,最近周兰等人提出了用光学系统实现量子“囚徒窘境”的方案。[9]  4 量子博弈思想对现实世界的启迪 无论是量子世界或者人类社会,作为研究对象时我们都可以把他们看成一个系统。在我们所能接触到的系统中,都是有人类参与的。换句话说,因为有了人类,这个系统才是这个样子。人类的存在,就注定了这个系统的各种特性以及奇异的行为。否则, 则不会存在人类,更无从谈起去研究系统。从另一个层面讲,人类社会的存在和量子世界的各种特性息息相关,人类的产生归因于现实的物质世界, 而现实的世界是一个有人参与并塑造的世界。因此,现存的各个系统(包括人类社会及量子世界) 都将存在更深层次的密切联系,这种联系归结于宇宙的客观存在性和人类的存在。从这个意义上讲,量子信息和博弈论的结合和量子博弈的产生,以及他们在经济、政治、生物等众多领域的广泛应用,都将是一个必然的趋势。因为人类的意识是随着时间不断积累和探索的,从而人类的认识也是一个向客观世界的真实性即真理逐渐逼近的过程。随着这种进程的发展,物理世界和人类世界的内在联系也将逐渐明朗,正如爱因斯坦对时间的质疑和相对论的产生一样,量子博弈的发展必将引起人类认知领域的又一次革命。 对于量子世界的很多诸如纠缠态的奇异现象,是否存在于人类社会,比如经济领域。或者它与人类社会系统有没有更深层次的联系和本质的共性?博弈论中所展示的人类社会的特性在量子世界是否可以找到踪影,比如人的“自私基因”的假设。对这些问题,是十分有趣的,也是值得去探讨的。我们认为应从以下几个方面来认识:首先,对于一个物理系统,我们能否用博弈思想去解释,例如类似于多体囚徒怪圈的游戏。我们可以把粒子想象成游戏的参与者。他们有独立的判断能力,通过设定一定的游戏规则,我们可以得到很多有用的结论。例如,在分析简单多粒子系统中的物理问题时,我们可以把粒子的能量想象成多体游戏的态,环境的相干可以想象成游戏中精灵的作用。其次,量子博弈思想可以在探索物理本质问题中给我们提供有益的参考。量最小原理是物理学的第一原理。在这个原理中,如果我们能知道系统的拉格朗日量的具体形式,就可以找到满足该系统的微分方程,从而得到一个物理定律。但人们通常不能预先知道系统的拉格朗日量。然而, Frieden 在他的一篇文章中曾指出,拉格朗日量可以从信息测量游戏中直接推导出来。这里,他把物理量的测量过程看成是人类和大自然玩的一个游戏,人类和大自然分别想象成测量者和精灵。测量者(人类)的任务就是尽可能多的得到一个物理量的Fish2er 信息,而精灵(大自然)的任务就是尽可能少的失去这些信息。在这样的游戏规则下,Frieden 得到了一个极端物理信息原理( EPI) 。由这个原理并考虑到物理系统的对称性,就可以导出一个物理系统的拉格朗日量,从而可以得到物理定律及相应的物理常量。同时,利用这个思路,还可以导出薛定谔方程和狄拉克方程。再次,我们可以从另一个侧面看到量子博弈的奇妙之处。物理世界的微观和宏观行为可以从博弈的视觉去分析,而人类社会也受着量子规律的制约和响。物理世界中的原子、分子和电子如果也同样有类似于人类的“自私”特性的话,那么在微观物理世界同样存在着博弈游戏规则,每个原子、分子和电子等都想获得最大的收益(能量),但通常是赢家占少数,输家占多数,对应于能量大的粒子占少数,能量小的粒子占多数,符合统计规律。或许,量子博弈规则是宇宙中最本质的定律,它支配着宏观世界和微观世界,它以人类的存在为前提,反过来又主宰着人类参与的宇宙。 5 总 结 量子信息科学是量子力学与信息科学相结合的产物。量子信息在提高预算速度、确保信息安全、增大信息容量和提高检测精度等方面有可能突破现有经典信息系统的极限。近年来,在理论和实验上以取得了重要突破,引起各国政府、科技界和信息产业界的高度重视。人们越来越坚信,量子信息科学为信息科学的发展开创了新的原理和方法,将在21世纪发挥出巨大潜力。 本文主要介绍了量子博弈的概念和应用,通过经典博弈和量子博弈的对比从而得出量子博弈的很多优越性。首先简单地概述博弈论及量子博弈的发展历史、现状及意义。然后介绍经典博弈的概念 ,具体介绍了经典博弈的例子“囚徒困境”,“囚徒困境”是经典博弈论中的一个极富代表性的一个著名例子。这个例子的创造本身就奠定了非合作博弈论的理论基础,并且它可以作为实际生活中许多现象的一个抽象概括。接着详细描述了量子博弈过程,其中与经典博弈相对应的介绍了“囚徒困境”的量子博弈过程,为了加深理解另外还介绍了PQ博弈的量子过程。在量子博弈中经典博弈中的困境将不再存在,因为该均衡是Pareto 有效的Nash 均衡,偏离这个均衡的策略都将使得参与者的支付减少。在所有情况下,双方的支付期望值都优于经典Nash 均衡的支付值(1,1)。最后简要阐述量子博弈对现实世界的启迪。量子游戏是经典游戏在量子世界的推广,由于量子力学的纠缠和叠加等特性,量子游戏要比经典游戏丰富多彩得多。 但它对现实世界的意义却不只在其游本身。 我们要从两个方面来说明量子游戏对现实物理世界的意义,或许这两方面就是今后人们使用量子游戏来分析复杂物理系统和研究物理世界本质的两种式。一方面,量子游戏可以帮助我们分析复杂的物理问题。另一方面可能是更有趣的,也可能是更本质的,即量子游戏可以帮助我们研究物理世界的本质。 博弈理论与量子力学的结合,形成了量子博弈论。量子博弈论和量子信息有很紧密的联系,量子博弈的过程就是量子信息处理的过程。当博弈者按照量子规律来进行博弈时,量子博弈能够展现出许多经典博弈没有的优越性。总之,现代量子信息论的兴起向我们展现了广阔的研究和应用的空间。量子博弈也正是在这一背景下诞生的,随着研究的深入,我们相信量子博弈将为我们提供一种重要的工具,同时也将会有更多重要的性质被揭示出来。
本文档为【量子博弈】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_196623
暂无简介~
格式:doc
大小:185KB
软件:Word
页数:23
分类:理学
上传时间:2019-03-31
浏览量:13