登陆注册
8158800000002

第2章 认识博弈论(1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门科学。用我们日常的语言来说,博弈论就是研究在不同情境下的策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并加以实施各自所倾向的行为或是策略,并从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例。《孙子兵法》、《三十六计》、《三国演义》等等,就不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究象棋、围棋以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论化发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家约翰·冯·诺伊曼证明了博弈论的基本原理,并与经济学家奥斯卡·摩根斯坦合作于1944年发表了《博弈论与经济行为》一书,提出合作博弈的基本模型,并将二人博弈结构推广到n人博弈结构。至此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生的标志。

目前,博弈论作为分析和解决冲突和合作的理论工具,已经在管理科学、国际政治、经济、外交和社会学等领域得到广泛的应用,为解决不同实体的冲突和合作提供了宝贵的方法,并日渐发展成为一热门学科。

博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者构成一个决策主体。

决策主体的目的是通过选择行动或者战略以使自己的效用水平最大化。只有两个决策主体的博弈现象称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业,国家等。

——策略策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终地对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用效用,又叫做支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈的付出或者收益。效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所取定的一组策略有关。一局博弈结束时每个决策主体的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所做的是努力使自己的期望支付或期望效用最大化。

——按照参与者能否形成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行的博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成合作时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行约束,以达到获取更多垄断利润的行为。

反之,不能强迫其他参与者遵守某一协议,各参与者只能选择自己的最优战略的,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动的顺序,可以分为四种不同的类型,即:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,规定每个决策主体的行为规则。如果在没有外在强制性约束时,各参与者自觉遵守该协议,没有人偏离协议规则,就构成一个纳什均衡(概念见第2章)。只要有一个参与者违背协议规定,则此协议就不构成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预期到这一点,所以也会考虑到自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。每个参与者的最优策略只能是在给定自己的类型和他人类型依从策略的情况下,最大化自己的期望效用。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择并获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行为的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣,理论上又颇有深度的学问。可以毫不夸张地说,了解博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择行为,而策略选择问题实际上就是博弈论的本质所在。

多种立场,一个思想

囚徒困境最早是由美国普林斯顿大学数学家塔克于1950年提出来的。他当时编纂了一个故事,意在向斯坦福大学的心理学家们解释什么是博弈论。后来经过发展,囚徒困境成为了博弈论中最著名的案例之一。

所谓囚徒困境,大意是这个样子的。有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。

针对两人的狡辩,警方对他们采取了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:

本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,根据将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期。如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放。当然,如果你们两人都坦白,那么你们都将只被判15年刑期。在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年徒刑)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。

心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。

汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢15年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。

同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人”。基于此基础之上的合作才能形成一个和谐的、良好的社会环境。

在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。

实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是典型的囚徒困境现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。

如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些联盟往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。

合作,有时是利益需要

农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,交通不便,使得两户人家与外界的交流十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户人家从修好的这条路上获得的好处为3个单位。如果没有中间人协调,上官、欧阳两家就各自打着自己是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户人家获得的好处为1(3-2=1)个单位;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为-1(3-4=-1)个单位,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路(修路人并没有拥有道路的占有权,总不能因为修了路就不让邻居走),白白获得3(3-0=3)个单位的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。

对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势策略;若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势策略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:

大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有自私本性但并不刻意损害他人的人类一员。

公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此作出丝毫贡献。那么,这长椅由谁来设置呢?恩惠于大家的公共事情又由谁来管呢?

同类推荐
  • 毕业头三年:决定你职业前途的黄金期

    毕业头三年:决定你职业前途的黄金期

    如果你也正在面对无数企业的HR,做不完的case;你也一样是个怀揣抱负且初登甲板的职海水手;你也很想去体悟办公室里究竟会发生什么事情;或者你更想知道一个草根如何在三年的时间里,由新成“猿”磨练成“首席”、“骨干”;那么,现在就去《毕业头三年(决定职业前途的黄金期)》的故事中体会主人公认真记录下来的每一段历练心得吧!本书由那森著。
  • 找对人办对事

    找对人办对事

    本书从找人办事入手,着重从社会实践的角度去拓展人们在社会以及生活中的思维方式,升华思维格局,提供实用独特的方法、技巧、手段等,针对不同方面的难事一一破解,为已经走入社会的朋友以及还没踏入社会的朋友提供找人办事之捷径及方法。
  • 你该怎么说

    你该怎么说

    本书模拟人生关键处的实战说话场景,介绍了娴熟掌握各种说话技巧:何时嘘寒问暖、何时甜言蜜语、何时谦虚退让、何时慷慨激昂、何时出语反击等等。
  • 幸福有三件事:有希望、有事做、能爱人

    幸福有三件事:有希望、有事做、能爱人

    俞敏洪说,幸福有三件事:有事做、有人爱、有所期待。做到了这三件事,那你的生活每一天都很幸福。
  • 处世规则(一)

    处世规则(一)

    本书内容包括:做人的规则、做事的规则、交往的规则、成败的规则、得失的规则、处事的规则、平衡的规则。
热门推荐
  • 被动达人

    被动达人

    天城上辈子是个程序员,喜欢在家看剧追番打游戏。某一天,一觉醒来的他,发觉自己来到了一个陌生的世界,荒野一片,危险环饲,他只能依靠自己不靠谱的金手指…艰难求生…
  • 仙道诛魔

    仙道诛魔

    山野小子,孤苦无依。镇内血灾,唯一存活得机遇,遇千古良缘!进道观,开启修炼之路!不屈意志,终受人尊敬!地下石室,得佳人相助,枯木成剑!一套剑诀,震惊四下,得入飘渺门!天下纷乱,血魔乱舞,展英豪之姿!诛魔大阵,万魔伏诛,却失良佳人!一段佳话,独行者,只为一把剑,却为一段情!
  • 赌后倾城

    赌后倾城

    她,24世纪的皇家赌城掌权者,人送外号‘黑玖瑰’,拥有的财富,权势,足以颠覆一个国家。然,却因为一个男人,被自已的亲生妹妹背叛,一入阿弥地狱,奈何桥上帮着黑白无常坑了孟婆一把,让她老人家一气之下把她踹了个重生,成了苍古大陆烈焰帝国风家的嫡生千金小姐,从此,懦弱无能的千金小姐恍若凤凰涅槃,风华独立,傲视世人,一身赌技令无数人折服。【情节虚构,请勿模仿】
  • 人性的枷锁(英文版)

    人性的枷锁(英文版)

    《人性的枷锁》是英国小说家毛姆的成名作,也是他的代表作。同时,它也被认为是毛姆的自传体小说。美国现代图书馆将此小说列为“20世纪英语世界最佳100部小说”中的一部,位列第66位。《人性的枷锁》这部小说后来成为毛姆享誉最高、历久不衰的作品。读过此书者,很少有人能忘记主角菲利普在伦敦医学院读书时所经历的惨痛爱情经验。那是全书最生动精彩的地方,作者用戏剧性手法,写出人性的纠葛。
  • 史上第一逃亡

    史上第一逃亡

    如果上天能给我一次重来的机会,我会对那个女孩说三个字:我愿意。如果非要在这份爱上加上孩子数量,我希望是…生一万个。“清清,我不想努力了,我自首行吗?”穆清清御空俯视:“谁要能活捉陈逍,镇宫之宝一气化三清、神兵斩仙剑、法宝乾坤袋随便挑,我一定要杀了他。”于是乎,陈逍只能浪迹天涯。标签:搞笑、热血、爽文、智商在线、浪到飞起、出城后节奏贼快。
  • 天道吞噬系统

    天道吞噬系统

    大道五十,天衍四十九,留一线生机,那遁去的一道便是变数。穿越后,王林偶得天道吞噬系统,不仅可以吞噬万物,还可以兑换功法、神兵、丹药、宝物等等,天地万物都可兑换。别招惹我,一不小心把你的神兵吞了。
  • 快穿小哥别惹我

    快穿小哥别惹我

    失去记忆的高涵,被统子选定,通过交换条件,高涵成功的开启了快穿之旅。
  • 谁耗尽了谁的青春

    谁耗尽了谁的青春

    五年的时间,让她从一个平凡的女人变成了铁血无情却又优雅高贵的女人,只出现于黑夜,隐藏于暗中,进行着属于自己的报复,一个身份,两个人。手术台上,她生下孩子却连看都没有看一眼,就此失踪,所有人都觉得她已经死了,五年之后,再一次出现在众人的眼中,她是所有人眼中的成功者,优雅美丽,高高在上,但是她却已经是另外的身份,带着属于自己的伪装在形形色色的人中游刃有余的周旋。只是这一份淡定在见到那长的一模一样的一大一小的时候彻底的破裂了。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 一丈蒹葭

    一丈蒹葭

    君隔一丈蒹葭,入命却是桃花。如果我的死是必然,那神啊,拜托你让我在死前,能够拥抱到他……(bl文,小虐,结尾surprise,非腐者慎入)