当前位置: 在线阅读网 > 经济学书籍 > 经济学通识课 > 20 囚徒困境——纳什与博弈论

20 囚徒困境——纳什与博弈论

假设两个国家互相威胁要炸毁对方,其中一个国家配备了导弹瞄准敌国,另一个国家也会照此行动。每一个国家都试图通过购买武器获得优势,结果便是“军备竞赛”(arms race)。最后两个国家都拥有大量瞄准对方的导弹。军备竞赛是“博弈论”(game theory)的一个例子,这个理论诞生于20世纪40—50年代的数学和经济学领域。博弈论研究国家、公司和个人在某种情况下的行为,即一方的行为会影响到另一方获得的结果。你的敌人购买导弹,便将你置于不利地位,并令你的国家安全受到威胁;你购买导弹,会对敌国产生同样的影响。每一方都需要决定自己的行为,同时将敌人的行为考虑进来。博弈理论家称其为“策略互动”(strategic interaction):我们互相影响(我们互动),因此我们会根据敌人的行为决定自己的行动(我们有“策略”)。博弈论研究无处不在的战略性的互相影响,从类似剪刀—石头—布的游戏,到经济中的利益寻求、国与国之间的战争。[书 .免`费`分`享V.信shufoufou]

在第二次世界大战结束后,美国和苏联成为死敌。这个时代就是著名的冷战时期:双方都被卷入轰轰烈烈的军备竞赛之中,并互相用致命的核武器威胁对方。1964年,一部名为《奇爱博士》的电影对这种竞争进行了嘲讽,同时其扣人心弦的故事情节,也很好地展现了当时所处的博弈时代,以及博弈论的基本观点。在冷战时期,美国军队在有助于国家安全的领域中投入了大量研究资金,其中就包括对博弈论的钻研。许多博弈论理论家为军队研究机构兰德(“研究和发展”)公司工作。在电影中,奇爱博士是美国总统武器研究的负责人,他是一个古怪的天才,戴着深色的眼镜,操着可笑的口音为军事策略出谋划策。据说他的原型是受一个真正的天才的启发——匈牙利籍数学家冯·诺依曼(John von Neumann,1903-1957),他是博弈论的提出者之一,为兰德公司工作,并成了艾森豪威尔总统的防御战略顾问。诺依曼天资聪颖,8岁时就可以进行8位数除法的心算。成年后他撰写了关于震荡波、空气动力学以及星球毁灭的论文,并在业余时间,开创了博弈论。

想象你自己是一位将军,需要决定是否购买更多的炸弹。你知道敌国的将军也要做出同样的抉择。你会如何做出实际的决定呢?决策的很大一部分在于搞清楚敌人可能采取的行动。一旦实现了知己知彼,我们说结果可能是——双方都买导弹,或者没有一方购买,或者其他可能性。诺依曼迈出了一大步,他找到了得出结果的方法。但是这种方法仅在某种情况下适用,比如参与者可以进行协商并达成牢靠的协议。两个敌国的将领是无法做到这点的,因此需要适用于其他情况(包括参与者不一定会坚守承诺的情况)的方法。

1950年,数学家约翰·纳什(John Nash,1928—2015)想出了一个解决方法。纳什在普林斯顿大学就读期间就有了这个想法。他决定带着自己的观点拜访当时在普林斯顿任教的诺依曼。虽然诺依曼已经是大名鼎鼎的人物,但纳什并没有畏缩。(在那之前,他曾突然造访爱因斯坦,讨论他关于宇宙扩张的一些新想法。)著名的诺依曼将纳什送出门,告诉他,他的观点无甚意义。

事实上,纳什的观点后来成为了博弈论中最重要的部分,并在今天被广泛应用。他认为博弈的结果——其“均衡”——是每个参与者的策略,是对其他参与者策略的最优反映。当每个人都这样做时,没有人有理由改变自己采取的行动,这便是博弈中的均衡。纳什证明大多数博弈都有均衡。以我和我的敌人而言,鉴于敌人购买了导弹,我最好的回应便是采取同样的行动,最糟糕的是,面对敌人的威胁而没有武器。同样的推理也适用于敌方,如果我购买了武器,他们也必定会做同样的事情。我们双方建立起导弹储备,这便是博弈的均衡。

军备竞赛是博弈论著名的“囚徒困境”(prisoners’dilemma)的一个版本,它由兰德公司的数学家们发明。在这种博弈中,两个劫匪因为抢银行被捕。警察的证据不足,但是明白他们至少可以以逃税为由将劫匪定罪。劫匪被分开审讯,每个人都可以招供或拒绝认罪。警察告诉劫匪们,如果他们一个招供而另一个拒不认罪,他们便会将不认罪者视为主犯,并将认罪者当作证人。拒绝认罪者将被判处20年监禁,而招供者会被释放。如果二人都拒绝承认抢劫的罪行,他们将会因为逃税被判4年监禁。如果二人都认罪,他们将因为抢劫罪判处10年有期徒刑。

劫匪们会怎么做呢?假设其中一个劫匪认为同伙会认罪的话,拒绝认罪将会导致他被悲惨地关押20年,因此他必定会认罪。从另一个角度来说,即使他不相信同伙会认罪,他也应该认罪,因为那样他就会得到自由。当两个人都进行了同样的推理后,他们就都会认罪。“囚徒困境”获得了清晰的平衡:两个劫匪都会认罪。

尽管如此,上述均衡中还是有些奇怪。参与者们做出对自己最优的回应,但获得的结果却并非对双方是最优的。两个人都不认罪才是更好的,但这却不是均衡:任一劫匪出卖伙伴的结果总是更好的,认罪是因为怀有获释的期望。在囚徒困境中,劫匪采取理性的行动,却获得了更糟糕的结果。在军备竞赛中同样如此,博弈的结果是两国都储备了导弹。最终双方都无法压制对方,但却都在武器上投入了大量资金。如果双方一开始都没有买入导弹,那才是更好的结果。

囚徒困境在经济学中总会忽然出现。以发电站中使用的大型涡轮发电机为例。20世纪60年代,美国两大制造商通用电气和西屋电气公司,希望他们的发电机都能有一个好价钱。一种方式是彼此联合起来同意减少发电机的销量并抬高价格。问题在于,当价格上升之后,其中一家公司可能在利益的诱惑下通过降低一点价格来压倒对手,卖出更多的发电机。这当中的危险在于价格暴跌,导致两家公司获得的利润都下降。两家公司的处境和劫匪是否认罪完全一样。产油国也面临同样的问题。在20世纪60年代,这些国家彼此承诺减少石油供给,以便提高油价。但一旦价格上去了,一些国家就会想要生产更多可以销售的石油。

在商业、政治和日常生活中,人们有时竞争有时合作。博弈论提供了一种帮助我们思考这种复杂性的方法。什么时候人们会倾向于一起合作,什么时候又会激烈竞争?比如在囚徒困境中,合作总会面临破裂的风险。

一些博弈考虑到了更特殊复杂的策略,特别是当接二连三地做出决定时,你可以在做决定的时候先看清楚其他人都做了什么。你可以说,如果你的竞争对手采取了不受欢迎的行动,你会对他们做出惩罚。在20世纪70年代,美国两家咖啡企业麦斯威尔和福爵互相争夺美国市场。福爵向东扩张,希望控制麦斯威尔作为主要供应商的区域。麦斯威尔发动了价格战,降低咖啡的价格,以便将福爵赶出自己的市场。其结果是:如果你进入我的市场,那么我就大减价。我希望这样能首先阻止你进入我的市场。但是,这种威胁的问题在于它们并不总是可靠的。你或许会认为我不会跟随你的战略,因为低价会让我赔很多钱。好在,在麦斯威尔和福爵的例子中,威胁生效了:麦斯威尔使福爵进军纽约市场的企图受挫。

但是,《奇爱博士》的故事展示了实施有效威胁是一件多么困难的事。为了阻碍一场核攻击,你会告诉敌人自己绝对会以牙还牙。可是,一旦敌人真的发射了导弹,他们便肯定你不会进行报复,因为两颗导弹便足以毁灭地球上的生命。在电影中,暴躁的美国将军下令对苏联发射核弹,美国总统试图取消攻击,但是将军切断了和总统的通讯。总统召见苏联大使,大使告诉他苏联已经布置了一个“世界末日机器”,这个巨大的炸弹一旦被引爆将会摧毁所有生命。如果对苏联发动攻击,它将会自动发射,并无法关闭。奇爱博士向总统解释了机器的逻辑:通过自动化和不可逆转性,这台机器成了一种可靠的威胁,于是便应该能够打消敌人进攻的念头。电影通过爱奇博士对苏联大使的咆哮告诉我们,只有当所有人都知道这件事的时候,它才会发挥作用。

世界末日机器揭示了博弈论的一个基本策略:关键在于影响对手对你的想法。一家企业威胁要报复竞争对手,需要让自己显得好勇斗狠,而不是软弱无力。世界末日机器在经济中的体现就是建设一个比市场需求大得多的工厂。一旦建立起来,就算不惜血本也要席卷市场,只有这样才能收回一些建厂时的投资。20世纪40年代,美国铝业公司控制了该行业90%的产能,就是采用了这个策略来排挤竞争者。

纳什在年轻时通过几篇数学文章介绍了自己的观点,随后便销声匿迹。他一直饱受严重精神疾病的困扰并在医院中度过了几十年的光阴,但是他的思想却在经济学中引发了一场变革。(2001年电影《美丽心灵》讲述的便是纳什传奇的一生。)经济中的战略互动频繁发生,但是在博弈论诞生之前,这部分一直被经济学家们所忽视。经济中存在许许多多的买家和卖家,任何一方都无法单独对价格施加影响。当成千上万的苹果销售商服务于成千上万的消费者时,如果他们以市场价格销售苹果,那么无论卖出去多少,他们都不用担心竞争对手的行为或想法,也不必处心积虑压倒彼此寻求生存。博弈论使经济学家可以对更复杂、现实的,存在着人和人、企业和企业较量的情境做出分析。后来,纳什逐渐康复,并因其提出的具有开创意义的观点于1944年获得诺贝尔经济学奖。今天,该理论应用在几乎所有的经济学领域。

在线阅读 网:http://www.Yuedu88.com/