6.3囚徒困境的破解——重复博弈|20几岁必须要知道的经济学常识|20几岁必须要知道的经济学常识章节阅读-书满屋小说网

亲,双击屏幕即可自动滚动

6.3囚徒困境的破解——重复博弈

    经济学中囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑二年；如果两人都坦白，各判半年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。

    第一眼看起来，两人都坦白，各判半年，对两个人都是最好的。但两个囚徒互相不信任，担心对方如果先坦白，自己抵赖的话，就得判十年这个结果出现。在没有诚信的前提下，显然两人都抵赖，各判刑二年反而成了他们最好的选择。

    既然如此，难道“囚徒困境”是无解的吗？既然“囚徒困境”广泛存在，那如何来理解人类之间同样广泛存在的合作呢？

    -----------

    原来，“囚徒困境”产生于一次性博弈。在一次性博弈中，人们通常对对方无甚信任感和责任感。如果重复博弈，人们就有了合作的可能，“囚徒困境”便不攻自破。

    我们知道，在单个的囚徒困境博弈中，双方采取对抗的策略可使个人收益最大化。让我们再看看，相似的案例放到重复博弈的模型中的情况：

    假设A、B二人进行博弈，A、B均采取合作态度，双方的收益均为50元；A合作B对抗，则A的收益为0元，B的收益为100元；B合作A对抗，则A的收益为100元，B的收益为0元；A、B二人均对抗，则双方收益均为10元。由此我们可以看到，如果双方都合作，每个人都将得到50元，而如果双方都对抗，则各自只能得到10元。那么人们为什么还会选择对抗而不是合作呢？原因就在于这是一个一次性博弈的囚徒困境--既然无论对方选择什么，选择对抗总是我的最优策略，那么作为一个"理性经济人"，我自然就会选择对抗了。

    但是，如果A、B具有长期关系（比如他们是生意上的长期合作者），那么情况则有所改观。因为我们可以作如下推理：如果双方一直对抗，那么大家每次都只能获得10元的收益；而如果合作，则每次都可得到50元。最重要的是，假定A选择而B选择对抗，那么B虽然在这一次可以多得到50元(100-50=50)，但从此A不再与他合作，B就将损失以后所有的得到50元机会。

    因此从长远利益来看，选择对抗对双方而言并不聪明，合作反而是二人最好的选择。这更真实地反映了日常生活中人们合作与对抗的关系，也可以用来解释一些商业行为。

    比如在公共汽车上，两个陌生人会为一个座位争吵，因为彼此知道，这是一次性博弈，吵过了谁也不会再见到谁，因此谁也不肯在嘴上吃亏；可如果他们相互认识，就会相互谦让，因为他们知道，二者以后还会有碰面甚至交往的可能。两个朋友因为什么事情发生了争吵，如果不想彻底决裂，通常都会在争吵中留有余地，因为二人日后还要"重复博弈"。

    比如你到菜场去买菜，当你担心上当受骗而犹豫不决时，卖菜的摊主便会对你说："你放心好了，我天天在这里卖菜，不会骗你的，如果菜不好你回来找我！"他强调自己"天天"在这里卖菜，你通常便会放下心来，与之成交。因为他的这句话翻译成经济学的语言就是"我跟你是'重复博弈'"。而一次性的买卖往往发生在双方以后不再有买卖机会的时候，特点是尽量谋取暴利并且带欺骗性，比如车站、码头、旅游景点的东西往往质次价高，其原因就在于买卖双方很少有"重复博弈"的机会。

    经济学家罗伯特·阿克塞尔洛德设计了一个重复博弈的计算机程序，探索重复博弈产生的合作机制，共几十名测试者参加。最终结果是：“一报还一报”的战略原则，获得了最终胜利。所谓“一报还一报”，是指第一回合进行合作，以后不管对方怎么走，均采取对方上一个回合中的策略。这一结果又为多次实验共同证实。

    深入分析这个颇似“以其人之道还治其人之身”的“一报还一报”原则，其中包含四个特点：（1）善意的，即不首先背叛对方；（2）宽容的，对方背叛一次只惩罚一次；只要对方合作，即予以接纳，并不计前嫌；（3）强硬的，只要对方本次背叛，下次必定给予背叛的报复。（4）简单明了的，即自己的意图清晰简洁，能很直接的为对方识别。

    而输掉这个竞赛的策略，总是在上述四个方面做得不够好。比如竞赛者的脾气过于好，总是"以德报怨"，结果就被狡猾之徒反复地占便宜；有些竞赛者不够宽容，别人背叛一次他就不与对方再次合作，从而使合作关系永久性断绝；还有一些竞赛者太"精于算计"，总是试图通过取巧来占别人的便宜，这种人在与"好脾气者"的博弈中虽然大占便宜，但与"不宽容者"的博弈中往往搬起石头砸自己的脚，而从最后的总分来看，他的"小聪明"总是得不偿失。

    "针锋相对策略"在实际生活中可以被广泛地应用：

    比如，美芝是一个特别善良的女孩，她在任何情况下都不会伤害别人，即使在受到别人的欺骗甚至伤害时，也只是默默的忍受，不表示反抗。她认为即便报复了他们也并不能消除已经造成的伤害，而且她的心也非常软，不忍心报复别人。所以每次遇到不公平的事情，她总是习惯沉默。对待曾经伤害过她的人，她也总是一视同仁。

    后来美芝结婚了，而他的丈夫也正是看上了她的好脾气，他知道即便伤害了美芝也会获得宽恕，所以他就一直有意无意地不停伤害美芝。因为他知道无论如何，只要一些花言巧语、再摆出一副要痛改前非的可怜相，就会轻易地获得宽恕。

    婚姻是一种长久的关系，当然不是一种单次博弈，而是一种重复博弈。所以对于美芝来说，越是想维持两个人之间良好的关系，越是应该对丈夫的每一次无礼行为有所反应，这样才能建立一种互敬互爱的良好的婚姻氛围，当然反应也要适度，对方背叛一次只惩罚一次，只要对方合作，即予以接纳，并不计前嫌。

    通过前面的分析我们知道，在一次性博弈中，"对抗"对双方而言是最优策略，在重复博弈中，"合作"对双方而言是最优策略。而在有限重复博弈中，由于最后一次博弈是确定会出现的，这个"最后一次博弈"可以被视为一个"一次性博弈"，也就是说，在双方的最后一次博弈中，"对抗"是最优策略，因为人们在重复博弈中之所以选择合作，主要是考虑日后还要进行博弈，而在最后一次博弈中则没有以后，因此显然不必考虑后面的行动。

    因"有最后一次的重复博弈"而发生的对抗性情形在生活中并不鲜见。

    比如章飞、程冲两个同事素有矛盾，但因为在一家单位工作，二人面临的是长期共事，且谁也不知道会共事到什么时候，虽然对对方有意见，表面上相处得倒还看得过去，虽然有些暗斗，但不会明争，更不会大打出手。但有一天，章飞决定离开公司，临走的那一天，因为一点小事，和程冲又有些不和。这次双方都没有任何那么顾忌，双方积蓄已久的矛盾也由此点燃，集中爆发，两人大打了一架。

    这就是因为当"无限重复博弈"转成"有限重复博弈"时，双方所能选择的最佳策略是对抗。