亲,双击屏幕即可自动滚动
6.3囚徒困境的破解——重复博弈
    经济学中囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑二年;如果两人都坦白,各判半年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。

    第一眼看起来,两人都坦白,各判半年,对两个人都是最好的。但两个囚徒互相不信任,担心对方如果先坦白,自己抵赖的话,就得判十年这个结果出现。在没有诚信的前提下,显然两人都抵赖,各判刑二年反而成了他们最好的选择。

    既然如此,难道“囚徒困境”是无解的吗?既然“囚徒困境”广泛存在,那如何来理解人类之间同样广泛存在的合作呢?

    -----------

    原来,“囚徒困境”产生于一次性博弈。在一次性博弈中,人们通常对对方无甚信任感和责任感。如果重复博弈,人们就有了合作的可能,“囚徒困境”便不攻自破。

    我们知道,在单个的囚徒困境博弈中,双方采取对抗的策略可使个人收益最大化。让我们再看看,相似的案例放到重复博弈的模型中的情况:

    假设A、B二人进行博弈,A、B均采取合作态度,双方的收益均为50元;A合作B对抗,则A的收益为0元,B的收益为100元;B合作A对抗,则A的收益为100元,B的收益为0元;A、B二人均对抗,则双方收益均为10元。由此我们可以看到,如果双方都合作,每个人都将得到50元,而如果双方都对抗,则各自只能得到10元。那么人们为什么还会选择对抗而不是合作呢?原因就在于这是一个一次性博弈的囚徒困境--既然无论对方选择什么,选择对抗总是我的最优策略,那么作为一个"理性经济人",我自然就会选择对抗了。

    但是,如果A、B具有长期关系(比如他们是生意上的长期合作者),那么情况则有所改观。因为我们可以作如下推理:如果双方一直对抗,那么大家每次都只能获得10元的收益;而如果合作,则每次都可得到50元。最重要的是,假定A选择而B选择对抗,那么B虽然在这一次可以多得到50元(100-50=50),但从此A不再与他合作,B就将损失以后所有的得到50元机会。

    因此从长远利益来看,选择对抗对双方而言并不聪明,合作反而是二人最好的选择。这更真实地反映了日常生活中人们合作与对抗的关系,也可以用来解释一些商业行为。

    比如在公共汽车上,两个陌生人会为一个座位争吵,因为彼此知道,这是一次性博弈,吵过了谁也不会再见到谁,因此谁也不肯在嘴上吃亏;可如果他们相互认识,就会相互谦让,因为他们知道,二者以后还会有碰面甚至交往的可能。两个朋友因为什么事情发生了争吵,如果不想彻底决裂,通常都会在争吵中留有余地,因为二人日后还要"重复博弈"。

    比如你到菜场去买菜,当你担心上当受骗而犹豫不决时,卖菜的摊主便会对你说:"你放心好了,我天天在这里卖菜,不会骗你的,如果菜不好你回来找我!"他强调自己"天天"在这里卖菜,你通常便会放下心来,与之成交。因为他的这句话翻译成经济学的语言就是"我跟你是'重复博弈'"。而一次性的买卖往往发生在双方以后不再有买卖机会的时候,特点是尽量谋取暴利并且带欺骗性,比如车站、码头、旅游景点的东西往往质次价高,其原因就在于买卖双方很少有"重复博弈"的机会。

    经济学家罗伯特·阿克塞尔洛德设计了一个重复博弈的计算机程序,探索重复博弈产生的合作机制,共几十名测试者参加。最终结果是:“一报还一报”的战略原则,获得了最终胜利。所谓“一报还一报”,是指第一回合进行合作,以后不管对方怎么走,均采取对方上一个回合中的策略。这一结果又为多次实验共同证实。

    深入分析这个颇似“以其人之道还治其人之身”的“一报还一报”原则,其中包含四个特点:(1)善意的,即不首先背叛对方;(2)宽容的,对方背叛一次只惩罚一次;只要对方合作,即予以接纳,并不计前嫌;(3)强硬的,只要对方本次背叛,下次必定给予背叛的报复。(4)简单明了的,即自己的意图清晰简洁,能很直接的为对方识别。

    而输掉这个竞赛的策略,总是在上述四个方面做得不够好。比如竞赛者的脾气过于好,总是"以德报怨",结果就被狡猾之徒反复地占便宜;有些竞赛者不够宽容,别人背叛一次他就不与对方再次合作,从而使合作关系永久性断绝;还有一些竞赛者太"精于算计",总是试图通过取巧来占别人的便宜,这种人在与"好脾气者"的博弈中虽然大占便宜,但与"不宽容者"的博弈中往往搬起石头砸自己的脚,而从最后的总分来看,他的"小聪明"总是得不偿失。

    "针锋相对策略"在实际生活中可以被广泛地应用:

    比如,美芝是一个特别善良的女孩,她在任何情况下都不会伤害别人,即使在受到别人的欺骗甚至伤害时,也只是默默的忍受,不表示反抗。她认为即便报复了他们也并不能消除已经造成的伤害,而且她的心也非常软,不忍心报复别人。所以每次遇到不公平的事情,她总是习惯沉默。对待曾经伤害过她的人,她也总是一视同仁。

    后来美芝结婚了,而他的丈夫也正是看上了她的好脾气,他知道即便伤害了美芝也会获得宽恕,所以他就一直有意无意地不停伤害美芝。因为他知道无论如何,只要一些花言巧语、再摆出一副要痛改前非的可怜相,就会轻易地获得宽恕。

    婚姻是一种长久的关系,当然不是一种单次博弈,而是一种重复博弈。所以对于美芝来说,越是想维持两个人之间良好的关系,越是应该对丈夫的每一次无礼行为有所反应,这样才能建立一种互敬互爱的良好的婚姻氛围,当然反应也要适度,对方背叛一次只惩罚一次,只要对方合作,即予以接纳,并不计前嫌。

    通过前面的分析我们知道,在一次性博弈中,"对抗"对双方而言是最优策略,在重复博弈中,"合作"对双方而言是最优策略。而在有限重复博弈中,由于最后一次博弈是确定会出现的,这个"最后一次博弈"可以被视为一个"一次性博弈",也就是说,在双方的最后一次博弈中,"对抗"是最优策略,因为人们在重复博弈中之所以选择合作,主要是考虑日后还要进行博弈,而在最后一次博弈中则没有以后,因此显然不必考虑后面的行动。

    因"有最后一次的重复博弈"而发生的对抗性情形在生活中并不鲜见。

    比如章飞、程冲两个同事素有矛盾,但因为在一家单位工作,二人面临的是长期共事,且谁也不知道会共事到什么时候,虽然对对方有意见,表面上相处得倒还看得过去,虽然有些暗斗,但不会明争,更不会大打出手。但有一天,章飞决定离开公司,临走的那一天,因为一点小事,和程冲又有些不和。这次双方都没有任何那么顾忌,双方积蓄已久的矛盾也由此点燃,集中爆发,两人大打了一架。

    这就是因为当"无限重复博弈"转成"有限重复博弈"时,双方所能选择的最佳策略是对抗。