博弈论(6):日常生活里的「囚徒困境」,我们如何破解?
文/老余
亚当·斯密在《国富论》中说,“当人们在追求个人利益最大化时,往往不自觉会促进社会整体福祉的增加”。
他相信看不见的手能很好的调节资源,优化配置效率。
但博弈论告诉我们,还真不一定,起码在「囚徒困境」下不一定。
怎么说?
可能你已经非常熟悉囚徒困境了,为了把道理讲明白,我们一起回顾下。
(一)囚徒困境下个人追求利益最大化时,却把整体福祉推向了深渊
两个小偷被警察抓了,但警察手里并没有过硬的证据,于是给了两人一组规则,正是它让两人的最优选择都是招供。
规则是这样的:
如果A招了B没招,那A算是戴罪立功,可以功过相抵立马释放,没招的B判5年;如果两人都招了,这里就没有立功不立功的问题了,两人都判3年;当然,两小偷心里明白警察手里没有证据,只要两人死不开口,警察也没办法,最后的结果是因证据有限,两人都只判1年。
文字表达不直观,我们将规则矩阵化后如下:
矩阵边上是两人采取的行动,中间四个象限是两人行动带来的后果,我们一眼就能看出,如果把两人作为一个整体,最好的选择就是:右下角的两人都不招——这样两人都获刑一年,总数加起来才2年,而其他任何选项都会高于这个数。
但如果你就是其中之一,不考虑人情世故等因素,你真的会打死都不招吗?
不是!
恰恰相反,如果你是一个足够理性的人,不管对方怎么着,你的最优选择其实都是招,理由如下:
如果对方招供了,你也招就比不招好,因为你不招的话就是5年的最高刑罚,而招了的话只有3年;如果对方没招,你招也比不招好,因为你招了就是戴罪立功直接释放了,而不招却要关一年。
这就是博弈论里的压倒性策略:
——不管对手怎么做,这个策略对你来说都是最优选择。
而如果双方都是理性人,你是这么想的,对方也是这么想的,结果就是两人都选择了招供。
——你看,两个最理性的选择,却不可避免地把整体的收益推向了最差的境地(两人相加获刑6年)。
虽然不是整体最优的,但对参与其中之的个体却是最优选择,于是没有任何一方愿意单方面改变自己的策略,这就是——纳什均衡。
这真是一个难题啊!
在《博弈论》系列之前的文章《有一种困境叫自由,有一种自由叫束缚》中说过几种解法,但那些都有点高高在上不接地气,在我们的日常生活中很难用到。
本篇来说一说日常生活里的囚徒困境,我们该如何解决?
(二)压缩对方选项,让对方的选择符合他自己利益的情况下,也符合你的
什么意思?
我们看一个真实的例子:
英国BBC曾有一个很受欢迎的节目叫“金球游戏”,当一场淘汰游戏只剩下两人时,节目组就把两人置于囚徒困境之中:
节目组设置一个高额奖金,并给俩人各两个按钮,一个按钮上写着“全拿”,一个按钮上写着“平分”;如果A选择“全拿”,B选择“平分”,那A就真的全拿,B一分钱都没有;如果A、B都选择了“全拿”,两人均一分钱没有;如果A、B都选择了“平分”,那就真的平分。
这和上面的囚徒困境是一模一样的,转成矩阵如下:
同理,双方作为理性人,不管对方怎么选,我的最优选择都是「全拿」为,从数学期望来讲更直观(对方二选一的概率皆为50%):
我选「全拿」的数学期望E1=0元×50%(对方也选全拿)+全部奖金×50%(对方选平分)=全部奖金的1/2;我选「平分」的数学期望E2=0元×50%(对方选全拿)+奖金的一半×50%(对方选平分)=全部奖金的1/4
显然,E1>E2。
无论对方怎么选,我的压倒性策略就是选择「全拿」,同样,双方都是这么想的,最后的结果就是整体最差的那一项——双方空手而回(0元,0元)。
但有一次,“金球游戏”的意外出现了,最后剩下的两人一个叫尼克(为方便我们称之为A),一个叫亚布拉罕(B),当然,双方是陌生人,所以没有人情世故方面的因素,且在最终抉择前,双方是可以说话的,这场的奖金池累积到了13600英镑,这是一笔大钱。
在场的所有人都以为,这将与大多数场次一样,最后的结果就是那个该死的(0,0)的纳什均衡。
游戏开始,主持人说:在最终选择按钮前,你们可以交流一下;
尼克(A)显然有备而来,直接斩钉截铁地对亚布拉罕(B)说:我会按下「全拿」,我向你保证我会这么做,你只要按下「平分」键后,我会分一半给你!如果你选「全拿」,我们俩肯定会空手而回。
B直接被A搞乱了心态,他原以为A会和其他选手一样,会先想尽办法让对方相信自己会选「平分」,然后劝你也选「平分」,这样给你画一个双方都可以各拿一半钱回家的美好景象,只要他认为你相信了,那些坏人就可能利用你的信任,违背承诺选「全拿」,真实的结果是他领走了全部奖金,而轻信于人的你却空手而回。
主持人也反应过来,对B说:请你明白,这个保证是不受法律保护的。”
B道:我明白,然后给A建议,我们为何不都选「平分」呢?这么选的结果和你建议的是一样的。
A眼神坚定地说:不!我肯定选「全拿」,如果你选「平分」,我会分一半奖金给你;如果你选「全拿」,我们两都将两手空空。
B要疯了,直接咆哮道:如果我选「全拿」,我们就真的一分钱都拿不到,你这个白痴!
但A的眼神依然坚定。
最后时刻到了,主持人公布了最终结果:
一直坚定会选「全拿」的A,也就是尼克没有选「全拿」,而是选了「平分」;而被逼到只有一个选项的B,也就是亚布拉罕,果然乖乖的选了「平分」。
在尼克的强力干预下,这场囚徒困境被打破,双方拿到了整体福祉最大的最优结果——各拿一半奖金回家。
这场心理战非常精彩,给我们解决日常的囚徒困境有哪些启发呢?
我们继续聊。
(三)日常的囚徒困境里,我们具体可以怎么做?
从尼克身上,我们可以学习如下几点:
1、假设人性自私,你才可能开始思考如何与自私打交道
我们自己可以是大公无私的人,但你遇到的不可能都不自私。
一开始,我们以为尼克才是那个自私的人,但我们错了,他为了让双方得到好的结果,他得先假设对方是自私的(当然,自私没什么不好),而自私的人做选择的唯一理由,就是这个选择符不符合我的利益最大化,这正是囚徒困境下结局往不利方向发展的主因。
所以,要解决日常的囚徒困境,我们第一步必须要让自己复杂起来,你要知道《国富论》里追求个人利益最大化才是主流、才是人性的本来面目,而人性,你只能适应无法抵抗。
只有这样,你才有可能开始思考——如何与自私打交道。
不然,在每次别人“自然”地展现人性时,你除了愤怒和感到受伤外,却毫无办法。
弱者只会唉声叹气,而强者会想尽办法。
2、想办法激发别人的“善意”
什么是管理?
到这里,我才明白彼得·德鲁克说的——管理,就是激发别人的善意。
如何激发?
就是设计好的机制让人自动成为一个好人,或者不得不成为一个好人,因为只有这么做,才符合他的最大利益。
这样一来,人们就收获了两份成就感:
我获得物资奖励,我愿意继续;我是一个好人,所以我很自豪。
而人,会不断重复受激励的行为!
3、如果想更简单一点,怎么办?
那就直接像尼克一样,直接减少对方的选项,让他为了自己的利益,也不得不做出你想要的那个选择。
(完)
相关阅读:
博弈论(1) | 为何同质商家总是扎堆?
博弈论(2):如果有人背后捅你,如何应对会让自己利益最大化?
博弈论(3):傻乎乎的郭靖,为何能赢得精明黄蓉的青睐?
博弈论(4):什么时候要先下手为强?什么时候可以后来者居上?
博弈论(5):有一种困境叫自由,有一种自由叫束缚