财新传媒
位置:博客 > 王烁 > 啥都不信是输家

啥都不信是输家

一家书店有许多英文书要找出路,店长慕名找到我们,商定:其中100本捐给BetterRead英文书漂流瓶计划,开启一系列捐书专场,从此进入无尽漂流,造福参与计划的所有读者。其余上千本书以超低价在店内销售,BetterRead读者凭邀请码参加。

就这样。BetterRead与这件事的关系就这些,除此无任何利益。

很快,有人在活动消息下留言。

见多识广如我,一眼看出这是个梗,恶意梗。康夏散书事件,想知道的话自已搜。

泄愤完毕,恢复平静,我多想了一层。

举个例子。

我不接陌生电话很长时间了,心里不安:会不会因为防骗子、躲电话营销,把朋友也防掉了?看到电信运营商推出的防騒扰识别服务,立即启用,两个发现:

第一,不安是多余的。电信运营商的防火墙一个也没杀错,挑出来的,不是骗子,就是营销员。有些电话号码被上万人标注为诈骗电话,都这么臭名昭著了,为什么还要出来混呢?

第二,防火墙漏过的陌生电话,我接起来一样不是骗子就是营销员。

只有放过,没有杀错。中国骗子多,防不胜防。

问题来了。

骗子这么多,我怎么办?

别人怀疑我是骗子,我怎么办?

自保必须要善用技术,电话防火墙就节省了不少时间屏弊了许多风险。但与骗子拼技术是军备竞赛,在道高一尺魔高一丈魔高一尺道高一丈的循环中求生存。我则要讲的不是技术,而是策略。

接下来的人生指南,吃透了,你终身受益。

曾与高西庆聊天。

高西庆是什么人呢?他为人是这样的:热情、率直、敢言,性格帝。他做事是这样的:杜克大学法学院出身,海问律师事务所创始人之一;中国证监会是政府机构不便用创始人这个概念,但如果能用的话他也是之一;履历上还有中国最早的海外投行中银国际CEO、中国证监会副主席、中投公司总经理。

这样一个人,你想不想知道他做人的策略是什么?

“我总是选择先信你一次。如果你回报以信任,OK,我们以后做朋友;但如果你骗我,也OK,你就只骗得到我这一次,没有以后了。”

就这么一个简单策略,使性格帝高西庆不仅顺利渡过了法治社会,也安然渡过了丛林社会,通吃。

高西庆策略用得好,但他不是发明者,这是用来对付囚徒困境的经典博弈策略,叫作tit-for-tat,中文我译作一报还一报。夫子说:以德报德,以直报怨,与此相近,但还不够精确。

精确地说是这样:

——第一次总是选择合作;

——对方如果合作,则我继续合作;

——对方如果欺骗,则我不再合作;

——只要对方从欺骗回到合作上来,则我再度合作;

简单地说,第一次总是合作,然后对方这一次对我做什么我下一次就对他做什么。一报还一报。

很明显,这个策略总会吃点亏。第一次你总是合作,如果对方合作,那么你们俩打平,但如果对方欺骗,那么你吃亏对方占便宜;以后的轮次中,双方选择一样回到打平。总体上,因为第一轮吃的这点亏,这个策略的收益会略低于均值。如果是100分的卷子,分数不及格。

但是,就这个得分不及格的策略,却是博弈论研究给出的最优策略。

无他,现实太险恶。

来,复习一下囚徒困境。

你被捕了,同志也被捕了。你在这间审讯室里审讯,同志在那间审讯。你们看不见对方也不能对表,但都知道,敌人给开出了同样的条件:

——你出卖同志,同志没有出卖你,放了你,同志枪毙;

——你不出卖同志,同志也不出卖你,都判坐牢三年;

——你出卖同志,同志也出卖了你,都判无期;

——你不出卖同志,但同志出卖了你,放了同志,你枪毙;

判变还是不叛变?

囚徒困境有纳什均衡,你也好同志也好有且只有一个最优选择:无论对方是否选择叛变,你的最优选择都是叛变。

如果同志不出卖你,那么你“应该”出卖他:自由当然胜过坐牢三年;如果同志出卖了你,那么你还是“应该”出卖他:无期徒刑胜过被枪毙。

这些推算,对他也成立。你知道,他知道,你知道他知道,他知道你知道。

彼此出卖,你们就都判无期徒刑。明明存在着你们都不叛变只判三年的更好可能,却可望不可即,正是困境的由来:明知有更好的选择,却困于更坏的选择无法自拔。

话饶理不饶,很简单:

都合作对你是有利,但对方合作你欺骗对你更有利,这些算计对他同样成立,所以大家都选择欺骗,锁死在彼此欺骗的困境里。

现实处处是囚徒困境,所以险恶;吊诡的是,正是因为其险恶,所以一报还一报策略得分不及格,却仍是最高分。

30多年前,美国政治学家罗伯特·阿克塞罗德(Robert M. Axelrod)搞了两次策略锦标赛,就此成为经典。

阿克塞罗德专门研究合作的进化。他的问题是:囚徒困境将人们锁死在相互欺骗里,那合作是怎么发生的呢?他组织了两次计算机策略比赛,几十个策略算法参加,两次都是一报还一报策略胜出,它最简单,却能赢。

为什么?

因为它以最小代价给合作留下机会。它不做老好人,不会锁定在永远被人利用的坑里:你骗我一次,以后别想再骗我;但它也不怀恨:如果你回归合作,那么我既往不咎重启合作;最重要的是,它第一次总是选择合作,哪怕因此时常吃亏,但只要能与其他合作者相遇,那么就能持续合作创造最大价值。

至于那些骗子,每次都是要么占便宜要么不吃亏,但长期中几乎注定是输家:没有合作,蛋糕就越来越小,光会分分抢会骗是不够的,蛋糕做不大而骗子越来越多,彼此相害,骗子也活不下去。

故事没有结束。

过了30多年,研究者发现,一报还一报策略还不是在现实中走出囚徒困境的最佳答案。因为现实与计算机模拟不一样,一报还一报给合作留下的空间还是不够。

现实中,信息不完整,能见度有问题,误解丛生。如果双方都是一报还一报,一旦其中一方误会对方欺骗,就会导致灾难性后果:他不合作,引发对方下一轮不合作,于是都锁死在不合作的死结中,造成永久损害。扪心自问,你跟伙伴之间有没有发生过这个死循环?

所以,一报还一报策略在现实生活中的应用,要变得更宽厚,更能容错,给误会留出空间。所以,更好的策略是不惜再吃点亏,一报还两报:只有对方欺骗我们两次,我们才不再与其合作。

现实险恶,我们却还要坚持保有希望,宽以待人,随时准备迎接浪子回头,不是因为我们太傻太天真,而是因为合作太重要而不合作最终没有出路——骗子确实到处都是,但怀疑一切的人注定是输家。

给合作机会,才能给自己机会。

推荐 38