第16章 制度演化——游戏规则的博弈与演进(1)

作者:孙恩棣

|

类型:都市·校园

|

更新时间:2019-10-06 13:53

|

本章字节:12112字

民主是世界上最坏的政治制度,如果没有独裁制度的话。


——丘吉尔


人类千万年的历史,最为珍贵的不是令人炫目的科技,不是浩瀚的大师们的经典着作,而是实现了对统治者的驯服,实现了把他们关在笼子里的梦想。现在就是站在笼子里向你们讲话。


——小布什


哈耶克曾说:一种坏的制度会使好人做坏事,而一种好的制度会使坏人也做好事。制度(或叫“游戏规则”)是人选择、博弈的结果。好的制度浑然天成,清晰而精妙,既简洁又高效,令人为之赞叹。


凶残海盗的逻辑


海盗,杀人掠货,亡命于海上,干的是富贵险中求的营生。海盗多是桀骜不驯之徒,但正是基于这种独立精神,在强盗团队里更容易形成民主作风。


这里有一个关于海盗的分赃博弈,是选自《科学美国人》中的一道智力题,原题是《凶残海盗的逻辑》。据说,在美国,在20分钟内能解决这个问题的人,平均年薪在100万美金以上。


10个海盗抢到了100颗宝石,每一颗都是一样的大小和珍贵。


他们决定这么分:


1抽签决定自己的号码(1,2,3,4,5,6,7,8,9,10)。


2首先,由1号提出分配方案,然后大家10人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼。


3如果1号死后,再由2号提出分配方案,然后大家9人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼。


4以此类推……


条件:


1每个海盗都是高度理性的人,都能很理智地把握全局,判断得失,从而做出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信。


2每个海盗当然希望自己能得到尽可能多的宝石。


3每个海盗当然不愿意自己被丢到海里去喂鲨鱼,这是最重要的。同时,每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。


4一颗宝石是不能被分割的,不可以你半颗我半颗。


5每个海盗的序号都不同,而且所有海盗都知道别人的序号,也就是说,每个海盗都知道自己和别人在这个提出方案的序列中的位置。


问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化?


解决“分赃博弈”问题,我们需要逆向思维,即从最后的情形向前推,这样我们就知道在最后这一步中什么是好的和坏的策略。


然后运用最后一步的结果,得到倒数第二步应该做的策略选择,依此类推。要是直接从第一步入手解决问题,我们就很容易因这样的问题而陷入思维僵局:“要是我做这样的决定,下面一个海盗会怎么做?”


以这个思路,先考虑只有2个海盗的情况(所有其他的海盗都已经被丢到海里去喂鱼了)。不妨记他们为p10和p9。p10的最佳方案当然是:他自己得100颗宝石,p9得0颗。投票时他自己的一票就足够50%了。


再往前推一步。现在还有一个更靠前的海盗p8。p9知道(p8知道他知道)如果p8的方案被否决了,游戏就会只剩自己和p10来对决,p10一票否决,自己将一颗宝石也得不到。


聪明的p8也知道,只要给p9一颗宝石,p9就会同意他的方案(当然,如果不给p9一颗宝石,p9反正什么也得不到,宁可投票让p8去喂鲨鱼)。所以p8的最佳策略是:p9得1颗,p10什么也得不到,p8得99颗。


p7的情况差不多。他只要得两票就可以了,给p10一颗宝石就可以让他投票赞同这个方案,因为在接下来p8的方案中p10什么也得不到。


p6也是相同的推理方法,只不过他要说服他的两个同伴,于是他给每一个在p7方案中什么也得不到的p9和p8一颗宝石,自己留下98颗。


依此类推,p1的最佳方案是:他自己得96颗,给每一个在p2方案中什么也得不到的p3,p5,p7和p9一颗宝石。


所以,“海盗分赃”最理想结果是p1、p2、p3、p4、p5、p6、p7、p8、p9、p10分别可以获得:96、0、1、0、1、0、1、0、1、0颗宝石。


在“分赃博弈”中,任何“分宝石者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。


p1看起来风险最大,但如果他足够聪明,就能先下手为强,把握住机会,结果不但能消除死亡威胁,还可以获得最大收益。


而p10看起来最保险,非但没有死亡的威胁,甚至还能坐收渔人之利,但却因排名在后,不得不看别人脸色行事,结果可能连残羹都无法分到。


权益的均衡


在“分赃博弈”中,每一个海盗都希望能实现自身权益的最大化。但是,他们所处的位置,决定了他们的策略选择。


在这博弈中很明显,生存权是一切权益的根本,没命的话要钱还有何用?所以首先要考虑生命的安全。


你身上只要还有一颗宝石,别的海盗们就会觊觎它,你该怎么办?


除非你什么都不要,剩下100颗宝石让其他9个人平分。但遗憾的是,这些钱本来就是自己用命换来的,又岂有中途退缩的可能?


要保命,又要获取利益最大化,这是留给自利又理性的海盗的命题。


当然“分赃博弈”的隐含假设是所有海盗的价值取向都是一致的,理性的。而在现实生活背景下,海盗的价值取向并不都一样,有些海盗的脾性是宁可同归于尽都不让你独占便宜。


海盗分赃中,不同性格的海盗在不同的位置都有可能影响结果。


作为海盗p1,还必须对自己的伙伴们的性格了如指掌,根据其性格特点和价值观做深入研究和策略分析,才能因地制宜,设计出最合适的分配方案。


作为老板,要分到“最大块的蛋糕”又不能让自己垮台,就必须对自己的下级做深入研究,制订相应合理的分配方案,才能获得最大的成功。


屁股决定脑袋


企业治理一样,作为公司老板,拥有最先分配权。你有权独享所有成果,也可以合理分配让大家满意。贪婪还是仁厚,这是你的权利。如果你过于贪婪,就要承担被下属推翻的风险,如果你不想冒险,就放弃部分利益以求共存。


在一些公司中,老总经常越过副总,而与更下层的员工打得火热。


因为公司里的小人物更容易拉拢,老总要和更下层的员工一起牵制对自己地位更具威胁的第二号人物。


在“海盗分赃”模型中,p1、p2、p3、p4、p5、p6、p7、p8、p9、p10分别可以获得:96、0、1、0、1、0、1、0、1、0颗宝石。


二号人物的收益还不如三号物,甚至不如九号人物。


现实中,很多企业实际上搞的却是“优败劣胜”。能力差不要紧,水平差也不要紧,重要的维护既得利益者的权益。这到底是为什么呢?


用博弈论来解释这一现象就是:屁股决定脑袋,博弈者所处的位置决定了他在博弈中采取的策略,以至于位置靠前的(优)未必胜,位置靠后的(劣)未必汰。


游戏规则是这样形成的


我们让这群理性而自私的海盗继续博弈。


由于受到官府的围剿,这群海盗被封锁在海上。海盗船上的淡水已经不多。这帮海盗虽然有的是金银财宝,却无法买到饮食,他们只能靠有限的淡水熬粥填肚子。平时大碗喝酒,大块吃肉的海盗,在此非常情况下只好实行有限供给制度。以下是几种可能的博弈结果:


1让所谓的老大主持分粥。开始时,这个有威信的海盗还能基本公平,但几天以后,他就开始为自己和给他溜须拍马的人多分粥。


结果,每个人都为了能得到分粥的特权而不择手段,最终导致内讧。


2大家轮流主持分粥,十天之中,每个人分一天。这样等于承认了每个人都有为自己多分粥的权力,同时也给予了每个人为自己多分粥的机会。虽然表面看起来平等了,但是每个人在十天中只有一天是吃得饱而且还有剩余的,其余九天都饥饿难挨。结果导致大家相互之间加倍报复,资源的分配越来越不平衡,矛盾也越来越激化。


3选举一个分粥委员会和一个监督委员会,对分粥进行监督和制约。公平基本上做到了,可是由于监督委员会常提出多种议案,分粥委员会又据理力争,等分粥完毕时,粥早就凉了。这样的结果是效率极其低下。


4每个人轮流值日分粥,但是分粥的那个人要最后一个领粥。


令人惊奇的是,在这个规则下,十只碗里的粥每次都是一样多,就像用科学仪器量过一样。每个主持分粥的人都认识到,如果十只碗里的粥不相同,他确定无疑将享有那份最少的一碗粥!


海盗博弈出了一个合理的供给制度来解决他们每天在吃饭时遇到的问题:在没有称量用具和刻度容器的情况下,公平地分食一锅粥。他们试验了不同的方法,终于达到了博弈的均衡。


从分粥博弈可知,形成、制定和推行某种制度并不是一个简单的过程。规则的制定也是一个达到博弈均衡的过程。


制度是保障一个组织正常运行的轨道,它所产生的乃是一种约束力和规范力,正是这种约束和规范使其成员的行为始终保持在有序、明确和高效的状态。制约之力即是秩序之力,秩序之功亦为制约之功。从“分粥”最终形成的制度安排中可以看到:任何人都可得到自己应得到的利益,但任何人又难以为一己私利而损害他人的利益;任何人都可行使自己能行使的权利,但任何人又不会因行使自己的权利而去妨碍别人——这也许正是建立制度的本义。


制度也是一个展示公平的过程。公平不等于平均,平均主义实质上是最不公平的。我们从分粥博弈中最终看到的正是这种人、事、物相宜,情、理、法相融,权、责、利相合的境界。


制度的形成是一个达成共识的过程。制度本质上是一种契约,必须建立在组织成员广泛共识的基础之上,没有人会积极参与自己不同意的事。“分粥”与大家的切身利益相关,并且几经探讨和试验,最终找到了大家都认可的分配办法,这便为彻底实行这一办法打下良好的心理基础。现实中许多制度之所以形同虚设,主要一条原因是缺乏共识,在制定制度的过程中没有征求组织成员的意见和建议,只凭管理层“拍脑门”、“想当然”


办事。


制度的推行又是一个博弈的过程。一种制度是否有效,往往要看它能在多大程度上兼顾企业和员工个人的利益,亦即是否找到了整体目标与个体目标的纳什均衡。要达到这一均衡,组织成员间不经过良性博弈是不可能实现的,而博弈中既含有妥协与合作,也包括不满与争执,“分粥”游戏规则的形成既是这一过程的集中体现——互动使人们既认识到了个人利益,同时又关注着整体利益,并且找到了两者的结合点。


从剑客博弈所看到的


下面让我们思绪飞到血腥刺激的武侠世界。


在华山之巅,三个剑客正在进行生死决斗,剑客甲剑法精准,十刺八中;剑客乙剑法平平,十刺六中;剑客丙剑法拙劣,十刺四中。


假如三人同时拔剑,谁活下来的机会大一些?


假如你认为是剑客甲,结果可能会让你大吃一惊:最可能活下来的是丙——剑法最劣的那个家伙。


假如这三个人彼此痛恨,都不可能达成协议,那么作为剑客甲,他一定要对剑客乙拔剑。这是他的最佳策略,因为此人威胁最大。


这样他的第一剑不可能指向丙。


同样,剑客乙也会把甲作为第一目标,很明白,一旦把他干掉,下一轮(如果还有下一轮的话)和丙对决,他的胜算较大。


相反,如果他先打丙,即使活到了下一轮,与甲对决也是凶多吉少。


丙呢?自然也要对甲攻击,因为不管怎么说,剑客乙到底比甲差一些(尽管还是比自己强),如果一定要和某个人对决下一场的话,选择剑客乙,自己获胜的机会要比对决甲多少大一点。


于是第一阵乱砍过后,甲还能活下来的机会少得可怜,将近10%,乙是20%,丙是100%。


通过概率分析,你会发现丙很可能在这一轮就成为胜利者,即使某个对手幸运地活下来,在下一轮的对决中,也并非十拿九稳,毕竟丙还有微弱的机会。


我们知道,有时胜负是由规则决定的,现在换一种玩法:


三个人轮流拔剑,谁的机会更大?


这里我们又要遇到琐碎的排序问题,但不管怎么排,丙的机会都好于他的实力。至少,他不会被第一个砍死。而且,他很可能与在第二轮首先拔剑的便宜。


例如,顺序是甲、乙、丙,甲一剑干掉了乙,现在,就轮到丙拔剑——尽管剑法不怎么样,但这个便宜还是很大的:那意味着他有将近一半的机会赢得这次决斗(毕竟甲也不是百发百中)。如果乙幸运地躲过了甲的攻击呢?他一定要回击甲,这样即使他成功,下一轮还是轮到丙拔剑,自然,他的成功概率就更大了。


问题来了:如果三人中首先拔剑的是丙,他该怎么办?


他可以朝甲拔剑,即使打不中,甲也不太可能回击,毕竟这家伙不是主要威胁,可是万一他打中了呢?下一轮可就是乙拔剑了……


可能你会感到有点奇怪:丙的最佳策略是乱砍一通!只要他不砍中任何人,不破坏这个局面,他就总是有利可图的。当然,你可能会说,鉴于这家伙没水准,也许他乱拔剑反而更可能打中什么人。


但那就是另外的问题了。


这个故事告诉我们:在多人博弈中,常常会发生一些逆向选择的结局。一方能否获胜,不仅仅取决于他的实力,更取决于实力对比造成的复杂关系。


你可能已经发现:乙和丙似乎达成了某种默契——在甲被干掉之前,他们相互不是敌人。


这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。


但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。


在这个“同盟”里,最忠诚的是乙——只要甲不死,他就不会背叛;丙就要滑头多了,在前面轮流拔剑的例子中,他不朝甲挥剑,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。乙是甲的头号目标,这个敌人一定要向他挥剑的,完全没有回旋的余地;而丙不同,他随时愿意牺牲乙换取下次自己的先手之利。