第166章:囚徒困境的综合博弈(2 / 2)
车爷毫不客气地抽了起来,“呵呵呵”地笑着,毫不在意地在人群中点了一下。
“吴财,商人。”顺着车爷的手,安不知在干枯的手指尽头看到了一个西装革履,挂着金丝眼镜的微胖中年人,梳着偏分,脸上颇有几份威严,身边挤着两个人,一看就知道是保镖,只是不知道他们保的是现实,还是脑网。
“他的经营项目原本是正经的义体贩卖,后来搭上了线,开始私贩器官,便发了横财。他有着所有暴发户一样的神经质,在游戏中攻击性极强,每一步都充满了掠夺性,容不得别人说他不对。
“他是今天店里的客人当中,目标最明确的人,你去跟他玩,准没错。不过看在你这根雪茄的份上,再多说两句,先给你上一课。知道囚徒困境这个博弈理论吗?
“非零和博弈中最具代表性的那个例子?当然知道啊。两个有罪的囚徒被分别囚禁,如果他们各自保持沉默,因为缺乏证据,则都只会获刑一年。但如果他们两人都分别坦白,则因为证据充分而导致都获刑八年。但如果一个人保持沉默,而另一个人坦白,则坦白的囚徒将会因为提供有利证据而直接释放,另一个人则会因为拒不合作而导致判刑十年。”安不知老老实实地问答道。
车爷点头称是,“没错,这个博弈中最黑暗的地方就在于人们明明知道合作带来的团队利益是最高的,但一旦把他们分开进行决策,他们就会选择所谓的最优策略以达到所谓的纳什均衡。”
“因为他们会分别做如此推理:如果对手选择是坦白,那么我也坦白获刑是八年,而如果我沉默则要获刑十年;如果对手选择是沉默,那么我也沉默获刑是一年,而如果我坦白则无罪释放。则对手无论选择是什么,我的最优选择都应该是坦白。这个著名的理论充分说明了在一个‘完全以自我利益最大化’为基础的社会中,反而得到的是一个对群体来说‘利益最小化’的结果。”
“这是基础,然后我要告诉你的是一个更精妙的扩展,用它可以解读整个浓缩的社会。几个世纪前罗伯特·阿克塞尔罗德在其著作《合作的进化》中提出了一个名为重复的囚徒困境的综合博弈。”
“这个博弈中,每个玩家将提出一种策略方案,其内容是玩十次囚徒博弈,但每个策略必须一开始就用程序设计好这十次囚徒博弈中所要采取的行动,然后按其程序严格执行。”
“比如你可以将其设计为永远沉默,那么这个策略可以被称为‘老好人’,也可以将其设计为在10次中随机有3-4次会突然地‘坦白’,那么这个采取突袭的偷分策略便可以被称为‘下流胚’。所有设计出的策略方案,将全部在双循环赛中,分别与所有玩家的策略一一交手,最后总分最高的策略,将成为最优策略。”
确定所有的一切安不知都听明白以后,车爷贪婪地吸进一口烟,再缓缓吐出,好整以暇地问道:“你能想象一下,在这个‘重复的囚徒困境’中,罗伯特·阿克塞尔罗德所提出的最强策略是什么吗?”
“这?这种综合博弈我都是第一次听说,怎么可能马上就想出来答案!”安不知老实地说道。
车爷便呵呵地笑着,一副“我就知道”的表情,满意地给出了答案:“以牙还牙!这一套策略的方案非常简单。它在一开始采取‘沉默’行动,而在以后的每一轮行动里,他所采取的都将是对手在上一轮中所采取的行动。简单来说,对手合作,那么它也一直合作下去;而对手背叛,它必以背叛反击之。”
在片刻的沉默中,安不知静静地消化着这个所谓“最强策略”的内涵!</dd>