“敲诈”还是“慷慨” 囚徒困境博弈实验研究再获进展

2016-05-24 13:40:44|来源：中新网|编辑：赵妍

　　原标题：“敲诈”还是“慷慨” 囚徒困境博弈实验研究再获进展

　　中新网杭州5月24日电 (见习记者方堃通讯员王汝菲)还记得此前经历跨年戏剧性转折的“石头剪子布”实验吗？这项研究在2014年被吐槽为“吃饱了撑的”，然而在2015年初被评为《麻省理工学院科技评论》“2014年度最优成果”，成为中国首次入选的社科领域成果。

　　近日，“石头剪刀布”研究中的两位研究者——浙江大学实验社会科学实验室王志坚研究员和浙江工商大学经济学院许彬教授，联合三位新的研究者——浙江大学经济学院周嫣然、清华大学与香港中文大学的郑捷和Jaimie，在囚徒困境博弈实验研究中再获进展，相关成果以《重复囚徒困境博弈中敲诈策略可以比慷慨策略有更好的表现》为题，正式发表于影响因子高达11.47的国际顶级期刊《自然通讯》。

　　人类合作演化是极具挑战性的基本科学问题，囚徒困境是研究该问题的基本模型。敲诈策略是指在重复囚徒困境博弈中，使自我收益总是高于或等于对方收益的某种条件合作策略。相反，慷慨策略则是指使对方收益总是高于或等于自己的收益的某种条件合作策略。

　　2012年，美国德克萨斯大学WilliamH.Press等人提出，在重复囚徒困境博弈中，单方面控制两个博弈者的收益关系，尤其是其中存在一种敲诈策略，理论上可以获得比慷慨策略更高的收益。

　　2014年，美国马克斯普朗克进化生物学研究所、哈佛大学进化动力学项目的ChristianHilbe等人首次用实验室实验的方式检验上述理论。但实验表明，当与“真人”对弈时，敲诈策略不一定能对慷慨策略或简单善良的行为形成真正的挑战。尽管使用敲诈策略比对手获得的多，但慷慨策略下人更加合作，而敲诈策略下人更加不合作。

　　这一实验结果与理论的不完全一致，激励这个研究团队对其重新进行检验。

　　“考虑到策略的概率形式及其中包含的社会关系性质，我们在两个维度上改进了Hilbe等人的实验。”浙江工商大学经济学院许彬教授介绍，Hilbe等人的实验是在不告知情况下，人和电脑程序的博弈。“从参与者联想的角度，更像是个体与个体的博弈。”改进后的实验，在实验长度上采取60轮和新增的500轮两种，在信息方式上分别采用不告知和告知对手是计算机程序两种处理。

　　因此，实验研究在四种情况下比较敲诈策略和慷慨策略的表现，即长轮次告知参与者对手是电脑程序、长轮次不告知对手是电脑程序、短轮次告知对手是电脑程序以及短轮次不告知对手是电脑程序，每种情况均实施了敲诈策略和慷慨策略，这样总共有8种实验设置。

　　研究者们分别于2014年底和2015年底利用实验室控制性实验方法进行研究。共招募256名大学生被试分别与计算机化的敲诈策略与慷慨策略对弈，每种设置下各有32名参与者，男女各半。每名学生匹配一个电脑程序，在合作与背叛两个选项中做出选择，并由此得到实验得分。实验累计得分按照固定比例换算成现金在实验结束时支付给参与者。

　　结果，参与者的收益有高有低。例如，在500轮的情况下，高的超过60元，低的不到30元，平均每人获得50元收益。实验发现，在互动时间足够长并且计算机对手的特征被真人被试知道的情况下，敲诈策略取得了比慷慨策略更高的收益，同时两种策略使真人对手达到了相同的合作水平。

　　“我们做这个实验，不是因为觉得‘敲诈’是一个可以运用的策略，而是相反，觉得敲诈策略一旦比慷慨策略收益更高，从演化优势的角度看，会导致不良社会后果。”许彬说，人们有时会觉得某些不好的东西却有很强的生命力和扩展性，但又无可奈何。“作为研究者，首先想弄清楚，为什么不喜欢的东西却一直存在，为什么善良的愿望和做法并不一定导致好的结果。进一步，如果希望得到好的社会结果，需要具备什么条件，这是研究的根本动机。”

　　“今后我们还会研究这一策略在具体的社会环境下的表现以及可能的后果，比如雇佣与被雇佣、垄断竞争、采用人工智能为企业牟利的情景等等。”许彬表示。(完)