在博弈论中,什么是合作博弈

案例研究囚犯两难处境的比赛

假想你正与被关在另一个屋子里的“嫌疑”人进行囚犯两难处境的博弈。而且再设想这种博弈不是进行一次而是多次。你博弈最后的得分是你被监禁的总年数。你希望使这种得分尽可能地少。你应该用什么战略?你应该从坦白还是保持沉默开始?另一个参与者的行动会如何影响你以后的坦白决策?

多次的囚犯两难处境是极为复杂的博弈。为了鼓励合作,参与者应该相互惩罚不合作行为。但以前描述的杰克和吉尔的水卡特尔的战略——只要另一方违约,一方就永远违约——得不到宽恕。在反复许多次的博弈中,在不合作时期之后,允许参与者回到合作结果的战略,可能是较合人意的。

为了说明哪一种战略最好,政治学家罗伯特?阿克塞尔罗德(RobertAxelrod)进行了一场比赛。人们通过输人为反复进行囚犯的两难处境而设计的电脑程序进入比赛。每个进行博弈的程序都对应于所有其他程序。得到狱中总年数最少的程序的是“赢家”。

赢家结果是被称为一报还一报的简单战略。根据一报还一报,参与者应该从合作开始,然后上一次另一个参与者怎么作自己也怎么做。因此一报还一报参与者要一直合作到另一方违约时为止;他违约到另一方重新合作时为止。换句话说这种战略从友好开始,惩罚不友好的参与者,而且,如果对方改变就给予原谅。令阿克塞尔罗德惊讶的是,这种简单的战略比人们输人的所有较复杂的战略都好。

免责声明:本站发布的游戏攻略(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!