全文预览

共同进化博弈.ppt

上传者:随心@流浪 |  格式:ppt  |  页数:27 |  大小:0KB

文档介绍
博弈者并无先后顺序,每个博弈者都不知道在本轮中对方的决定。Р 我们的研究是基于这种有先后的动态博弈的基础上,通过一定的空间结构来观察博弈者的策略演化情况。这种演化是基于记忆效应的。我们用有限状态机表现这种记忆效应。Р博弈的结构Р考虑多轮次的多人博弈,在每一轮中,一些博弈者将进行2人动态博弈。为了观察这些动态博弈的进展,对于一类特殊的矩阵,假想了一套“承诺和威胁”体系。在一组二人博弈中,B博弈者先给A发送一个可达到帕累托效率解的信息,然后A做出选择(即是否相信),随后B做出是否遵守诺言的选择。这样,博弈的结果唯一确定,并且B和A的一种类似声望的因素被其他博弈者们观察到,这个声望也会对随后与A或B进行的博弈产生影响。Р博弈的结构Р一个可能的支付矩阵Р在左图中,承诺和威胁是可以成立的。B先给A发送一个我会合作的信号,即不论怎样B都会选择向右(图中虚线)。如果A相信了,他会选择右,否则他会选择左。如果B守信,他会选择右,否则选择左。这个威胁如果只运用在单次博弈中就是不可置信的,显然图中深实线表示了该博弈的子博弈完美纳什均衡,也是演化稳定策略。但是在多人博弈中,这个威胁就可能起到效果,因为这可能影响到A或B的声誉。Р博弈的结构Р承诺或者威胁能在多人博弈中起到作用的支付矩阵满足的条件:Р1个子博弈完美纳什均衡 2个威胁Р1个子博弈完美纳什均衡 4个承诺Р交流目标:?B希望A选择相反策略Рb3 > b1Рb4 > b1Р交流需要:? B承诺的行动并不能使得它得到较高的支付Рb1 > b2Рb3 > b4Р交流影响:?A最好选择与B承诺的相反选择如果他相信BРa1 > a3 > a2Рa4 > a1 > a3Р演化规则和过程Р为了研究这个博弈,我们的想法是考虑一个空间博弈,这个博弈建立在方格上,右图是这个一部分博弈空间的示意:РAРBРAРBРBРAРBРAРAРBРAРBРBРAРBРA

收藏

分享

举报
下载此文档