博弈论练习

上传者：菩提 | 格式：doc | 页数：30 | 大小：0KB

文档介绍

不抽抽不抽用划线法可知存在两个均衡(抽回,抽回)与(不抽回,不抽回)。因此,该博弈的子博弈精练纳什均衡有两个:(第一期抽回,第一期抽回)与(第一期不抽回第二期抽回,第一期不抽回第二期抽回)。4.在囚徒困境中,“针锋相对”战略定义为:(1)每个参与人开始选择“抵赖”;(2)在t阶段选择对方在t-1的行动。假定贴现因子δ=1,证明以上战略不是子博弈精炼纳什均衡。假定两囚徒博弈的战略式表述如下:坦白抵赖坦白-6,-60,-8抵赖-8,0-1,-1给定针锋相对战略,如果参与人j坚持针锋相对战略,参与人i没有积极性首先坦白,因为如果他选择抵赖,他的支付是:,而若选择坦白然后再转向针锋相对战略,则他的支付是:,前者严格大于后者。因此,在合作路径上针锋相对战略是纳什均衡。但是,如果参与人j首先选择坦白,参与人i并没有积极性惩罚他,因为如果惩罚,将得到的支付是,而如果原谅则可以连续得到-1的支付;类似的,参与人i也没有积极性惩罚自己。所以在惩罚路径上,针锋相对战略不是子博弈纳什均衡。5.如果以下重复博弈两次,支付(4,4)是否能作为子博弈精炼纳什均衡结果出现,请说明理由。假定贴现因子δ=1。S1S2LCRT3,10,05,0M2,11,23,1B1,20,14,4该静态博弈有两个纯战略纳什均衡(T,L)和(M,C),其支付均小于(B,R)带给两方的收益,因此,在两次博弈中,双方有可能选择(B,R)。由于对而言,(B,R)带来的是最大收益,因此,他没有偏离的动机。然而仍可以选择T战略已获得更高的收益,因此可以设置如下制约行为的触发战略::第一阶段选择B策略,第二阶段选择T策略;:第一阶段选择R策略;在第二阶段,如果第一阶段的结果是(B,R),则采取L,否则采取C。如此,由于从第一阶段选择B第二阶段选择T的战略中获得的收益为4+3=7大于第一阶段偏离选择T,第二阶段选择M的收益5+1=6,所以