拢黄情形如下列博弈矩形图:囚徒乙不坦白坦白囚不坦白徒,∈,田.蜀.Р鋋≯矗扩展式博弈的战略组合,海琲,⋯,篔是一个子博弈精炼纳什均衡,如.耆畔⒍┺挠胱硬┺木赌墒簿策结男畔⒓缸对于所有的!剩,如果薄蔨’瑉”∈椤婴。扣,,坦白俏ㄒ坏南嗷フ攵远苑讲呗缘淖罴讯圆咦槌傻牟呗宰楹希歉貌┺牡木哂形ㄖ盏憬组成,它满足下列条件:是一个单结信息集,即包含决在此博弈中,每一囚徒有两种战略可供选择:坦白、不坦白,显然,拱祝定性的解,该策略组合即构成一个纳什均衡。静态博弈中,所有参与人同时行动蛐卸溆邢群螅挥腥嗽谧约盒卸之前观测到别人的行动诙┺闹校斡肴说男卸邢群笏承颍液笮卸在自己行动之前能观测到先行动者的行动。完全信息动态博弈是指参与者的得益函数是共同知识的动态博奔,根据信息是否完美,可分为完全且完美信息动态博弈和完全但不完善信息动态博弈,其主要差异在于轮到行动的博弈方对此前博弈进行的整个过程是否完全了解。子博弈精炼纳什均衡是由泽尔腾弓氲模淠康氖墙切┌不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。简而言之,子博弈精炼纳什均衡要求均衡战略的行为规则在每一个信息集上都是最优的,参与人应该是序贯理性的。下面给出子博弈和子博弈精炼纳什均衡的正式表述:一个扩展式博弈的子博奔梢桓鼍霾呓醁和所有该决策结的后续结果:窃┺牡哪墒簿猓它在每一个子博弈上给出纳什均衡。求解子博弈精炼纳什均衡的基本方法是逆向归纳法。我们以两阶段的完全且完美信息动态博弈来说明求解过程,当在溥弈的第二阶段参与者卸保捎谇安斡胝已选择行动口.,他面临的决策问题可表示为下式;假定对,表示参与者男卸占中的每一个口.,参与者淖钣呕问题只有唯一解,用足表示,这就是参与者圆斡胝的行动的反应最优反应S捎诓斡胝能够和参与者谎獬的问题,参与者梢栽げ到参与者圆斡胝遧每一个可能的行动口.所作出的反应,这样参与者诘谝阶段要解决的问题可归结为: