逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。
这种方法通常用于有限步博弈(finite gaept)或拒绝(reject):
? 如果接受,双方按A的分配拿钱。
? 如果拒绝,双方都拿不到钱。
逆向归纳分析
1. B的决策(最后一步):
? 如果B接受,他能获得分配到的钱。
? 如果B拒绝,双方都拿不到钱。
? 理性B玩家应接受任何非零金额,因为比0更好。
2. A的决策(回溯):
? A知道B会接受任何非零金额,所以A的最优策略是给B最少的钱(如1元),自己拿99元。
结论:A分1元,B接受,这是均衡策略。
2. 进入威胁博弈(entry deterrence game)
假设一个新企业(e)考虑进入市场,而已有企业(i)可以选择降价竞争(fierce)或维持高价(Acmodate)。
博弈树
1. e决定是否进入市场:
? 进入(enter)
? 不进入(stay out)
2. 如果e进入,i决定策略:
? 降价(fierce):i 和 e 都亏损 -10。
? 高价(Acmodate):i赚10,e赚5。
? e不进入(stay out):i独占市场,赚15,e赚0。
逆向归纳分析
1. i的决策(最后一步):
? 如果e已进入,i在降价(-10)和高价(10)之间选择,高价更优,所以i会选择高价。
2. e的决策(回溯):
? 知道i不会降价,e进入后可以赚5(比0好),所以e会进入市场。
结论:e进入,i维持高价,这是均衡策略。
3. 百吉饼博弈(Centipede game)
假设有两个玩家轮流决定**“拿走(take)”还是“继续(pass)”**奖金池:
? 初始奖金池2元,每轮增加。
? 如果某人“拿走”,他获得大部分奖金,另一个人获得少部分。
? 游戏最多持续4轮。
逆向归纳分析
1. 最后一轮:
? 若轮到玩家B,他会“拿走”,因为这是他的最后机会。
2. 倒数第二轮:
? 玩家A知道B会在下一轮拿走,因此他会在这一轮就拿走。
3. 第三轮:
? 玩家B知道A会在下一轮拿走,因此他会在这一轮就拿走。
4. 回溯至第一轮:
? A知道B在下一轮会拿走,所以A在第一轮就拿走。
结论:尽管合作能让奖金池增大,但完全理性玩家会在第一轮就终止游戏。
总结
? 逆向归纳法适用于有限步动态博弈,从最后一步开始推导。
? 它能帮助玩家预见对手的最优策略,做出最优决策。
? 适用于终局博弈、市场进入、谈判、竞标等策略决策。
逆向归纳法的应用
逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域,特别适用于动态决策问题,即决策者的选择会影响未来的结果。以下是几个典型的应用场景:
1. 经济与商业
(1) 定价策略
企业在制定长期定价策略时,会考虑竞争对手的反应。例如:
? 掠夺性定价(predatory pricing):
? 大企业A希望阻止小企业B进入市场。
? A可以选择降价打压,B需要决定是否进入市场。
? 通过逆向归纳分析,小企业B会预见A会在自己进入后降价,因此可能选择不进入。
(2) 竞标与拍卖
在**竞标(如政府采购、广告投放)**中,企业需要预测对手的策略:
? 逆向归纳法帮助竞标者推演最后的竞争结果,从而确定最优出价策略。
本小章还未完,请点击下一页继续阅读后面精彩内容!