【纳什均衡计算】在博弈论中,纳什均衡是一种重要的概念,用于描述参与者的策略组合,在该组合下,任何一方单方面改变自己的策略都不会获得更好的结果。换句话说,每个参与者都选择了对自己最优的策略,并且在其他参与者不改变策略的前提下,自己无法通过改变策略来获得更高的收益。
为了更好地理解纳什均衡的概念,我们可以通过一个简单的例子进行分析,并结合表格形式展示计算过程和结果。
一、基本概念总结
- 博弈:两个或多个参与者在一定规则下做出决策以最大化自身利益。
- 策略:参与者在博弈中可选择的行为方案。
- 收益(支付):每个参与者在特定策略组合下的结果。
- 纳什均衡:一种策略组合,使得每个参与者在对方策略不变的情况下,没有动机去改变自己的策略。
二、案例分析:囚徒困境
这是一个经典的博弈模型,包含两个参与者:甲和乙。他们被分开审讯,可以选择“坦白”或“抵赖”。根据不同的选择,双方将获得不同的刑期(负数表示惩罚程度)。
支付矩阵如下:
| 乙:坦白 | 乙:抵赖 | |
| 甲:坦白 | (-5, -5) | (-10, 0) |
| 甲:抵赖 | (0, -10) | (-1, -1) |
在这个矩阵中,第一个数字表示甲的收益,第二个数字表示乙的收益。
三、纳什均衡计算过程
我们逐个分析每个可能的策略组合,判断是否为纳什均衡。
1. 甲:坦白,乙:坦白
- 甲的收益:-5
- 乙的收益:-5
检查甲:如果乙保持坦白,甲若改为抵赖,收益变为0,比-5高 → 有动机改变
→ 不是纳什均衡
2. 甲:坦白,乙:抵赖
- 甲的收益:-10
- 乙的收益:0
检查甲:乙保持抵赖,甲若改为坦白,收益变为-5,比-10高 → 有动机改变
→ 不是纳什均衡
3. 甲:抵赖,乙:坦白
- 甲的收益:0
- 乙的收益:-10
检查乙:甲保持抵赖,乙若改为抵赖,收益变为-1,比-10高 → 有动机改变
→ 不是纳什均衡
4. 甲:抵赖,乙:抵赖
- 甲的收益:-1
- 乙的收益:-1
检查甲:乙保持抵赖,甲若改为坦白,收益变为-5,比-1低 → 没有动机改变
检查乙:甲保持抵赖,乙若改为坦白,收益变为-5,比-1低 → 没有动机改变
→ 是纳什均衡
四、纳什均衡总结表
| 策略组合 | 甲的收益 | 乙的收益 | 是否纳什均衡 |
| 坦白 vs 坦白 | -5 | -5 | 否 |
| 坦白 vs 抵赖 | -10 | 0 | 否 |
| 抵赖 vs 坦白 | 0 | -10 | 否 |
| 抵赖 vs 抵赖 | -1 | -1 | 是 |
五、结论
在囚徒困境中,唯一满足纳什均衡的策略组合是“抵赖 vs 抵赖”。虽然从整体来看,双方都选择抵赖可以获得更好的总收益,但由于个体理性选择导致了次优结果。这体现了纳什均衡在现实中的局限性与复杂性。
通过这样的分析,我们可以更清晰地理解纳什均衡的含义及其在实际博弈中的应用。


