《博弈论》里有个著名的“囚徒困境”怎样简单易懂地理解,如何应用在现实的例子中?
《博弈论》里有个著名的“囚徒困境”怎样简单易懂地理解,如何应用在现实的例子中?
囚徒困境:
假设在某城市有如下规矩
承认犯罪者,判刑10年
检举他人者,直接释放
拒不承认但被人检举者,判刑20年
而假设甲乙两人被抓,若无人检举,则将因证据不足而仅判刑1年,故有如下博弈矩阵
\ 甲 承认 不承认
乙\
承认 10,10 20,0
不承认 0,20 1,1
另假设甲乙二人均为 理智 的人且无交流,下面来看博弈结果
从甲方考虑,假设乙不承认,那么甲承认只要判 0 年,不承认却要1年
假设乙承认,那么甲承认要判 10 年,不承认却要20年
意即,无论如何,甲会选择承认,而乙通过类似的分析,讲得出一样的结论,故可得博弈结果:甲乙两人同时认罪,且一起判10年
而显然,从总体上来说,这不是最优解(一起不承认),此谓之囚徒困境
纳什均衡不懂,只知道有个纳什均衡点,指的是博弈中的平衡点(或稳定点,记不清了,反正就是最有可能出现的点,如上例中的(10,10)点)
例子很简单,比如广告效应
假设有两家同样的公司,实力完全相当,故两者收益为10,10
此时有一家公司开始做广告了,提高了它的市场份额8,广告费4,故两者收益变为14,2
显然另一家公司不会坐视,于是也做广告,份额再次平均,但两者收益却变为
6,6造成资源浪费
博弈矩阵如下:
\ 甲 不打广告 打广告
乙\
不打广告 10,10 14,2
打广告 2,14 6,6
以上为基本模型(2人,2选择),还可以进行扩展:
1、增加人数
由于博弈方增加将导致维数增加,我就不列表了
想象一下,只有两家公司,他们都知道以上结论,那他们就有可能达成某种协议,从而提高双方收益.但如果有1000家呢?谁先打广告谁就能赚钱,你能保证100个人都忍得住?
2、增加博弈选择,
比如打广告有3种量 2 赚 4 ,4 赚 8 ,6 赚 9,则新博弈矩阵如下:
\ 甲 广告0 广告1 广告2 广告3
乙\
广告0 10,10 12,6 14,4 13,1
广告1 6,12 8,8 10,4 9,3
广告2 4,14 4,10 6,6 5,5
广告3 1,13 3,9 5,5 4,4
任取一个起点,比如10,10,观察第一横条知甲会选择广告2,再观察第三列知乙会对应选择广告2来作出回应,此时任一方作出新举动都不会导致更高收益,进入平衡状态.
貌似有时不同的起点有可能导致不同的平衡点,则这些点都叫纳什平衡点