“颤抖手精炼均衡”的意思、由来-中文百科全书

性质

一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人ｉ要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。

从博弈论中我们知道，泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来，泽尔腾(1975)假定，在博弈中存在一种数值极小但又不为0的概率，即在每个博弈者选择对他来说所有可行的一项策略时，可能会偶尔出错，这就是所谓的“颤抖之手”。因之，一个博弈者的均衡策略是在考虑到其对手可能“颤抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看，在演进博弈论中，最初的演进稳定性的出现，并不完全来自博弈双方的理性计算，而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路，我们也可以认为，人们对一种习俗(演进稳定性)的偏离，也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。

价值

为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态ｓ1和ｓ2下,每个委托人的收益如下:

状态ｓ1(坏)　状态ｓ2(好)

β1　β2　β1　β2

α1(ｃ1,ｃ2)　(ｄ1,ａ2) α1(ｄ1,ｄ2)　(ｅ1,ｂ2)

α2(ａ1,ｄ2)　(ｂ1,ｂ2) α2(ｂ1,ｅ2)　(ｃ1,ｃ2)

其中,0<ａｊ<ｂｊ<ｃｊ<ｄｊ<ｅｊ,ｊ=1,2。这意味着当自然状态“坏”时,每个代理人都必须采用积极”的策略才可能使自己的委托人得到中等以上的收益(即不小于ｃｊ);而当自然状态“好”时,两代理人都选“偷懒”也可使各自的委托人得到ｃｊ的收益。现在设代理人ｊ(ｊ=1,2)在他的委托人的利润不小于ｃｊ单位时,都得到 Uｊ;否则所得为-M。假设代理人ｊ选择“积极”策略时,就没有额外收益,而选择“偷懒”时,可有ｌｉ>0单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出:

状态ｓ1(坏)

α1　β1　( U1, U2)　β2　( U1-M)

α2　(-M, U2)　(-M,-M)

状态ｓ2(好)

α1　β1　( U1, U2)　β2　( U1,-M)

α2　(-M, U2)　( U1+ｌ1, U2+ｌ2)

这样,在好的环境ｓ2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+ｌ1, U2+ｌ2);而在坏的状态ｓ1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈,我们发现在状态ｓ2中,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( U1, U2)升至( U1,+ｌ1, U2+ｌ2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。

词条	颤抖手精炼均衡
释义	“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进，其基本思想是：在任何一个博弈中，每个局中人都有一定的犯错误的可能性（类似一个人用手抓东西时，手一颤抖，他就抓不住他想抓的东西）。性质意义价值性质一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人ｉ要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。意义从博弈论中我们知道，泽尔腾的这种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大致说来，泽尔腾(1975)假定，在博弈中存在一种数值极小但又不为0的概率，即在每个博弈者选择对他来说所有可行的一项策略时，可能会偶尔出错，这就是所谓的“颤抖之手”。因之，一个博弈者的均衡策略是在考虑到其对手可能“颤抖”(偶尔出错)的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看，在演进博弈论中，最初的演进稳定性的出现，并不完全来自博弈双方的理性计算，而实际上可能是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。按照这一分析思路，我们也可以认为，人们对一种习俗(演进稳定性)的偏离，也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。价值为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态ｓ1和ｓ2下,每个委托人的收益如下: 状态ｓ1(坏)　状态ｓ2(好) β1　β2　β1　β2 α1(ｃ1,ｃ2)　(ｄ1,ａ2) α1(ｄ1,ｄ2)　(ｅ1,ｂ2) α2(ａ1,ｄ2)　(ｂ1,ｂ2) α2(ｂ1,ｅ2)　(ｃ1,ｃ2) 其中,0<ａｊ<ｂｊ<ｃｊ<ｄｊ<ｅｊ,ｊ=1,2。这意味着当自然状态“坏”时,每个代理人都必须采用积极”的策略才可能使自己的委托人得到中等以上的收益(即不小于ｃｊ);而当自然状态“好”时,两代理人都选“偷懒”也可使各自的委托人得到ｃｊ的收益。现在设代理人ｊ(ｊ=1,2)在他的委托人的利润不小于ｃｊ单位时,都得到 Uｊ;否则所得为-M。假设代理人ｊ选择“积极”策略时,就没有额外收益,而选择“偷懒”时,可有ｌｉ>0单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出: 状态ｓ1(坏) α1　β1　( U1, U2)　β2　( U1-M) α2　(-M, U2)　(-M,-M) 状态ｓ2(好) α1　β1　( U1, U2)　β2　( U1,-M) α2　(-M, U2)　( U1+ｌ1, U2+ｌ2) 这样,在好的环境ｓ2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+ｌ1, U2+ｌ2);而在坏的状态ｓ1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈,我们发现在状态ｓ2中,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( U1, U2)升至( U1,+ｌ1, U2+ｌ2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。
随便看	毕承海毕承松毕承昭毕承铿毕赤酵母毕传国毕传兴毕传有毕传鑫毕春芳毕春华毕春丽毕春群毕春英毕纯毕辞毕此君毕从沫毕从义毕翠克丝·波特毕翠克丝·波特毕达哥拉斯毕达哥拉斯定理毕达哥拉斯树毕达哥拉斯学派多普达 818 多普达 818 多普达 828＋土型人土埋半截土城土城圣母庙土城子古城遗址土城子遗址土城站土域土堡土堰土塑土塘镇土墓蝠土墩站土壕龙洞土壤土壤侵蚀土壤侵蚀图土壤侵蚀预报土壤养分图土壤制图土壤化学性质分析

性质

意义

价值