词条 | 混合策略 |
释义 | 混合策略简介在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。 混合策略举例假设一收益矩阵表示如下(为一协调博弈)。这里,一个玩家选择列,另一个玩家选择行。列玩家得到第一个收益,行玩家则得到第二个。若列玩家偏向百分之百选择A ,则称他在玩纯策略。若行玩家偏向以掷硬币来决定,若头朝上则选择 A ,若字朝上则选择 B ,则称他在玩混合策略,而非纯策略。
A 1,1 0,0 B 0,0 1,1 混合策略的争议在1980年代时,混合策略的概念曾遭受很严重的攻击,被认为是“直觉地有问题”。混合策略的核心-随机缺乏行为的支持,人们很少会凭运气做决定。此一行为问题在认知的难题上显得更加严重,因为没有人能够在没有随机数发生器的帮助之下做出随机的决定来。 在阿里尔·鲁宾斯坦的一篇论文中,他描述了另一个了解此一概念的方法。首先,基于纯化理论,并假设混合策略的解释只是反应了对玩家资讯和决策过程认识的缺乏。明显地,随机决定被认为是不明确、利益无关的外部因素的结果。然而,一个由不明确的因素决定的结果很难令人感到满意。 第二个解释是,想像有许多组玩家在进行赛局,每组玩家都选择一个纯策略,且利益是依赖玩家们选择策略的百分比来决定的。因此,混合策略便表示是每一组玩家所选择的纯策略的分布。然而,这对玩家都是单独的一组时,提不出什么合理的解释。 之后,罗伯特·约翰·奥曼和亚当·布兰登勃格 重新将纳什均衡解释成是一种“信念”的均衡,而不是行动的。例如,在剪刀、石头、布里,信念的均衡即每个玩家都“相信”对方会平均地施行每一个策略。然而,此一解释弱化了纳什均衡的预测能力,因为在此均衡里,“确实”地施行石头的纯策略也是可能的。 直至今日,学者们对混合策略的结果依然是很矛盾的。混合策略依然广泛地被应用不存在纯策略均衡的赛局中,以提供其一个纳什均衡,但这些模型都无法说清楚为何且如何玩家能够随机化他们的决定。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。