词条 | 离群点 |
释义 | 离群点是指一个时间序列中,远离序列的一般水平的极端大值和极端小值。因此,也称之为歧异值,有时也称其为野值。 概括的说,离群点是由于系统受外部干扰而造成的。但是,形成离群点的系统外部干扰是多种多样的。首先可能是采样中的误差,如记录的偏误,工作人员出现笔误,计算错误等,都有可能产生极端大值或者极端小值。其次可能是被研究现象本身由于受各种偶然非正常的因素影响而引起的,例如。在人口死亡序列中,由于某年发生了地震,使该年度死亡人数剧增,形成离群点;在股票价格序列中,由于受某项政策出台或某种谣传的刺激,都会出现极增,极减现象,变现为序列中的离群点。 不论是何种原因引起的离群点对以后的时间序列分析都会造成一定的影响。从造成分析的困难来看,统计分析人员说不希望序列中出现离群点,离群点会直接影响模型的拟合精度,甚至会得到一些虚伪的信息。例如,两个相距很近的离群点将在谱分析中产生许多虚假的频率。因此,离群点往往被分析人员看作是一个“坏值”。但是,从获得信息来看,离群点提供了很重要的信息,它不仅提示我们认真检查采样中是否存在差错,在进行时间序列分析前,认真确认序列,而且,当确认离群点是由于系统受外部突发因素刺激而引起的时候,他会提供相关的系统稳定性,灵敏性等重要信息。 在时间序列分析中通常把离群点分为四种类型进行处理。第一类是加性离群点。造成这种离群点的干扰,只影响该干扰发生的那一时刻T上的序列值,即XT而不影响该时刻以后的序列值;第二种是更新离群点,造成离群点的干扰不仅作用于XT,而且影响T时刻以后序列的所有观察值,它的出现意味着一个外部干扰作用于系统的开始,并且其作用方式与系统的动态模型有关;第三种树水平位移离群点,造成这种离群点的干扰素在某一时刻T,系统的结构发生了变化,并持续影响T时刻以后的所有行为,在数列上往往变现为T时刻前后的序列均值发生水平位移;第四种是暂时变更离群点,造成这种离群点的干扰是在T时刻干扰发生时具有一定初始效应,以后随时间根据衰减因子的大小呈指数衰减的一类干扰事件。 |
随便看 |
|
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。