词条 | 虚拟变量模型 |
释义 | 虚拟变量模型
目录 什么是虚拟变量[1] 模型中引入虚拟变量的作用[2] 虚拟变量设置的原则[3] 什么是虚拟变量[1]虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。 例如,反映文程度的虚拟变量可取为:1:本科学历;0:非本科学历 一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。 [编辑] 模型中引入虚拟变量的作用[2]1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差) [编辑] 虚拟变量设置的原则[3]在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定: 1)如果有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量,否则会导致多重共线性。称作虚拟变量陷阱。 例如,性别有2个互斥的属性,引用2-1=1个虚拟变量;再如,文化程度分小学、初中、高中、大学、研究生5类,引用4个虚拟变量。 2)关于定型变量中哪个取0哪个取1是任意的,不影响检验结果。 3)若定型变量取值为0,所对应的类别称为基础类别。 4)对于多于两个类别的定型变量可采用设一个虚拟变量,而对于不同类别采取赋值不同的方法处理。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。