- 中文名
- 多重共线性
- 外文名
- Multicollinearity
- 相关词目
- 近似共线性
- 依据模型
- 线性回归模型
简介
其中
服从多元正态分布
,设计矩阵 X 是
的,且秩为 p。这时,参数
的 LS 估计为
,而回归系数的 LS 估计为
。注意到由此获得的 LS 估计是无偏的,于是估计
的均方误差为
如果存在一组不全为零的数
,使得
如果线性回归模型存在完全共线性,则回归系数的 LS 估计不存在,因此,在线性回归分析中所谈的共线性主要是非完全共线性,也称为
复共线性
。判断复共线性及其严重程度的方法主要有特征分析法(analysis of eigenvalue),条件数法 (conditional numbers)和方差扩大因子法(variance inflation factor)。
[1]
产生原因
(2)滞后变量的引入
(3)样本资料的限制
影响
(2)近似共线性下OLS估计量非有效
多重共线性使参数估计值的方差增大,1/(1-r2)为
方差膨胀因子
(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。可以这样记忆:容许度代表容许,也就是许可,如果,值越小,代表在数值上越不容许,就是越小,越不要。而共线性是一个负面指标,在分析中都是不希望它出现,将共线性和容许度联系在一起,容许度越小,越不要,实际情况越不好,共线性这个“坏蛋”越强。进一步,方差膨胀因子因为是容许度倒数,所以反过来。
总之就是找容易记忆的方法。
(3)参数估计量经济含义不合理
需要注意:即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。但是OLS法在统计推断上无法给出真正有用的信息。