📐 03 · 异方差 Heteroskedasticity

什么是异方差?

定义:误差项的方差不是常数,即 Var(εᵢ) ≠ σ²(违反CLRM假设5)

后果:OLS仍无偏但不再有效(不是BLUE);SE有偏 → t检验和F检验不可靠

常见场景:横截面数据,大企业vs小企业、高收入vs低收入

一、三大检验方法速查

Park Test

辅助回归
ln(e²ᵢ) = α₀ + α₁ln(Zᵢ) + vᵢ

H₀:α₁ = 0(同方差)

H₁:α₁ ≠ 0(异方差)

检验:t检验 α₁

特点:需指定Z

White's Test

辅助回归
e²ᵢ 对所有变量+平方+交叉

H₀:同方差

H₁:异方差

统计量W = nR²_aux

分布:χ²(df)

Breusch-Pagan

辅助回归
e²ᵢ 对所有原变量

H₀:同方差

H₁:异方差

统计量BP = nR²_aux

分布:χ²(k)

⚠️ 所有异方差检验的H₀都是"同方差"!拒绝H₀ → 存在异方差。

二、Park Test 完整流程

1
估计原模型,获得残差 eᵢ
2
选择比例因子 Z(怀疑导致异方差的变量,如收入、规模)
3
做辅助回归:ln(e²ᵢ) = α₀ + α₁·ln(Zᵢ) + vᵢ
4
检验 H₀: α₁=0(同方差)vs H₁: α₁≠0(异方差)
5
若拒绝H₀ → 存在异方差,且异方差形式与Z相关

Park Test 的两个实际困难(Past Q2e 必考题!)

困难1:Z可能取0或负数 → 不能取对数

例如:BIDRS可能为0 → ln(0)不存在

困难2:选择哪个Z是主观的

没有客观标准决定哪个变量是比例因子 → 可能选错 → 漏检异方差

📝 真题 (Past Q2d): 用Park检验,以BIDRS为比例因子
Model 3 输出:ln(e²)对ln(BIDRS)回归,t = −0.219, p = 0.827
→ α₁不显著 → 不能拒绝H₀ → 没有证据表明以BIDRS为比例因子的异方差

三、White's Test 完整流程

1
估计原模型,获得残差 eᵢ
2
构建辅助回归:e²ᵢ 对所有原变量 + 变量平方 + 交叉项
3
计算检验统计量:W = n × R²_aux
4
W ~ χ²(m),其中 m = 辅助回归中解释变量个数(不含截距)
5
若 W > χ²_crit(m) → 拒绝H₀,存在异方差

如何计算自由度 m?

原模型有 k 个解释变量

辅助回归包含:k个原变量 + k个平方项 + C(k,2)个交叉项 = k(k+3)/2 个变量

所以自由度 m = k(k+3)/2

例:Model 1有3个变量(NEW, USED, BIDRS),m = 3×6/2 = 9

📝 真题 (Past Q2f): White's Test for Model 1
Gretl输出:Unadjusted R² = 0.019208,n=215
→ W = 215 × 0.019208 = 4.130
→ df = 3×6/2 = 9, α=5% 临界值 χ²(9) ≈ 16.92
→ 4.13 < 16.92 → 不能拒绝H₀ → 没有证据表明存在异方差

四、补救方法

方法做法使用场景
White稳健标准误 不改变系数估计,只修正SE 不确定异方差形式时(最常用!)
WLS (加权最小二乘) 用 1/Zᵢ 作为权重重新估计 已知异方差形式(如知道Z是比例因子)
变量变换 取log、标准化等 异方差源于变量尺度差异
💡 考试中常考:Mock Set 2 Q3中BP检验p=0.040<0.05 → 有异方差 → 建议使用Robust SE再确认推断。