パネル分析について 中村さやか
復習: データの種類 横断面データ (cross-sectional data) 復習: データの種類 横断面データ (cross-sectional data) 1つの観測対象(人、世帯、企業、地域等)につき1時点だけで集めたデータ 経時横断面データ (pooled cross sections) 複数時点で無作為抽出を繰り返したデータ 1時点の横断面データとほぼ同じ方法で分析可能 パネルデータ (panel data) / 縦断的データ (longitudinal data) 同じ観察対象に対して複数時点で集めたデータ 例)21世紀出生児縦断調査: 2001年に生まれた子を無作為抽出し,毎年追跡調査
線形単回帰モデル y=β0+β1x+u 重要な仮定 1.E(u)=0 一般性を失うことなく仮定できる 2.E(u|x)=E(u) uはxについて平均独立 (u is mean-independent of x) E(u|x)=E(u) ⇔ Cov(x,u)=0 xの値がわかってもそれがuの期待値を変化させないならば、xとuは相関していないはず
仮定は成り立っているか? y=β0+β1x+u yが収穫高、xが肥料の量 ⇒uは畑のもともとの(肥料を与える前の)土壌の良さに大きく依存する E(u|x)=E(u) が成り立っていると仮定 ⇒肥料をたくさん与えられた畑とそうでない畑のもともとの土壌の良さの平均値は変わらない ⇒もし土壌の良い畑ほどたくさん肥料が与えられるなら矛盾
固定効果モデル 観察対象をi、観察時期をtで表すと、 yit=β0+β1xit+δdt+αi+uit αiは時間に対して不変なので、固定効果(fixed effect)とよばれる αiは観察できない個体差による影響を表しているので、 観察されない効果(unobserved effect)という dtは観察時期ダミー、δは観察時期による影響を表す uitは時間と共に変化し、誤差項についての仮定を満たす: E(uit)=0 & E(uit|xi1,…xiT)=E(uit)
固定効果モデルの例 yit=β0+β1xit+δdt+αi+uit yitが収穫高、xitが肥料の量 (時間と共に変化しない) δは技術進歩、全域の天候・災害等の影響 uitは局所的な天候・災害等、その他のランダムな要因
差分回帰① (first-differenced (FD) regression) yit=β0+β1xit+δd2+αi+uit d2: 2時点目ダミー 2時点目のデータなら1、そうでなければ0をとる変数 (←1時点目ダミーを入れると完全な多重共線性が生じる) ① yi1=β0+β1xi1 +αi+ui1 ② yi2=β0+β1xi2+δ+αi+ui2 ②から①を両辺で差し引くと yi2 - yi1=β1(xi2 - xi1)+δ+ui2 - ui1 ⇔ Δyi= δ+β1Δxi+Δui αiを消せた!
差分回帰② (first-differenced (FD) regression) Δyi= δ+β1Δxi+Δui 被説明変数がΔyi 説明変数がΔxiの回帰モデルとして推定: 1.E(Δu)=0 2.E(Δu|Δx)=E(Δu) の仮定が成り立っていなければならない 固定効果モデルの仮定より、E(uit)=0 & E(uit|xi1,…xiT)=E(uit) E(Δu)=E(ui2-ui1)=E(ui2)-E(ui1)=0 E(Δu|Δx)=E(ui2-ui1|xi2-xi1)=E(ui2|xi2-xi1)-E(ui1|xi2-xi1) =E(ui2)-E(ui1)=E(Δu)=0 仮定成立
ダミー変数による固定効果モデルの推定 (fixed effect (FE) model) yit=β1xit+δd2+αidi+uit d2: 2時点目ダミー di: 個々の調査対象ダミー このモデルでは切片が調査対象によって異なる 調査対象の数だけダミー変数が必要なので、説明変数の数が非常に多くなる パネルでないと推定できない(クロスセクションデータの場合、説明変数の数がデータ数より大きくなってしまう!)
first-difference(FD) と fixed effect(FE) の比較 2時点のパネルデータの場合 どちらの方法でも推定結果は全く同じ ⇒FDのほうが説明変数が少なくて済むので楽 3時点以上のパネルデータの場合 推定結果はFDとFEで同じではない ⇒両方で結果が違うか検証する必要がある もし誤差項の系列相関がなければ、FEのほうが分散が小さい(efficient)ためFDより望ましい 系列相関:同一変数の時系列での相関 長期にわたるパネルデータの場合、誤差項の系列相関に対して注意が必要
パネル分析の限界と可能性 説明変数が変化しない場合には意味がない 例: 所得を教育水準に回帰 重要な仮定: 固定効果が時間と共に変化しない 例: 所得を教育水準に回帰 重要な仮定: 固定効果が時間と共に変化しない 例: 健康を所得に回帰 理想的なケース: 調査対象によって差がある、外生的な変化 天候・災害・政策ショック 一律の変化では年別ダミーに効果が吸収されてしまう 例: 子ども手当 ある自治体だけで起きた政策変化は扱いやすい