事例研究(ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 - (#503 – パネルデータ分析の応用(1)) 2017年 12月 戒能一成
0. 本講の目的 (手法面) - 応用データ解析の手法のうち、パネルデータ 分析の概要を理解する (内容面) - 計量経済学・統計学を実戦で応用する際の 留意点を理解する
1. パネルデータ分析とは 1-1. パネルデータ分析 (Longitudinal/Panel Data) - パネルデータ分析とは、複数の対象・複数の時 点に関するデータを用いた回帰分析をいう (注 ; 対象x時点 だけでなく、稀に 対象x対象、 対象x対象x時点 などの場合あり) - パネルデータ分析の利点は多数あるが、実務上 下記 3点が非常に重要 ・ 試料数が限られる場合の有効な計測 ← 「自由度」の確保 ・ 膨大な試料からの特定の効果・影響の計測 ・ 複数対象に横断的な効果・影響の計測 3
1. パネルデータ分析とは 1-2. パネルデータ分析の概念図 - パネルデータ分析とは、複数の対象・複数の時 点に関するデータを用いた回帰分析をいう 時間 → 0 1 ・・・ t (制度変更) ・・・ n (2017) 対象 ↓ X1 y10 y11 ・・・ y1t (変更)・・・ y1n (変更) X2 y20 y21 ・・・ y2t (変更)・・・ y2n (変更) X3 y30 y31 ・・・ y3t ( -- ) ・・・ y3n( -- ) X4 y40 y41 ・・・ y4t ( -- ) ・・・ y4n( -- ) 外的要因(毎年度変化)の影響が存在 パネルデータ分析 ( 複数対象・複数時点 ) → 外的要因変化と対象 異質性の同時除去 異質性 が存在 4
1. パネルデータ分析とは 1-3. パネルデータ分析と異質性 - パネルデータ分析において、対象の選択の際に なるべく異質性の少ない対象を選ぶ必要あり ・ 企業 → 業種, 売上高, 従業員数 ・・・ ・ 家計 → 所得, 世帯員数, 居住地域 ・・・ - 異質性を管理せずにパネルデータ分析をしても 単なる対象別の時系列分析と比べて精度・分解 能などが向上せず利点が活かせない場合あり - また一般の公的統計調査からパネルデータを 作成する場合、「対象主体の入れ替わり」に よる暗黙裏の異質性に注意が必要 5
1. パネルデータ分析とは 1-4. パネルデータ分析と特定化の問題 - パネルデータ分析においては、個々の対象別の 特性をどこまでモデルに反映させるか、という モデルの特定化の問題を考える必要あり ・ 固定効果モデル → 対象別の特性を識別 ・ 変量効果モデル → 対象別の特性は「誤差」 (対象別の「誤差」を別途設定) ・ プールモデル → 対象別の特性を無視 (時間・対象を識別しない「誤差」) ← Hausman検定・Breusch Pagan検定 (後述) 6
1. パネルデータ分析とは 1-5. パネルデータと「欠測」 - パネルデータ分析において「対象主体の入替り」 を特段の問題としないのであれば、特定の対象 のデータの一時的な「欠測」は問題とならない ・ 対象主体の出現・消滅 (起業・廃業など) ・ データの取得不可 (不提出・自然災害など) (「アンバランスド・パネルデータ」という) ← 通常の時系列分析に対する優位性の一つ - 特定の年度が一時的に「欠測」の場合も同様 ・ 調査の年度が連続しない場合 ・ 統計調査が実施されていない場合 7
2. パネルデータ分析と時系列分析 2-1. 時系列分析(ARMAX)の成立条件 [復習] - 系列相関の消滅 No Serial/Auto Correlation → 系列相関が発生しないか消滅していること - 変数の(弱)定常性 Weakly Stationary Variables → 変数は弱定常性条件を満たすこと (変数が単調増加・減少を続けていないこと) - 因果一方向性 No Reverse Causality → 被説明変数(y)から説明変数(xi)への因果性 が存在しないこと ← パネルデータ分析は系列相関対策に有効 8
2. パネルデータ分析と時系列分析 2-2. パネルデータ分析と時間による系列相関 - パネルデータ分析では、一般に計測において 時間方向の系列相関が発生することは少ない → 個々の対象のデータに系列相関が存在 しても、複数の対象のデータを用いれば 系列相関は問題とならない場合が多い - しかし念のため系列相関の検定を掛けるべき - つまりパネルデータ分析は「ラグ項」が存在しな いことを保証している訳ではない → 先ず通常の時系列分析を行いラグ構造を 把握・検討すべき (「ダイナミックパネル分析」) 9
2. パネルデータ分析と時系列分析 2-3. パネルデータ分析での「組織」の系列相関 - パネルデータ分析において、データを構成する対 象の一部に組織関係による系列相関(血縁・友 人関係、取引関係・資本関係などに起因した個 人・企業間の相関)があると誤差が異常に小さく なり「偽の有意性」が出る場合有(Moulton効果) - 同様に対象を何かのパラメータ順・組織順等で 周回的なデータを構築すると(擬似的な)系列相 関が現れ同様の問題を生じる場合あり ← いずれもパネルデータに特徴的現象 - 対策はGLSの利用(= 計量ソフトの利用) 10
2. パネルデータ分析と時系列分析 2-4. パネルデータ分析と定常性 - パネルデータ分析においても、各変数の定常性 について必ず確認が必要 → 定常でない個々の対象のデータにつき複数 対象のデータを集めてきても、定常性の問題 がなくなる訳ではない - パネルデータでの定常性検定については、ADF 検定の一種である Fisher Type ADF検定を適用 - 定常性検定が棄却された場合、通常のARMAX モデル同様に階差データをとり対応する 11
2. パネルデータ分析と時系列分析 2-5. パネルデータ分析と因果一方向性 - パネルデータ分析においても、(個別に)因果の一 方向性について確認が必要 → パネルデータ自体から因果性を判定する手 法は開発されているが未だ一般的でない - 因果の方向性検定は各説明変数毎に被説明変 数と Granger 因果性検定を適用 (Pair wise Granger Causality Test) - 逆方向の因果性が検出された場合、モデル構造 を見直す(変数を交換する)か、パネルVARモデ ルを構築; 「無意味解」「不安定解」を回避 12
3-1. パネルデータ分析の「安全な」手順 [重要] 1) 通常の項目別時系列分析の試行 3. パネルデータ分析の手法 3-1. パネルデータ分析の「安全な」手順 [重要] 1) 通常の項目別時系列分析の試行 a- 逆方向因果性判定 (ARMAX or VAR) b- 定常性判定 (定常化処理) c- ラグ構造把握 2) ( 1)を与件とした) パネルデータ分析の試行 (a- 逆方向因果性 – 通常の分析と共通 ) b- パネル定常性判定 (定常化処理) c- ラグ項の選択・検討 ( 1)の結果を反映) d- 固定効果・変量効果などモデル選択 (e- 系列相関消滅の確認 (念のため)) 13
- 固定効果モデル (Fixed Effect Model; “Within”) 個々の対象に対応したダミー変数を説明変数 3. パネルデータ分析の手法 3-2. パネルデータ分析の種類(1) - 固定効果モデル (Fixed Effect Model; “Within”) 個々の対象に対応したダミー変数を説明変数 として設け、対象毎の異質性を管理した上で 「対象に横断的な変化」に着目した分析 Y(i,t) = α + X(i,t)*βfx + Σi DMi(1/0) + ε(i,t) - 変量効果モデル (Random Effect Model) 対象に対応したダミー変数を設けず、対象毎 の(潜在的)異質性を確率的現象と仮定 Y(i,t) = α + X(i,t)*βre + ε(i,t) (要GLS) 14
- ビトィーンモデル (“Between” Model) 個々の対象・時間を識別するが、説明変数に 対象の「平均値」を用いた回帰分析を行い、 3. パネルデータ分析の手法 3-3. パネルデータ分析の種類(2) - ビトィーンモデル (“Between” Model) 個々の対象・時間を識別するが、説明変数に 対象の「平均値」を用いた回帰分析を行い、 対象間の異質性に着目する分析 (← 着目点が固定効果モデル(“Within”)の反対, 使用頻度低) Y(i,t) = α + Xaverage(i)*βbe + ε(i,t) - プールモデル (Pooled Model) (通常の回帰分析) 個々の対象・時間を識別せず、全てのデータ が均整に相関し誤差が均一と仮定した分析 Y(i,t) = α + X(i,t) *βpo + ε 15
3. パネルデータ分析の手法 3-4. パネルデータ分析の種類(3) プールデータモデル -全体的変化に着目 (誤差は均一) y ; 被説明変数 対象 i2 (時間変化) ビトウィーンモデル (“Between”) - 対象間の差異に着目 変量効果モデル (“Overall”) -全体的変化に着目 (誤差は対象別) 固定効果モデル (“within”) - 対象毎の変化に着目 固定効果モデル (“within”) - 対象毎の変化に着目 対象 i1 (時間変化) x ; 説明変数 16
- 定常性検定 (単位根検定 Unit root test) → パネル ADF 検定 (Fisher Type) 3. パネルデータ分析の手法 3-5. パネルデータ分析と検定 - 因果性検定 → Granger 因果性検定 - 定常性検定 (単位根検定 Unit root test) → パネル ADF 検定 (Fisher Type) - 固定効果・変量効果・プールモデル検定 → Hausman 検定 STATAの場合; Ho: 変量効果が正 → Breusch-Pagan 検定 - 系列相関検定 → “Q”検定, Breusch Godfrey LM検定 17
(1) 作図による概況確認 (P-Q図, 焼酎・清酒) (出典: 総務省家計調査報告, 2000-2013暦年) 4. パネルデータ分析の実例 4-1. 都道府県別酒類消費量 (焼酎・清酒) (1) 作図による概況確認 (P-Q図, 焼酎・清酒) (出典: 総務省家計調査報告, 2000-2013暦年) 18
(2) 因果性判定 (Granger Causality Test) ( 結果省略, 各県とも有意な逆因果性なし ) 4. パネルデータ分析の実例 4-2. 都道府県別酒類消費量 (焼酎・清酒) (2) 因果性判定 (Granger Causality Test) ( 結果省略, 各県とも有意な逆因果性なし ) (3) 単位根検定 (Unit Root Test, Fisher-ADF) ( 結果省略, 全て定常 ) (4) モデル仮構築(必ず固定効果モデルから開始) ln(Qx(i,t)) = Q0 +β1* ln(Px(i,t)) +β2* ln(I(i,t)) +β3 * ln(Pz(i,t)) +Σi(β4i*DMi) + ε(i,t) - 数量を価格・所得・代替財価格で回帰(対数) (本例では結果的に所得は殆どの場合有意でない) 19
(5a) 固定効果モデル推計 (Fixed Effect -) 4. パネルデータ分析の実例 4-3. 都道府県別酒類消費量 (焼酎) (5a) 固定効果モデル推計 (Fixed Effect -) 焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数) 定数項 20
(6a) 変量効果モデル推計 (Random Effect -) 4. パネルデータ分析の実例 4-4. 都道府県別酒類消費量 (焼酎) (6a) 変量効果モデル推計 (Random Effect -) 焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数) 定数項 21
(7a) Hausman 検定 ; モデル係数間の有意差検定 4. パネルデータ分析の実例 4-5. 都道府県別酒類消費量 (焼酎) (7a) Hausman 検定 ; モデル係数間の有意差検定 固定効果 変量効果 「係数に差がない」 帰無仮説を棄却 (→ 固定効果) 22
(8a) プールモデル推計 (Pooled -) 4. パネルデータ分析の実例 4-6. 都道府県別酒類消費量 (焼酎) (8a) プールモデル推計 (Pooled -) 焼酎価格(対数) ビール価格(対数) 発泡酒価格(対数) 清酒価格(対数) 定数項 23
(9a) 変量・プール検定 (Breusch-Pagan 検定) 4. パネルデータ分析の実例 4-6. 都道府県別酒類消費量 (焼酎) (9a) 変量・プール検定 (Breusch-Pagan 検定) 「県別誤差の分散 0」 帰無仮説を棄却 (→ 変量効果) 但し先のHausman検定の結果から 固定効果モデルが適切と判定される 24
4. パネルデータ分析の実例 4-7.都道府県別酒類消費量 (焼酎) 固定効果モデル 固定効果モデル (“within”) - 対象毎の変化に着目 固定効果モデル (“within”) “価格係数” -0.66 (都道府県別DM有) x ; 説明変数(対数価格) 変量効果モデル (“overall”) “価格係数” -0.76 (都道府県別誤差有) 都道府県 i1 (時間変化) 都道府県 i2 (時間変化) プールデータモデル (“Pooled”) “価格係数” -1.23 (誤差は均一と仮定) y ; 被説明変数 (対数消費量) 25
(5b) 固定効果モデル推計 (Fixed Effect -) 4. パネルデータ分析の実例 4-8. 都道府県別酒類消費量 (清酒) (5b) 固定効果モデル推計 (Fixed Effect -) 清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数) 定数項 26
(6b) 変量効果モデル推計 (Random Effect -) 4. パネルデータ分析の実例 4-9. 都道府県別酒類消費量 (清酒) (6b) 変量効果モデル推計 (Random Effect -) 清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 焼酎価格(対数) 定数項 27
(7b) Hausman 検定 ; モデル係数間の有意差検定 4. パネルデータ分析の実例 4-10. 都道府県別酒類消費量 (清酒) (7b) Hausman 検定 ; モデル係数間の有意差検定 固定効果 変量効果 「係数に差がない」 帰無仮説を保留 (→ 変量効果) 28
(8b) プールモデル推計 (Pooled -) 4. パネルデータ分析の実例 4-11. 都道府県別酒類消費量 (清酒) (8b) プールモデル推計 (Pooled -) 清酒価格(対数) ビール価格(対数) 発泡酒価格(対数) 招集価格(対数) 定数項 29
(9b) 変量・プール検定 (Breusch-Pagan 検定) 4. パネルデータ分析の実例 4-12. 都道府県別酒類消費量 (清酒) (9b) 変量・プール検定 (Breusch-Pagan 検定) 「県別誤差の分散 0」 帰無仮説を棄却 (→ 変量効果) 先のHausman検定の結果と併せて 変量効果モデルが適切と判定される 30
4. パネルデータ分析の実例 4-13. 都道府県別酒類消費量 (清酒) x ; 説明変数(対数価格) 固定効果モデル (“within”) - 対象毎の変化に着目 固定効果モデル (“within”) “価格係数” -1.06 (都道府県別DM有) 変量効果モデル (“overall”) “価格係数” -1.07 (都道府県別誤差有) 都道府県 i2 (時間変化) 都道府県 i1 (時間変化) プールデータモデル (“Pooled”) “価格係数” -1.28 (誤差は均一と仮定) y ; 被説明変数 (対数消費量) 31