企業のパネルデータ分析 同志社大学 中尾ゼミ 印刷用
目的 例①複数年度のデータたとえば, 2001 年から 2004 年で,食品産業の企業で売上高 1000 億 円以上の大企業と 1000 億円未満の企業群の 利潤率のばらつきの原因を比較分析する 例②複数年度のデータで,食品産業の企業で 広告をしている企業を対象に広告が利潤率 に与える影響を明らかにする
パネルデータ分析の方法 複数の企業の時系列データを収集する 例 : 食品産業の企業30社 2001年から2004年 30社 × 4年=120 → 総データ数 この120社の4年のデータを使って分析する. 例えば,4社の30年のデータを使って分析して もよい.
データ収集 食品産業の企業30社の2001年から2004年 のデータとして 例えば, 資産合計,売上高,営業利益 を収集し, food0104.txt に書き込む パネルデータの収集方法の説明は これを読むにはパスワードが必要!クリック後に表 れるパスワード入力画面はこの画面の後かも... 注意:決算月を変更した企業は採用しない
XTSP 起動 XTSP を起動する. 初期画面の使い方は以下にあります。 t e.jp/class/HowToUseXXTSP.mht 『新しい TSP ファイル』ボタンをクリック,必要な 情報を入力する 入力方法の説明は以下にあります。 t e.jp/class/HowToTSPPNL.mht
プログラム例 TSP プログラムを編集する画面で例えば,以下のように書き 換えます. OPTIONS CRT; SMPL 1 120; 30社で4年のデータ=120 コード 年 決算月 資産合計 売 上高 利潤 READ(file=‘food0104.CSV’) cd y m k u r ; Freq(panel,ID=cd); データがパネルデータと指定 rjr=r/k; 利潤率計算 gr=u/u(-1); 成長率計算 panel rjr c gr u; パネルデータで統計分析 END;
4種類の計算結果 TSP でパネルデータを計算すると4種類の計算結果 が表示されます. 上から順に ①データプールモデル ②平均値モデル ③固定効果モデル ④ランダム効果モデル です.
①データプールモデル 食品産業の企業30社の2001年から2004 年のケースであれば 企業30社 × 4年=120のデータすべてを 使って最小自乗法で縦軸切片と係数を推定する. 例:被説明変数が利潤率r,説明変数が広告aとし て r=5+ 0.5 a となったとすれば, 広告aがゼロのときには利潤率rは5. 広告aが1増加すれば利潤率は 0.5 増加する
②平均値モデル 食品産業の企業30社の2001年から2004年 のケースであれば 企業30社の各社について 4年間の利潤率と広告の平均値を計算する. その結果30個のデータが得られる. この30のデータを用いて最小自乗法で縦軸切片と 係数を推定する.
③固定効果モデル 食品産業の企業30社の2001年から2004年の 例 縦軸切片は各社で異なると想定して最小自乗法で縦 軸切片と係数を推定する. 例:被説明変数が利潤率r,説明変数が広告aとして a社:r=5+ 0.5 a b 社:r=7+ 0.5 a c社:r=-3+ 0.5 a,....後27社分 ただし,縦軸切片の推定結果は表示されない
④ランダム効果モデル 食品産業の企業30社の2001年から2004年の 例 各企業の被説明変数に影響を与える変数が抜けてい ると想定して推定する. 4種類の計算結果のうち 固定効果モデ ルを利用する
推定結果1:データプールの分析結果 TOTAL (plain OLS) Estimates: Dependent variable: RJR Mean of dep. var. = Std. dev. of dep. var. = 略 R-squared = Adjusted R-squared = E 略 Estimated Standard Variable Coefficient Error t-statistic P-value GR E [.101] U E E [.894] C E [.098] これはすべてのデータを同時に用いた推定結果.
推定結果2:固定効果モデルの分析結果 WITHIN (fixed effects) Estimates: Dependent variable: RJR Mean of dep. var. = Std. dev. of dep. var. = 略 R-squared = Adjusted R-squared = 略 Estimated Standard Variable Coefficient Error t-statistic P-value GR E E [.869] U E E [.492] これは縦軸切片が企業によって異なるとして推定した結果.
データチェック プログラムを赤字のように訂正して実行してくださ い。 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r; Print cd y m k u r; データの印刷 Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); panel rjr c gr u; END;
企業に複数データがあるケース 同じ企業で,単一年に2あるいは3以上のデータがあ るケースがある場合,例えば, 企業コード,年,月,売上高,営業利益のケースで CD Y M k u r となっているケースでは,同一企業が単一年に2回 財務データを公表しています.このような場合には, この企業をサンプルから削除して,データ収集をや りなおしてください。
欠損データ1 エクセルでデータを見て空白があれば欠損データです . 全企業でデータがない場合にはそのデータを除いてデ ータ収集をやりなおしてください. 一部の企業で欠損データがある場合には (1) エクセルで空白欄をすべてゼロにし (2)TPS プログラムで,ゼロにしたデータを分析対象か ら 除いてください.例えば, AD に欠損データがある場 合には Select AD >0 ; としてください。
欠損データ2 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r AD RD ; Freq(panel,ID=CD); AD と RD に欠損データがある場合には Select AD>0 & RD>0; Panel u c AD RD r; とします.
大企業の分析 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r ; Print cd y m k u r ; データの印刷 Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); 売上高 1000 億円以上の企業を選択 Select u>= ; 単位は 100 万円 Panel rjr c gr U; 売上高 1000 億円以下の企業を選択 Select u< ; Panel rjr c gr u;
利潤がプラスの大企業の分析 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r ; Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); 売上高 1000 億円以上での企業を選択 Select u>= & r> 0; 単位は 100 万円 Panel rjr c gr U;
マクロ経済データの収集 ①企業行動はマクロ経済状況の影響を受けるため, パネルデータ分析でもマクロ経済データを収集して 説明変数とする必要がある. ②マクロ経済データは財務データの 1 年前のものを収 集.財務データが 2001 年決算から 2004 年決算であれ ば,マクロ経済データは 2000 年度から 2003 年度の年 度データを収集する.これは企業決算は3月が多い ため. ③収集したマクロ経済データ使って,財務データファ イルに追加する → 次のスライド参照.
マクロ経済データの利用 例えば,マクロ経済データとして GDP を収集し, 財務データに追加する場合は以下のように変更 する 財務データ マクロデータ コード 年 月 財務データ 年 データ
マクロ経済データの利用のプログラム プログラムを赤字のように訂正して実行してくださ い。 OPTIONS CRT; SMPL 1 120; READ(file=‘food0104.CSV’) cd y m k u r y2 GDP; Print cd y m k u r y2 GDP; Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); panel rjr c gr u gdp; END;