第5章 回帰分析の諸問題(2) ー 計量経済学 ー
第1節 分布ラグ 第2節 ダミー変数 補節 構造変化の検定 1 幾何級数型分布ラグ 2 幾何級数型分布ラグの推定 第1節 分布ラグ 1 幾何級数型分布ラグ 2 幾何級数型分布ラグの推定 3 幾何級数型分布ラグの例 -ブラウン型消費関数- 4 アーモン・ラグモデル 第2節 ダミー変数 1 外れ値 2 外れ値の解決 3 季節調整ダミー 4 季節調整ダミーの例 補足1 質的変数ダミー 補足2 係数ダミー 補節 構造変化の検定
第1節 分布ラグ 第3章 例5 (108-109ページ)において、被説明変数が当期と前期の説明変数の影響を受けているモデルを考えた。 第1節 分布ラグ 第3章 例5 (108-109ページ)において、被説明変数が当期と前期の説明変数の影響を受けているモデルを考えた。 このモデルをさらに拡張し、かなり過去からの説明変数が、被説明変数に影響を及ぼしているモデルを考える。 このとき、分布ラグという概念を利用する。 消費 当期の所得 前期の所得
分布ラグを利用したモデルは、次のように表現できる。 このようなモデルを使う例として、たとえば年間出生数を被説明変数とする回帰モデルなどが考えられる。 出生数に影響を与える説明変数として、婚姻件数が考えられるが、年間出生数を考える場合、その年の婚姻件数だけでなく、前年、さらにその前年と過去数年間にわたる婚姻件数が出生数に影響を及ぼしていると考えられる。このような場合、分布ラグモデルが有効である。 分布ラグにはさまざまな種類があるが、それはこのパラメータ b1,b2,・・・ にどのような関係を想定するかによるものである。
1 幾何級数型分布ラグ 幾何級数とは 2, 22, 23, ・・・ のように、等倍で変化する級数のことである。(高校の数学では等比数列として習った) 分布ラグモデルのパラメータにおいて、 という関係(ただし、0<λ<1)を想定したものが、幾何級数型分布ラグモデルである。 このモデルは図5-1のように、過去にさかのぼるに従ってその影響が少なくなっていくものであり、 と表すことができる。
※ 幾何級数型分布ラグの例 b=2, λ=0.5としたとき、幾何級数型分布ラグのパラメータは下のようになる。
2 幾何級数型分布ラグの推定 幾何級数型分布ラグモデルは であり、このモデルを1期前について書いてみると となる。この両辺をλ倍すると となる。これを元のモデルから引くと となる。ここで、 とおくと、 となり、最小2乗法で推定できる。
3 幾何級数型分布ラグの例 -ブラウン型消費関数- ブラウン型消費関数は幾何級数型分布ラグモデルと解釈することもできる。 消費をC、可処分所得をYDとすると と表すことができる。このモデルでは、被説明変数の過去の値が説明変数に含まれるので、系列相関の判定にはダービン・ワトソン比ではなく、ダービンのh統計量をもちいる。
4 アーモン・ラグモデル 幾何級数型分布ラグモデルは、無限の項を想定するものであったが、ここでは有限の項について、そのパラメータが多項式の形で表されるモデルを考える。 すなわち というモデルのパラメータについて、 という多項式を想定するモデルである。このモデルは考案した学者の名前をとって、アーモン・ラグモデルともいわれる。
アーモン・ラグモデルにおいて、m=3, p=2の場合を考える。このときモデルは となり、パラメータは となる。これをモデルに代入すると となる。
この式をc1,c2,c3についてまとめると、 となる。ここで、 とおくと、このモデルは という重回帰モデルになる。よって、YtをW1,W2,W3に対して回帰し、アーモン・ラグモデルのパラメータを推定する。
第2節 ダミー変数 被説明変数の動きが、説明変数だけで十分に説明できないとき、0と1の値のみをとる特殊な変数を用いることがある。この変数のことをダミー変数という。 ダミー変数は、次の3種類に分類することができる。 ① 一時ダミー(突発的ダミー) → 外れ値への対応 ② 定数項ダミー → 季節変動や質的変数への対応 ③ 係数ダミー → 構造変化への対応
下の図は、1985年から2009年までの日本の水稲の作付面積と収穫量の関係である。 1 外れ値 下の図は、1985年から2009年までの日本の水稲の作付面積と収穫量の関係である。 この図を見ると、他のデータは回帰直線の近くにあるのに、1つのデータのみ大きく外れたところある。 このようなデータを外れ値(または異常値)という。 データ出典:農林水産省『作物統計』
<外れ値の原因> この例における外れ値は1993年のデータである。 この年日本は米の生産地を中心に、異常な冷夏であり米の収穫が非常に少なかった。 日本では外国産米(当初、カリフォルニア米、その後不足してタイ米)の緊急輸入をおこなった。(平成コメ騒動といわれることもある) このような天災、戦争(最近では1991年の湾岸戦争など)、オイルショック(1973年、1978年)、消費税の導入と引き上げ(1989年、1997年)などは、変数が通常とは異なった異常な値をとることがある。 また、都道府県別データの場合は、北海道、東京都、沖縄県などが特殊な動きをすることがある。
<外れ値の判定> 回帰直線からどの程度外れたら外れ値となるのであろうか? 1つの基準として、「標準化残差が±2を超えたもの」とするものがある。 この例の場合、1993年の標準化残差は-2を下回っているので、この基準では外れ値とみなされる。 ただし、±2というのは絶対的な基準ではなく、本によっては±3や±4という基準もある。
2 外れ値の解決 このような外れ値が存在する場合、次のような解決方法が考えられる。 ① 外れ値をとり除き、その他のデータで分析をおこなう。 ② 外れ値の部分にダミー変数を用いて分析をおこなう。 都道府県別データのようなクロスセクションデータであれば、特定の地域のみ除く①の方法を用いることもできるが、時系列データで中間の1年を除くことは不自然である。 この例のような時系列データの場合には、②のように一時ダミー(突発的ダミー)を用いた分析をおこなう。
一時ダミーは、特定の時点のみ1をとり、他の時点はすべて0をとるダミー変数である。 <一時ダミー> 一時ダミーは、特定の時点のみ1をとり、他の時点はすべて0をとるダミー変数である。 この例において、コメの収穫量をYt、作付面積をXtとする。そして、1993年のみ1をとり、それ以外の年はすべて0をとるダミー変数Dtを考えると、次のようなモデルが考えられる。 このモデルは、1993年のデータ以外から回帰直線 を求め、1993年の と の差を によって埋めるという形になっている。 Y=a+bXt cDt
四半期データを用いた分析 - 季節変動の影響を受ける。季節調整済のデータを分析に用いる。 3 季節調整ダミー 四半期データを用いた分析 - 季節変動の影響を受ける。季節調整済のデータを分析に用いる。 原データを分析に用いる場合、季節調整ダミーを用いる。 季節ダミーを用いた場合のモデルは次のようになる。 D1 =1 (第Ⅰ四半期) D2 = 1 (第Ⅱ四半期) D3 = 1 (第Ⅲ四半期) 0(その他) 0(その他) 0(その他) 第Ⅰ四半期 第Ⅱ四半期 第Ⅲ四半期 第Ⅳ四半期 Ⅰ Ⅱ Ⅲ Ⅳ c d e a
4 季節調整ダミーの例 季節調整ダミーを入れた分析は、傾きの等しい4本の回帰直線を、それぞれの四半期のデータに対して適用するということである。 これは定数項ダミーの一種である。
季節調整ダミーと同じように、傾きの等しい複数の回帰直線を引きたい場合がある。 補足1 質的変数ダミー 季節調整ダミーと同じように、傾きの等しい複数の回帰直線を引きたい場合がある。 たとえば、ある企業の従業員について、支給される給与額を勤続年数に対して回帰する場合を考えよう。このとき、大卒と高卒で2つのグループが作られたとする。 このとき、次のようなモデルが考えられる。 大卒 高卒 大卒 このように、学歴、性別などで複数のグループに分ける場合、ダミー変数が用いられる。 高卒 c a
ダミー変数の利用法には、定数項の異なる回帰直線を引くだけでなく、傾きの異なる回帰直線を引くということもある。それが係数ダミーである。 補足2 係数ダミー ダミー変数の利用法には、定数項の異なる回帰直線を引くだけでなく、傾きの異なる回帰直線を引くということもある。それが係数ダミーである。 たとえば、 1次エネルギー需要量を実質GDPに対して回帰することを考えると、これはオイルショックによって需要量に構造変化が起きた。 このとき、次のようなモデルが考えられる。 オイルショック前 オイルショック後 オイルショック前 オイルショック後 a
<係数ダミーと定数項ダミーの併用> 構造変化が起きた場合、ある時点において傾きが変わるということは、傾きと定数項がともに異なる2つの回帰直線を組み合わせるものである。これは係数ダミーと定数項ダミーを併用することによってモデル化できる。 オイルショック前 オイルショック後 オイルショック後 d オイルショック前 a
補節 構造変化の検定 構造変化が起こっているかどうかは、統計的な検定を用いて検証することが可能である。この節では、構造変化の検定(チャウ検定(Chow test))の説明をおこなう。 最初に、構造変化の前後のモデルを次のようにあらわす。 このとき、構造変化を検定するための仮説は となる。
残差2乗和を次のようにあらわす。 SSR1:変化前の残差2乗和 SSR2:変化後の残差2乗和 SSR:全期間の残差2乗和 すると検定統計量は となる。この統計量を、自由度(k+1, n-2(k+1)) のF分布と比較すればよい。