Download presentation
Presentation is loading. Please wait.
1
回帰分析入門 経済データ解析 2011年度
2
このスライドの内容 2変量データの記述 因果関係と計量経済分析 回帰分析
2変量データの記述には、それぞれ1変量データを記述することに加え、2変量間の関係の記述が含まれる。2変量間の関係を数値で表す相関係数と、グラフで表す散布図を紹介する。 因果関係と計量経済分析 経済2変量間に因果関係が見られる場合、その定量的な分析をおこなうことが計量経済分析である。 回帰分析 計量経済分析によく用いられる統計分析手法である、回帰分析の簡単な紹介をおこなう。
3
2変量データの記述 2変量データ → 2つの対になったデータ 2変量データの記述 → それぞれ1変量の記述 + 2変量の関係の記述
2変量データ → 2つの対になったデータ (例)あるクラスの英語と数学のテストの点数 ※ A組の英語の点数とB組の数学の点数は2つのデータであるが、対になっていない。 ※ 2変量データはその組合せを変えることはできない → イチロー君の英語とヒデキ君の数学を組み合わせても、意味がない。 2変量データの記述 → それぞれ1変量の記述 + 2変量の関係の記述
4
2変量の関係 2変量の関係の表現方法 数値的表現-相関係数 視覚的表現-散布図 この2つの表現には関連性がある
(例)英語の点数が高い人は数学の点数も高い (例)数学の点数が高い人は社会の点数が低い ⇒ 1つの変量Xが変化したときに、それにともなってYがどのように変化するか 2変量の関係の表現方法 数値的表現-相関係数 視覚的表現-散布図 この2つの表現には関連性がある
5
2変量の関係の数値的表現 相関係数 相関係数Rは-1と1の間の値をとる。 R>0 正の相関 R<0 負の相関 R=0 無相関
6
2変量の関係の視覚的表現 散布図 正の相関(R>0) Xが大きな値をとるほど、Yも大きな値をとる。 負の相関(R<0)
7
相関関係と因果関係 相関関係 因果関係 所得と消費の関係は相関関係だけではなく、所得を原因、消費を結果とする因果関係が成り立っている。
双方向的な関係 (例)英語の点数が高い⇔数学の点数が高い 因果関係 一方が原因となって、もう一方が結果となる関係。原因と結果を反対にすることはできない。 (例)所得が高い(原因)⇒消費が多い(結果) 相関関係 因果関係 所得と消費の関係は相関関係だけではなく、所得を原因、消費を結果とする因果関係が成り立っている。 所得が多くなれば(原因) → 消費も多くなる(結果) 所得が少なくなれば(原因) → 消費も少なくなる(結果)
8
因果関係の例 風が吹く(原因) ⇒ 桶屋が儲かる(結果) ※ 風が吹くと桶屋が儲かる 最終的には 風が吹くと砂ぼこりが立つ
※ 風が吹くと桶屋が儲かる 風が吹くと砂ぼこりが立つ → 砂ぼこりで目を痛めて失明する人が増える → 失明した人はよく三味線を弾くのでその需要が増える → 三味線には猫の皮を張るので猫が捕獲されて数が減る → するとねずみが増えるので桶がたくさんかじられる → だから桶屋が儲かる いくつもの因果関係が連鎖したもの。 最終的には 風が吹く(原因) ⇒ 桶屋が儲かる(結果) となる。
9
このような論理の積み重ねによって、経済の現状把握・予測をおこなうことを定性的分析という。
経済理論はこのような因果関係の積み重ねである。 (例) 「ある商品の価格を下げると、販売数量は増加する」 このような論理の積み重ねによって、経済の現状把握・予測をおこなうことを定性的分析という。 これから一歩踏み込んで、 「ある商品の価格を○%下げると、販売数量が○%増加する」 というように、数量的な把握をするものが定量的分析である。 このような定量的分析をおこなうために、統計データが用いられる。 (例) 風速○メートルの風が吹けば、失明する人が○人増えて (中略) 桶屋が○○円儲かる。
10
統計データを用いた定量的分析のことを、計量分析という。経済分析における計量分析が計量経済分析である。
計量経済分析をおこなうことによって、経済理論が現実経済に合致しているかどうかのチェックをおこなうことができる。 因果関係の定量的分析には回帰分析という統計手法がよく用いられる。
11
回帰分析 Xを独立変数(説明変数)とよび、Yを従属変数(被説明変数)とよぶ。 回帰分析は、因果関係の定量的分析に最適な統計的方法である。
回帰モデルの例 (どのような式が最適かは、散布図や経済理論などから総合的に判断される) Xを独立変数(説明変数)とよび、Yを従属変数(被説明変数)とよぶ。 Y=a+bX Y=a+bX2 Y=a/(X+b)
12
所得と消費の例では、散布図や経済理論からY=α+βX という直線の関係が最適であると示唆される。
回帰分析の第1目標 → α,β(これらを回帰係数とよぶ)の推定値を求めること ⇒ この推定値を求めることによって、所得が変化したときに、消費がどの程度の大きさになるかを推定できる。 Y=α+βX
13
回帰係数の推定値 回帰係数の推定値は最小2乗法という方法で求めることができる。
最小2乗法はデータの各点と直線との距離(これを残差という)の2乗和が最小となるように直線を引く方法である。 推定値は次のような式で求められる。
14
予測値と残差 あるXに対応する直線上の点を予測値(または理論値)といい、 であらわす。
予測値は、すべてのデータが推定された回帰直線上にあるとした場合に、あるXに対応したYの値であり、データとして現有していないXに対するYの値の予測となる。 残差はYから を引いたものである。
15
これは、回帰直線の方程式(ただし、推定されたもの)が、
係数推定値として、 b=0.945 a=-23.21 という結果が得られたとする。 これは、回帰直線の方程式(ただし、推定されたもの)が、 Y = X であることを表している。 Y=-23.21+0.945X X=250のとき、 Y = × 250 = から、Yの予測値(理論値)は213.04となる。 X=350のとき、 Y = × 350 = から、Yの予測値(理論値)は307.54となる。
16
決定係数 右の表のような数値例を考えてみよう。 この2つの例に回帰分析を適用すると、ともにY=3+0.5X という回帰直線が導出される。
17
この2つの図を比べると、データに対する回帰直線のあてはまりが異なること(データが直線の近くに位置しているか、直線から離れて位置しているか)がわかる。そのあてはまり具合を数値で表したものが決定係数R2である。 この2つの例の、左はR2=0.998、右はR2=0.685となる(導出方法は後述)。 決定係数は、 と解釈することができ、0と1の間の値をとる。決定係数が1に近いほど回帰直線のあてはまりはよく、決定係数の値が小さい場合(0.5とか0.6以下の場合)には、分析の妥当性を検討する必要がある。
18
具体的には、すべての点のYの平均の線を引き、各点と平均の差の2乗和と、回帰直線上の点(予測値)と平均の差の2乗和の比をとったものである。
回帰直線上の点(予測値)と平均の差、この2乗和が回帰によって説明される変動となる。 この2つの比が決定係数R2となる。 決定係数の式は次のようになる。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.