第4章 回帰分析の諸問題(1) ー 計量経済学 ー.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

2016 年度 計量経済学 講義内容 担当者: 河田 正樹
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
第4章 統計的検定 統計学 2007年度.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
パネル分析について 中村さやか.
第3章 2変量データの記述 統計学基礎 2010年度.
重回帰分析入門 経済データ解析 2009年度.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
実証分析の手順 経済データ解析 2011年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第2章 単純回帰分析 ー 計量経済学 ー.
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
補章 時系列モデル入門 ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
相関分析.
データ解析 静岡大学工学部 安藤和敏
第6章 連立方程式モデル ー 計量経済学 ー.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
主成分分析 Principal Component Analysis PCA
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第4章 統計的検定 (その2) 統計学 2006年度.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
データ解析 静岡大学工学部 安藤和敏
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
構造方程式ゼミナール 2012年11月14日-11月21日 構造方程式モデルの作成.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
回帰分析入門 経済データ解析 2011年度.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

第4章 回帰分析の諸問題(1) ー 計量経済学 ー

第1節 多重共線性 第2節 系列相関 第3節 不均一分散 1 多重共線性 1 系列相関 2 系列相関の判定 -ダービン・ワトソン比- 第1節 多重共線性 1 多重共線性 第2節 系列相関 1 系列相関 2 系列相関の判定 -ダービン・ワトソン比- 5 系列相関への対処法(2) -コクラン・オーカット法- 4 系列相関への対処法(1) -一般化最小2乗法- 3 ダービンのh統計量 第3節 不均一分散 1 不均一分散 2 不均一分散の判定 3 不均一分散の解決法(1) 4 不均一分散の解決法(2) -加重最小2乗法-

前章までの回帰分析では、パラメータ推定値を求める際に、最小2乗法を用いてきた。しかし、この章で示す   (1) 多重共線性   (2) 系列相関   (3) 不均一分散  といった状況が起こっているときには、最小2乗法によるパラメータ推定値は信頼できない。  そこで、これらの状況が起こっている、[原因][症状][判定法][対処法]について示す。

たとえば風邪を引いた場合を例に考えてみよう [原因] 寒い中薄着で人混みに出かけた [症状] 発熱、せき、くしゃみ、鼻水 [判定法] のどを見ると赤くはれている。 体温を測ると、38度ある。 [対処法] ゆっくり休む。(根治療法) ウイルスを殺す薬を飲む(対処療法) 熱を下げる薬を飲む(対処療法)

第1節 多重共線性 1 多重共線性 多重共線性とは、重回帰分析において、説明変数間に強い相関が見られることである。 多重共線性あり Y W 第1節 多重共線性 多重共線性あり 1 多重共線性 多重共線性とは、重回帰分析において、説明変数間に強い相関が見られることである。 Y W 多重共線性なし × × × × 回帰平面 Y=a+bX+cW X

[原因] [症状] モデルの中に強い相関関係をもつ複数の説明変数を入れてしまった。 推定値の符号が理論に一致しない。 決定係数R2は大きいのに、個々のt値が小さい。 データの値を少し変えたり、少し追加・削除すると、係数推定値が大きく変化する。 説明変数を増減すると、推定値が大きく変化する。

<完全な多重共線性> Y=a+bX+cW+u   というモデルを考える。このモデルにおいて、W=αXという関係があったとする。   このとき、正規方程式は次のようになる。   3本目の方程式は2本目の方程式をα倍したものとなり、実質的には2本の連立方程式である。   未知数は    の3つであるのに対し、方程式は2つであるので、解を一意に決定することはできない。  

(数値例について) 数値例について次のようなことがいえる。 これらが多重共線性の[症状]である。 R2は大きいのに、t値は有意ではない。  数値例について次のようなことがいえる。 R2は大きいのに、t値は有意ではない。 データを少し変化させたときに、係数推定値は大きく変化する。 Wの係数の符号は負となるので、分析結果からはWが大きくなるとき、Yは小さくなるという結論が導き出されるが、データをみるとその逆である。(YとWには正の相関がある。R=0.7) これらが多重共線性の[症状]である。 多重共線性を幾何的に考えると、1枚の平面を1本の直線で支えることによっておきる不安定性である。(右図)

※ VIF(Variance Inflation Factor)値について VIF値は個々の説明変数について、次のように定義される。 [判定法] 相関係数行列 VIF値 ※ VIF(Variance Inflation Factor)値について  VIF値は個々の説明変数について、次のように定義される。   ここで、R2i はi番目の説明変数を他の説明変数に対して回帰した場合の決定係数であり、説明変数が2つのみの場合には、単相関係数の2乗となる。   このVIFが10を超えるような場合には、多重共線性の疑いがあるという判断をする。

多重共線性が起こっている場合、相関の高い複数(ここでは2つとする)の変数のうち、1つをとり除くことが根本的な解決法である。 [対処法] 相関の高い説明変数のいずれかを除去する。(根治療法) データの期間を延長する、あるいは年次データでだめなら四半期データや月次データなどを用いて、データの数を増やす。 説明変数や被説明変数を階差あるいは比率の形にする。 相関の高い説明変数を合成し、新しい説明変数を作る。 主成分回帰やリッジ回帰などの方法を用いる。(非常手段)  多重共線性が起こっている場合、相関の高い複数(ここでは2つとする)の変数のうち、1つをとり除くことが根本的な解決法である。  しかし、経済理論から考えて、1つをとり除くことが不可能なこともあり、その場合には下のいくつかの対処法をとることになる。

第2節 系列相関 1 系列相関 撹乱項utには次のような仮定をおいてきた。 ① utは正規分布にしたがう。 ② utの平均は0である。 第2節 系列相関 1 系列相関 撹乱項utには次のような仮定をおいてきた。   ① utは正規分布にしたがう。   ② utの平均は0である。   ③ utの分散は一定値σ2である。   ④ 撹乱項utは相互に独立である。  このうちの④の仮定が満たされないことが系列相関である。  すなわち、時系列データにおいて、異なる2時点の撹乱項utとusの間に相関があるということである。

[原因] [症状] [判定法] 重要な説明変数の欠落 経済行動における習慣性やショックの影響の継続 データの加工時 回帰係数の推定値はBLUEではなく、標準誤差を過小推定してしまう。   ⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないものを誤って有意とみなす。  ⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう危険がある。 [判定法] 残差プロット ダービン・ワトソン比(利用できない場合もある)

2 系列相関の判定 -ダービン・ワトソン比- Yt=a+bXt+ut  というモデルを考える。このモデルの誤差項に ut= ρut-1 +εt  という系列相関が存在していたとする。(これを1階の自己相関という)  このとき     H0: ρ= 0 (系列相関なし)            H1: ρ≠ 0 (系列相関あり)  という検定が考えられる。このH0: ρ= 0を検定する代わりに用いられるのがダービン・ワトソン(DW)比である。 

ダービン・ワトソン比は残差e1,e2,…,enを用いて次のように表すことができる。  この統計量は ut= ρut-1 +εt  のutをetでおきかえて最小2乗法を適用した推定値を  とすると、nが十分に大きいとき、 DW≒2(1-  )  という関係が成り立つ。    のとき、DW=2であることから、DWの値が2に近ければ系列相関が存在しないという判断をする。 正の 系列相関 判定不能 系列相関なし 判定不能 負の 系列相関 dL dU 2 4-dU 4-dL 4

<正の系列相関の例> ρ>0 ⇔ DW<2 正の系列相関がある場合は、残差が同じ符号のまま、ある程度の期間続く。

<負の系列相関の例> ρ<0 ⇔ DW>2 負の系列相関がある場合は、残差の符号が+,-, +,-, ・・・とある程度交互に続く。

<系列相関のない例> ρ≒0 ⇔ DW≒2 系列相関がない場合は、正の系列相関と負の系列相関のちょうど中間になる。

[対処法] 重要な説明変数を追加する(根治療法) 関数形が正しいか確認する ショックの影響がないか確認する(影響がある場合にはダミー変数を用いる)   以上のようなモデルの妥当性を検証した後で、モデルが妥当であるにもかかわらず、系列相関が存在する場合には、通常の最小2乗法の代わりに次のような推定法を用いて、係数の推定を行う。 コクラン・オーカット法 一般化最小2乗法 最尤法

5 系列相関への対処法(2) -コクラン・オーカット法- Yt=a+bXt+ut ut= ρut-1 +εt,  という誤差項に1階の自己相関を持つモデルを考える。     (主要参考書のαは、ここでのρに対応します)  ここで、Yt - ρYt-1を考えると            とおき、Yt*をXt*に対して回帰すれば、   誤差項から系列相関の影響が取り除かれる。

<手順1>   YtをXtに回帰し、推定値   を求める。 <手順2>           を計算し、       を求める。   etをutの代わりに用い、        とし、  を求める。   <手順3、4>              とし、Yt*をXt*に対して回帰すれば、   誤差項から系列相関の影響が取り除かれる。  ※ 問題点    最初の期のデータは取り除かれてしまう。

4 系列相関への対処法(1) -一般化最小2乗法- 4 系列相関への対処法(1) -一般化最小2乗法-   (ここではプレイス・ウインステン変換による一般化最小2乗法を取り上げる)  <コクラン・オーカット法との相違> 1期目のデータを作成する 定数項を変数とみなし、定数項なしの回帰分析を適用する。            とおき、Yt*をXt*とZt*に対して回帰すれば、   誤差項から系列相関の影響が取り除かれる。

コクラン・オーカット法 一般化最小2乗法

3 ダービンのh統計量   系列相関があるかないかの判定基準として、ダービン・ワトソン比が用いられるが、DW比では正確な判定ができないケースがある。   それは、   というように、説明変数として被説明変数の過去の値(ラグつき内生変数という)を含む場合である。   この場合、DW比は2に偏りを持つ(本当は系列相関のあるモデルを、誤って「系列相関なし」と判断してしまう)ので、代わりにダービンのh統計量を用いる。

hは標準正規分布にしたがうので、有意水準5%で次のようになる。                        n: 標本数                         :パラメータ  の分散の推定値   hは標準正規分布にしたがうので、有意水準5%で次のようになる。 負の 系列相関 系列相関なし 正の 系列相関 -1.96 1.96

第3節 不均一分散 1 不均一分散 撹乱項utには次のような仮定をおいてきた。 ① utは正規分布にしたがう。 ② utの平均は0である。 第3節 不均一分散 1 不均一分散 撹乱項utには次のような仮定をおいてきた。   ① utは正規分布にしたがう。   ② utの平均は0である。   ③ utの分散は一定値σ2である。   ④ 撹乱項utは相互に独立である。  このうちの③の仮定が満たされないことが不均一分散である。

[原因] [症状] [判定法] 変数のレベルが上昇することに伴って、分散が増大することが多い。    (例) 平均が10倍になれば、それにともなって分散も増える。 [症状] 回帰係数の標準誤差を過小推定してしまう。   ⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないものを誤って有意とみなす。  ⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう危険がある。 [判定法] 残差プロット 各種検定 ゴールドフェルド・クォントの検定 ブローシュ・ペーガンの検定 ホワイトの検定 ラグランジュ乗数(LM)検定

不均一分散の判定は、残差プロットを見ることや、さまざまな検定をおこなうことによる。 2 不均一分散の判定  不均一分散の判定は、残差プロットを見ることや、さまざまな検定をおこなうことによる。  不均一分散の検定の1つにゴールドフェルド・クォントの検定がある。この検定はデータの期間をいくつかに分割し、それぞれの期間ごとの誤差項の分散が均一かどうかを検定するものである。  ※ 不均一分散の検定は一般に   を考える。すなわち、「誤差項の分散が均一である」ということが帰無仮説であり、「均一分散の検定」といったほうが適切である。

<検定の手順> [対処法] データをXの大きさの順に並べる(重回帰の場合には の大きさの順が適当であろう)。 全体をn個としたとき、(n-m)/2, m, (n-m)/2 個の3つに分割する。ここでmは全体の2割弱程度が適当である。 X1, X2 , ・・・,   ・・・  , ・・・, X n-1, Xn Y1, Y2 , ・・・,   ・・・  , ・・・, Y n-1, Yn └Ⅰ┘   └Ⅱ┘   └Ⅲ┘ ⅠのグループとⅢのグループで個別に回帰分析をおこない、それぞれの残差分散s2をもとめる。Ⅰのグループの残差分散s12とⅢのグループの残差分散s32の比を考えると、その値は自由度((n - m)/2 - k, (n - m)/2 - k)のF分布にしたがう。 よってこの統計量について仮説検定をおこなえばよい。 [対処法] 説明変数と被説明変数について、対数変換など変換をおこなう。 加重最小2乗法または最尤法を用いる。

3 不均一分散の解決法(1) 撹乱項の分散について というように、説明変数の2乗に比例していると仮定する。 3 不均一分散の解決法(1)  撹乱項の分散について というように、説明変数の2乗に比例していると仮定する。 説明変数と被説明変数をそれぞれXiで割ると、このように変形できる。  ここで、             であるので、このモデルの撹乱項の分散はすべてσ2となる。  よって、  を  に回帰すればよい。

4 不均一分散の解決法(2) -加重最小2乗法- を最小とするものである。 このモデルは、変数をすべて で割ったものである。 4 不均一分散の解決法(2) -加重最小2乗法-   撹乱項の分散がすべて既知であったとする。   このとき、加重2乗和  を最小とするものである。  このモデルは、変数をすべて で割ったものである。  このように、  を   に回帰すればよい。