第4章回帰分析の諸問題（１）ｰ計量経済学ｰ.

Slides:

Advertisements

Similar presentations

１標本のｔ検定 3 年地理生態学研究室脇海道卓. ｔ検定とは・帰無仮説が正しいと仮定した場合に、統計量が t 分布に従うことを利用する統計学的検定法の総称である。

Advertisements

2016 年度計量経済学講義内容担当者：河田正樹

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

第4章統計的検定統計学　2007年度.

看護学部中澤港統計学第５回看護学部　中澤　港

データ分析入門（12）第12章　単回帰分析廣野元久.

寺尾敦青山学院大学社会情報学部社会統計　第13回重回帰分析（第11章後半）寺尾　敦青山学院大学社会情報学部

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

第4章回帰分析の諸問題（１）ｰ計量経済学ｰ.

時系列の予測時系列：観測値を時刻の順に並べたものの集合

多変量解析　－重回帰分析－発表者：時田　陽一発表日：11月20日.

補章時系列モデル入門ｰ計量経済学ｰ.

パネル分析について中村さやか.

第3章　2変量データの記述統計学基礎　2010年度.

重回帰分析入門経済データ解析　2009年度.

確率･統計Ⅰ 第11回 i.i.d.の和と大数の法則ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

実証分析の手順経済データ解析　2011年度.

得点と打率・長打率・出塁率らの関係政治経済学部経済学科 ●年●組 ●●　●●.

月曜3限 1132教室担当者：河田正樹年度経済データ解析講義内容月曜3限　1132教室担当者：　河田　正樹

第2章単純回帰分析ｰ計量経済学ｰ.

４．統計的検定保健統計　2009年度.

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

第5章回帰分析の諸問題（２）ｰ計量経済学ｰ.

第5章回帰分析の諸問題（２）ｰ計量経済学ｰ.

Bassモデルにおける最尤法を用いたパラメータ推定

重回帰分析入門経済データ解析　2011年度.

統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える

心理統計学 II 第７回 (11/13) 授業の学習目標相関係数のまとめと具体的な計算例の復習相関係数の実習.

放射線の計算や測定における統計誤差「平均の誤差」とその応用（1H) 2項分布、ポアソン分布、ガウス分布（1H）最小二乗法（1H）

寺尾敦青山学院大学社会情報学部社会統計　第12回重回帰分析（第11章前半）寺尾　敦青山学院大学社会情報学部

第６章　数量化Ｉ類.

第3章重回帰分析ｰ計量経済学ｰ.

第3章重回帰分析ｰ計量経済学ｰ.

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

第5章回帰分析入門統計学　2006年度.

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

土木計画学第６回（１１月９日）調査データの統計処理と分析４担当：榊原　弘之.

離婚が出生数に与える影響－都道府県データを用いた計量分析

補章時系列モデル入門ｰ計量経済学ｰ.

第5章回帰分析の諸問題（２）ｰ計量経済学ｰ.

データ解析静岡大学工学部安藤和敏

第６章連立方程式モデルｰ計量経済学ｰ.

　統計学講義　第11回　　　　相関係数、回帰直線　　　決定係数.

4章までのまとめｰ計量経済学ｰ.

独立成分分析１．問題は何か：例：解法：全体の見通し 2007/10/１７名雪　勲.

第８回授業（5/29日）の学習目標検定と推定は、１つの関係式の見方の違いであることを学ぶ。第３章のWEB宿題の説明

第3章統計的推定（その1）統計学　2006年度.

主成分分析 Principal Component Analysis PCA

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

多変量解析～主成分分析～１．主成分解析とは２．適用例と解析の目的３．解析の流れ４．変数が２個の場合の主成分分析

部分的最小二乗回帰 Partial Least Squares Regression PLS

第3章補足2 多変量データの記述統計学基礎　2010年度.

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

第4章統計的検定（その2）統計学　2006年度.

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

データ解析静岡大学工学部安藤和敏

第5回確率変数の共分散確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

回帰分析（Regression Analysis)

データ解析静岡大学工学部安藤和敏

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

最小二乗法による線形重回帰分析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

重回帰分析入門経済データ解析　2008年度.

構造方程式ゼミナール 2012年11月14日-11月21日構造方程式モデルの作成.

重回帰分析入門 (第5章補足) 統計学　2007年度.

モデルの微分による非線形モデルの解釈明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

回帰分析入門経済データ解析　2011年度.

第3章統計的推定（その2）統計学　2006年度＜修正・補足版＞.

Presentation transcript:

第4章回帰分析の諸問題（１）ｰ計量経済学ｰ

第1節多重共線性第2節系列相関第3節不均一分散１多重共線性１系列相関２系列相関の判定－ダービン・ワトソン比－第1節　多重共線性１　多重共線性第2節　系列相関１　系列相関２　系列相関の判定　－ダービン・ワトソン比－５　系列相関への対処法（２）　－コクラン・オーカット法－４　系列相関への対処法（１）　－一般化最小2乗法－３　ダービンのh統計量第3節　不均一分散１　不均一分散２　不均一分散の判定３　不均一分散の解決法（１）４　不均一分散の解決法（２）　－加重最小2乗法－

前章までの回帰分析では、パラメータ推定値を求める際に、最小2乗法を用いてきた。しかし、この章で示す　　（１）　多重共線性　　（２）　系列相関　　（３）　不均一分散　といった状況が起こっているときには、最小2乗法によるパラメータ推定値は信頼できない。　そこで、これらの状況が起こっている、［原因］［症状］［判定法］［対処法］について示す。

たとえば風邪を引いた場合を例に考えてみよう［原因］寒い中薄着で人混みに出かけた［症状］発熱、せき、くしゃみ、鼻水［判定法］のどを見ると赤くはれている。体温を測ると、38度ある。［対処法］ゆっくり休む。（根治療法）ウイルスを殺す薬を飲む（対処療法）熱を下げる薬を飲む（対処療法）

第1節多重共線性１多重共線性多重共線性とは、重回帰分析において、説明変数間に強い相関が見られることである。多重共線性あり Y W 第1節　多重共線性多重共線性あり１　多重共線性多重共線性とは、重回帰分析において、説明変数間に強い相関が見られることである。 Y W 多重共線性なし × × × × 回帰平面　Y=a+bX+cW X

［原因］［症状］モデルの中に強い相関関係をもつ複数の説明変数を入れてしまった。推定値の符号が理論に一致しない。決定係数R2は大きいのに、個々のt値が小さい。データの値を少し変えたり、少し追加・削除すると、係数推定値が大きく変化する。説明変数を増減すると、推定値が大きく変化する。

＜完全な多重共線性＞ Y=a+bX+cW+u 　　というモデルを考える。このモデルにおいて、W=αXという関係があったとする。　　このとき、正規方程式は次のようになる。　　3本目の方程式は2本目の方程式をα倍したものとなり、実質的には2本の連立方程式である。　　未知数は　　　　の3つであるのに対し、方程式は2つであるので、解を一意に決定することはできない。　　

（数値例について）数値例について次のようなことがいえる。これらが多重共線性の[症状]である。 R2は大きいのに、t値は有意ではない。　数値例について次のようなことがいえる。 R2は大きいのに、t値は有意ではない。データを少し変化させたときに、係数推定値は大きく変化する。 Wの係数の符号は負となるので、分析結果からはWが大きくなるとき、Yは小さくなるという結論が導き出されるが、データをみるとその逆である。(YとWには正の相関がある。R=0.7) これらが多重共線性の[症状]である。多重共線性を幾何的に考えると、1枚の平面を1本の直線で支えることによっておきる不安定性である。（右図）

※ VIF(Variance Inflation Factor)値について VIF値は個々の説明変数について、次のように定義される。［判定法］相関係数行列 VIF値 ※ VIF(Variance Inflation Factor)値について　VIF値は個々の説明変数について、次のように定義される。　　ここで、R2i はi番目の説明変数を他の説明変数に対して回帰した場合の決定係数であり、説明変数が2つのみの場合には、単相関係数の2乗となる。　　このVIFが10を超えるような場合には、多重共線性の疑いがあるという判断をする。

多重共線性が起こっている場合、相関の高い複数（ここでは２つとする）の変数のうち、1つをとり除くことが根本的な解決法である。［対処法］相関の高い説明変数のいずれかを除去する。（根治療法）データの期間を延長する、あるいは年次データでだめなら四半期データや月次データなどを用いて、データの数を増やす。説明変数や被説明変数を階差あるいは比率の形にする。相関の高い説明変数を合成し、新しい説明変数を作る。主成分回帰やリッジ回帰などの方法を用いる。（非常手段）　多重共線性が起こっている場合、相関の高い複数（ここでは２つとする）の変数のうち、1つをとり除くことが根本的な解決法である。　しかし、経済理論から考えて、1つをとり除くことが不可能なこともあり、その場合には下のいくつかの対処法をとることになる。

第2節系列相関１系列相関撹乱項utには次のような仮定をおいてきた。 ① utは正規分布にしたがう。 ② utの平均は0である。第2節　系列相関１　系列相関撹乱項utには次のような仮定をおいてきた。　　①　utは正規分布にしたがう。　　②　utの平均は0である。　　③　utの分散は一定値σ2である。　　④　撹乱項utは相互に独立である。　このうちの④の仮定が満たされないことが系列相関である。　すなわち、時系列データにおいて、異なる2時点の撹乱項utとusの間に相関があるということである。

［原因］［症状］［判定法］重要な説明変数の欠落経済行動における習慣性やショックの影響の継続データの加工時回帰係数の推定値はBLUEではなく、標準誤差を過小推定してしまう。　　⇒　t値、F値、R2などを大きめに計算してしまい、本当は有意でないものを誤って有意とみなす。　⇒　本当は妥当でないモデルを、誤って妥当であると結論づけてしまう危険がある。［判定法］残差プロットダービン・ワトソン比（利用できない場合もある）

２　系列相関の判定　－ダービン・ワトソン比－ Yt=a+bXt+ut 　というモデルを考える。このモデルの誤差項に ut= ρut-1 +εt 　という系列相関が存在していたとする。（これを1階の自己相関という）　このとき　　　　　H0: ρ= 0　（系列相関なし）　　　　　　　　　　　H1: ρ≠ 0　（系列相関あり）　という検定が考えられる。このH0: ρ= 0を検定する代わりに用いられるのがダービン・ワトソン（DW）比である。　

ダービン・ワトソン比は残差e1,e2,…,enを用いて次のように表すことができる。　この統計量は ut= ρut-1 +εt 　のutをetでおきかえて最小2乗法を適用した推定値を　　とすると、nが十分に大きいとき、 DW≒2(1- 　) 　という関係が成り立つ。　　　　のとき、DW=2であることから、DWの値が2に近ければ系列相関が存在しないという判断をする。正の系列相関判定不能系列相関なし判定不能負の系列相関 dL dU 2 4-dU 4-dL 4

＜正の系列相関の例＞ ρ>0 ⇔ ＤＷ<2 正の系列相関がある場合は、残差が同じ符号のまま、ある程度の期間続く。

＜負の系列相関の例＞ ρ<0 ⇔ ＤＷ>2 負の系列相関がある場合は、残差の符号が＋,－, ＋,－, ・・・とある程度交互に続く。

＜系列相関のない例＞ ρ≒0 ⇔ ＤＷ≒2 系列相関がない場合は、正の系列相関と負の系列相関のちょうど中間になる。

［対処法］重要な説明変数を追加する（根治療法）関数形が正しいか確認するショックの影響がないか確認する(影響がある場合にはダミー変数を用いる) 　　以上のようなモデルの妥当性を検証した後で、モデルが妥当であるにもかかわらず、系列相関が存在する場合には、通常の最小2乗法の代わりに次のような推定法を用いて、係数の推定を行う。コクラン・オーカット法一般化最小2乗法最尤法

５　系列相関への対処法（２）　－コクラン・オーカット法－ Yt=a+bXt+ut ut= ρut-1 +εt, 　という誤差項に1階の自己相関を持つモデルを考える。　　　　（主要参考書のαは、ここでのρに対応します）　ここで、Yt - ρYt-1を考えると　　　　　　　　　　　とおき、Yt*をXt*に対して回帰すれば、　　誤差項から系列相関の影響が取り除かれる。

＜手順１＞　　YtをXtに回帰し、推定値　　　を求める。＜手順２＞　　　　　　　　　　を計算し、　　　　　　　を求める。　　etをutの代わりに用い、　　　　　　　　とし、　　を求める。　　＜手順３、４＞　　　　　　　　　　　　　とし、Yt*をXt*に対して回帰すれば、　　誤差項から系列相関の影響が取り除かれる。　※　問題点　　　最初の期のデータは取り除かれてしまう。

４系列相関への対処法（１）－一般化最小2乗法－４　系列相関への対処法（１）　－一般化最小2乗法－　　（ここではプレイス・ウインステン変換による一般化最小2乗法を取り上げる）　＜コクラン・オーカット法との相違＞ 1期目のデータを作成する定数項を変数とみなし、定数項なしの回帰分析を適用する。　　　　　　　　　　　とおき、Yt*をXt*とZt*に対して回帰すれば、　　誤差項から系列相関の影響が取り除かれる。

コクラン・オーカット法一般化最小2乗法

３　ダービンのh統計量　　系列相関があるかないかの判定基準として、ダービン・ワトソン比が用いられるが、DW比では正確な判定ができないケースがある。　　それは、　　というように、説明変数として被説明変数の過去の値（ラグつき内生変数という）を含む場合である。　　この場合、DW比は2に偏りを持つ（本当は系列相関のあるモデルを、誤って「系列相関なし」と判断してしまう）ので、代わりにダービンのh統計量を用いる。

hは標準正規分布にしたがうので、有意水準5%で次のようになる。　　　　　　　　　　　　　　　　　　　　　　　n: 標本数　　　　　　　　　　　　　　　　　　　　　　　　：パラメータ　　の分散の推定値　　hは標準正規分布にしたがうので、有意水準5%で次のようになる。負の系列相関系列相関なし正の系列相関 -1.96 1.96

第3節不均一分散１不均一分散撹乱項utには次のような仮定をおいてきた。 ① utは正規分布にしたがう。 ② utの平均は0である。第3節　不均一分散１　不均一分散撹乱項utには次のような仮定をおいてきた。　　①　utは正規分布にしたがう。　　②　utの平均は0である。　　③　utの分散は一定値σ2である。　　④　撹乱項utは相互に独立である。　このうちの③の仮定が満たされないことが不均一分散である。

［原因］［症状］［判定法］変数のレベルが上昇することに伴って、分散が増大することが多い。　　　（例）　平均が10倍になれば、それにともなって分散も増える。［症状］回帰係数の標準誤差を過小推定してしまう。　　⇒　t値、F値、R2などを大きめに計算してしまい、本当は有意でないものを誤って有意とみなす。　⇒　本当は妥当でないモデルを、誤って妥当であると結論づけてしまう危険がある。［判定法］残差プロット各種検定ゴールドフェルド・クォントの検定ブローシュ・ペーガンの検定ホワイトの検定ラグランジュ乗数（LM）検定

不均一分散の判定は、残差プロットを見ることや、さまざまな検定をおこなうことによる。２　不均一分散の判定　不均一分散の判定は、残差プロットを見ることや、さまざまな検定をおこなうことによる。　不均一分散の検定の1つにゴールドフェルド・クォントの検定がある。この検定はデータの期間をいくつかに分割し、それぞれの期間ごとの誤差項の分散が均一かどうかを検定するものである。　※　不均一分散の検定は一般に　　を考える。すなわち、「誤差項の分散が均一である」ということが帰無仮説であり、「均一分散の検定」といったほうが適切である。

＜検定の手順＞［対処法］データをXの大きさの順に並べる(重回帰の場合にはの大きさの順が適当であろう)。全体をn個としたとき、(n-m)/2, m, (n-m)/2 個の3つに分割する。ここでmは全体の2割弱程度が適当である。 X1, X2 , ・・・,　　・・・　, ・・・, X n-1, Xn Y1, Y2 , ・・・, 　　・・・　 , ・・・, Y n-1, Yn └Ⅰ┘ 　 └Ⅱ┘ 　　└Ⅲ┘ ⅠのグループとⅢのグループで個別に回帰分析をおこない、それぞれの残差分散s2をもとめる。Ⅰのグループの残差分散s12とⅢのグループの残差分散s32の比を考えると、その値は自由度((n - m)/2 - k, (n - m)/2 - k)のF分布にしたがう。よってこの統計量について仮説検定をおこなえばよい。［対処法］説明変数と被説明変数について、対数変換など変換をおこなう。加重最小2乗法または最尤法を用いる。

３不均一分散の解決法（１）撹乱項の分散についてというように、説明変数の2乗に比例していると仮定する。３　不均一分散の解決法（１）　撹乱項の分散についてというように、説明変数の2乗に比例していると仮定する。説明変数と被説明変数をそれぞれXiで割ると、このように変形できる。　ここで、　　　　　　　　　　　　　であるので、このモデルの撹乱項の分散はすべてσ2となる。　よって、　　を　　に回帰すればよい。

４不均一分散の解決法（２）－加重最小2乗法－を最小とするものである。このモデルは、変数をすべてで割ったものである。４　不均一分散の解決法（２）　－加重最小2乗法－　　撹乱項の分散がすべて既知であったとする。　　このとき、加重2乗和　を最小とするものである。　このモデルは、変数をすべてで割ったものである。　このように、　　を　　　に回帰すればよい。