回帰分析 重回帰 (2) 仮説検定. 単一の制約 –t 検定 – メニューから行う方法 複数の制約 –F 検定 – メニューから行う方法 –F 統計量を実際に求める 構造変化 最適なモデルの決定.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
Qualitative Response Model. 被説明変数がダミー変数の回帰 例) MROZ.RAW 女性労働 –inlf 女性が外で働いていれば 1 ,そうでなけれ ば 0 –inlf=f( 家計所得,教育年数,年齢,子育て費 用) 推定方法 – 線型確率モデル (linear probability.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
SPSS 入門 麻生良文.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
Rによる回帰分析 高崎経済大学 宮田 庸一.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2009年度.
回帰分析 重回帰(1).
実証分析の手順 経済データ解析 2011年度.
Pattern Recognition and Machine Learning 1.5 決定理論
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
E-Views 入門.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
統計学 12/13(木).
計量経済学入門 麻生良文.
第5章 回帰分析入門 統計学 2006年度.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
補章 時系列モデル入門 ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
相関分析.
市場規模の予測.
第6章 連立方程式モデル ー 計量経済学 ー.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
(回帰分析)推計結果の見方(1) 決定係数 回帰式のあてはまりの良さをはかる 回帰式による予測の信頼度を見るひとつの尺度
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場規模の予測.
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析(Regression Analysis)
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

回帰分析 重回帰 (2) 仮説検定

単一の制約 –t 検定 – メニューから行う方法 複数の制約 –F 検定 – メニューから行う方法 –F 統計量を実際に求める 構造変化 最適なモデルの決定

回帰分析の前提

最小二乗推定量

最小二乗推定量 (2)

個々の係数に関する検定

H0: ある変数の係数が 0 係数の標準誤差 t 値 = b / b(s.e.) 係数の真の値が 0 だとして計算 p 値 ( 両側確率) 通常は, 0.05 より小 さければ 0 と有意に 異なると判断 EDUC の t 値は t分布に従う確率変 数が(絶対値で) より大きな値 をとる確率

仮説検定 単一の制約 t 分布 特に,「係数が 0 に等しい」という仮説は,回帰 分析の output をみるだけでよい p 値  output の Prob. 欄 wage1.raw の回帰分析の結果では, educ の p 値 は 。  educ の係数の真の値が 0 だとする と,(絶対値で) 以上の推定値を得る確 率が だということ(両側確率) 一般的には, p 値が 0.05 未満なら,係数 =0 の仮説 は棄却される 注意: Eviews の p 値は両側確率

educ の係数の信頼区間を求め る educ の係数は自由度 522 の t 分布をする df = オブザベーション数 (526) – 説明変数の個数 (4) = 522 片側 5% の臨界値  t 分布の 95% 点 両側 5% の臨界値  t 分布の 97.5% 点 – 例えば,両側 5% の場合,臨界値を t とすれば, b j の信頼区間は次の通りになる

educ の係数の信頼区間を求める (2) Eviews df) 累積分布が p になるt値を返す(自由度 i 番目の係数(定数項は 1 i 番目の係数の標準誤差 を用い,コマンド行で次のようにタイプする(  j 0 =b j とした 場合)。 scalar tc 522) scalar –tc scalar + tc i : 実際の数字( 2 番目の変数の係数なら 2 を入れる ) 計算すると, b_low = , b_up= 任意の  j 0 に想定した値を代入 回帰分析の結果のメニューから View  Coefficient Diagnostics  Confidence Intervals をたどっても信頼区間を求められる。 Excel を用いることもできる

問題 Wage1.raw のデータを用いた先ほどの OLS で, 次の仮説をそれぞれ検定せよ。 EDUC の係数が 0.06 に等しい EXPER の係数が に等しい TENURE の係数が 0.02 に等しい – それぞれの場合の を用いる この場合の t 分布の自由度は ? –OLS を行った後, menu から View/Coefficient Diagnostics / Wald Test Coefficient Restrictions とたどる

複数の制約 RRSS (Restricted Residual Sum of Squares: 制約付きの残差平方和) URSS (Unrestricted Residual Sum of Squares: 制約無しの残差平方和) r : 制約の数 n-(k+1): 制約無しの回帰での自由度

複数の  j に関する制約(単一の制約) 単一の制約の問題に帰着できる場合がある 例) Kane and Rouse(1995) – 短大と 4 年生大学 : 賃金差はあるか – 回帰式 ln(wage)=  +  1 * jc +  2 * univ+  3 * exper + u jc 短大の教育年数 univ 4 年生大学の教育年数 exper 卒業後の年数(労働市場にでてからの年数) H 0 :  1 =  2

複数の  j に関する制約(単一の制約) 続き 1.ln(wage) =  +  1 *jc +  2 *univ +  3 *exper + u H 0 :  1 =  2 1. で  2 =  1 +  とおくと ln(wage) =  +  1 *jc + (  1 +  )*univ +  3 *exper + u これより 2.ln(wage) =  +  1 *(jc + univ) +  *univ +  3 *exper + u H 0 :  =0 jc+univ, univ で回帰し, univ の係数が 0 という制約に帰着

説明変数の全て (educ, exper, tenure) の係数が 0 かどうか ここをクリックし, coefficient diagnostics  Wald tests - coefficient restrictions.. をたどると,係数の制約 のテストの画面が表れる。 複数の制約も可能。 個々の係数 =0 の検 定はここをみる この値から F 検定を行うこともできる。 E- views に 保存される Eviews 係数の制約

Eviews での F 検定 View/ Coefficient diagnostics/ Wald test – Coefficient Restrictions を選択 c(3)=0, c(4)=0 で制約式を指定(複数の制約 式は, で区切る) c(3) は 3 番目の説明変数の係数(定数項を 1 番 目とカウント) H0: exper,tenure の係数がとも に 0 検定のための統計量は,自由 度が (2,522) の F 統計量 5% 水準の臨界値は H0 は棄却される 自由度 (2,252) の F 分布に従う 確率変数が より も大きな値 をとる確率 は

F 検定 (コマンドを打ち込む方法) 制約無しの回帰分析  URSS を求める 制約なしの回帰後,コマンドウィンドウで scalar 制約付の回帰分析  RRSS を求める 制約つきの回帰後,コマンドウィンドウで scalar F 統計量を計算 分子は (rrss-urss)/( 制約の数 ) ,分母は urrs/( 制約なしの回帰の自由 度 ) で計算した変数を作る(以下では,ffとした) コマンドウィンドウで次のようにタイプ scalar f1= (rrss – urss)/ 制約の数 scalar f2 – 定数項を含んだ説明変数の個数 ) scalar ff =f1/f2 ff を用いる Excel でも同様の計算ができる

問題 1 wage1.raw 被説明変数 ln(wage) 説明変数 educ, exper, tenure, f emale 次の仮説を検定せよ 1.H0 : 全ての説明変数の係数が 0 に等しい 2.H0 : 女性と男性の賃金格差は無い(定数項ダ ミーだけでよい) 3.H0 : exper と tenure の係数が共に 0 である 2. と 3. については,制約なしの残差平方和と制約 付の残差平方和の値を求める方法でも計算せよ。

問題 2 問題 1 と同じデータで次の仮説を検討せよ。 – 説明変数に female ダミーと学歴 (educ) ,勤続年数 (tenure) の交差項を加える。 女性と男性の賃金格差(定数項)は無いし,学 歴の効果の違いも無いし,勤続年数の効果の違 いも無い。

問題 3 MLB1.RAW 次の回帰式を推定 – 被説明変数: log(salary) – 説明変数: years, gamesyr, bavg, hrunsyr, rbisyr, runsyr, fldperc, allstar, firstbase, scndbase, thrdbase, shrtstop, catcher,(base は outfield) – 次の仮説を検討せよ。 他の要因を一定にした場合,捕手と外野手の年俸は同じ 他の要因を一定にした場合,守備位置の違いは年俸に影響を 与えない

Chow テスト 構造変化の検定 – 例)消費関数,投資関 数の推計 –T 個の時系列データ – 時点 s 以降で構造変が 起きたかどうかの検定 全体を二つの期間に 分割 – 時点ダミーを導入して  =0 の検定を行う k は説明変数の個数(定数項 も含めて)

最適なモデルの決定 F 検定 –nested model の場合 adjusted R2 を用いる方法 AIC 基準 (Akaike Information Criteria) AIC=-2ln(L)+2k ln(L): 対数尤度, k: パラメータの数(説明変数の数) AIC を最小にするようなモデルを選ぶ たいていの統計パッケージでは自動的に出力される 変数増減法 (stepwise regression) RESET ( regression specification error test) – 回帰式 非線形性のテスト J テスト –non nested model

RESET 上のモデルを推計し, y の予測値を得る。 y の予測値の平方,3乗の項,... を説明変数に加えた次 のモデルを推計する H0: (1) の定式化が正しい   1 =  2 =0 Eviews での RESET (1) 式を OLS で推計 View/ Stability Diagnostics/ Ramsey RESET Test Number of Fitted Terms で (2) 式に Fitted value をいくつ入れるかを 設定 1  2 次の項まで, 2  3 次の項まで

Non nested model MLB1.raw の MLB 選手の年棒の回帰分析では, hrunsyr( ホームラン数)と rbisyr (打点)はともに,有 意ではなかった(二つの変数の単相関は 0.89 と非常に高 いため)。 そこで,次の二つのモデルのどちらが適切かを選択する 必要に迫られたとする。

J test どちらか一方のモデルが正しいモデルであれば,他方の モデルで得られた予測値は説明力を持たない (例) H 2 で推定したモデルの予測値 (y2hat) を説明変数と して H 1 に代入して,  5 =0 の検定を行う 同様に, H 1 で推定したモデルの予測値 (y1hat) を説明変数 として H 2 に代入して,  5 =0 の検定を行う 両方のテストとも棄却される場合がある  別のモデル

Eviews distribution inverse number generator @qtdist(p,df) t 分布 Eviews で,自由度 (2,522) の F 分布に従う変数の 95% 点を 求めるためには scalar 2, 522) をコマンド行に打ち込む

Eviews : i t i 番目のj番目の係数の共分 : F standard error of the 回帰分析でのオブザベーション 数