回帰分析 重回帰(1).

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
回帰分析 重回帰 (2) 仮説検定. 単一の制約 –t 検定 – メニューから行う方法 複数の制約 –F 検定 – メニューから行う方法 –F 統計量を実際に求める 構造変化 最適なモデルの決定.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
Qualitative Response Model. 被説明変数がダミー変数の回帰 例) MROZ.RAW 女性労働 –inlf 女性が外で働いていれば 1 ,そうでなけれ ば 0 –inlf=f( 家計所得,教育年数,年齢,子育て費 用) 推定方法 – 線型確率モデル (linear probability.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
SPSS 入門 麻生良文.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
パネル分析について 中村さやか.
重回帰分析入門 経済データ解析 2009年度.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
実証分析の手順 経済データ解析 2011年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第2章 単純回帰分析 ー 計量経済学 ー.
E-Views 入門.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
回帰分析.
群別・男女別の平均.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
計量経済学入門 麻生良文.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
誤差の二乗和の一次導関数 偏微分.
Stataによる トリートメント効果の推定
補章 時系列モデル入門 ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
相関分析.
データ解析 静岡大学工学部 安藤和敏
VII. 空間モデル.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
企業の時系列分析 同志社大学 中尾ゼミ 印刷用.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
最小自乗法.
(回帰分析)推計結果の見方(1) 決定係数 回帰式のあてはまりの良さをはかる 回帰式による予測の信頼度を見るひとつの尺度
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第3章 線形回帰モデル 修士1年 山田 孝太郎.
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
データ解析 静岡大学工学部 安藤和敏
クロス表とχ2検定.
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

回帰分析 重回帰(1)

項目 重回帰モデルの前提 最小二乗推定量の性質 Eviewsでの回帰分析の実際 非線形効果 ダミー変数 仮説検定(単一の制約) 決定係数 定数項ダミー 傾きのダミー 3つ以上のカテゴリー

重回帰モデル multiple regression model 説明変数が2個以上 他の説明変数を一定に保っておいて,xi だけを1単位増加させたときに y が何単位増えるか 他の要因をコントロールした xi 固有の影響

重回帰モデル 前提 線型モデル(パラメータに関し) 誤差項の期待値は0 誤差項は互いに独立 誤差項の分散は一定(分散均一性) 誤差項は正規分布に従う BLUEの成立のためにはこの条件は不要

最小二乗法 残差平方和を最小にするようにパラメータを決定 a,b1,b2,..,bk : 未知パラメータ a,b1,b2,..bk の推定値 ei : 残差

最小二乗推定量 Sxxj : 説明変数 xj の平方和(xj を他の説明変数に回帰したときの残差の平方和) 誤差項の分散の推定量 k+1は説明変数の個数(定数項とx) SER (standard error of the regression)

仮説の検定 H0: bj=bj0 k+1は説明変数の個数(定数項とx)

当てはまりの良さ TSS=ESS+RSS 決定係数 自由度修正済み決定係数 adjusted R2 説明変数の数kを増やしていけば,R2は単調に増加する 決定係数 自由度修正済み決定係数 adjusted R2 説明変数の増加にペナルティーを課すように修正したR2

単回帰での結果 wage1.raw

重回帰での結果

重回帰での結果(2)

Educが1年増加すると賃金は9.2%上昇 Experが1年増加すると賃金は0.4%増加 Tenureが1年増加すると賃金は2.2%増加 被説明変数をln(wage)にした場合 ここをクリックすると,Representation Estimation output Coefficient Diagnostics Residual Diagnostics などのメニューが表れる (この画面はEstimation Output) Educが1年増加すると賃金は9.2%上昇 Experが1年増加すると賃金は0.4%増加 Tenureが1年増加すると賃金は2.2%増加

非線形効果 説明変数xの2次の項を説明変数として加える 係数の意味 係数の意味の直感的な把握の仕方 xが1単位増加したときyに与える効果 b1,b2の値をもとに xが与えられた場合の ∂y/∂x の大きさを計算する(Excelの活用) Eviewsの中では,例えば,xが平均値をとる場合の効果についてはコマンドラインで  scalar dydx = @coefs(i) + @coefs(i+1)* @mean(x) とするとスカラー変数 dydxが作成される(@coefs(i) 直前の回帰のi番目の係数(xの係数:定数項は1番目とする), @coefs(i+1): x^2の係数,@mean(x) 変数xの平均値)

tenureの2乗項を加えた回帰

Eviewsでの回帰分析の統計量 スカラー変数 ベクトル変数 @regobs オブザベーション数,@f F統計量,@ssr 残差平方和 その他 @aic, @coefs(i), @stderrs(i), @tstats(i), @dw, @r2, @rbar2 ベクトル変数 @coefs 係数ベクトル @coefs(i) でi番目の説明変数の係数(定数項が1番目),@stderrs 係数の標準誤差,@tstats t値 コマンド行で scalar var1 = @ssr vector var2 = @coefs とタイプするとvar1やvar2@ssr, @coefsの中身が保存される

問題(1) ln(wage)を被説明変数にし,educ, exper, tenure, tenureの2乗を説明変数にして回帰分析を行え。 wage1.rawのデータを用いる tenureの範囲を調べよ。 tenureが1年増加したとき,wageは何%増加するか tenure=0, 5, 10, 20, 30, 40のそれぞれの場合について 上の回帰分析の係数の値を用い,tenureとwageの関係をグラフで表せ。 educの2乗を説明変数に加えるとどうなるか。

ダミー変数 質を表す変数 educ, wage, experはこれに対し連続変数 一般に,0または1をとるような変数をダミー変数と呼ぶ 女性ならば1,そうでなければ0 結婚していれば1.そうでなければ0 大学卒ならば1,そうでなければ0 educ, wage, experはこれに対し連続変数 一般に,0または1をとるような変数をダミー変数と呼ぶ

ダミー変数(2) 定数項ダミー 傾きに関するダミー 3つ以上のカテゴリーを持つ変数の場合 学歴 職業 中卒または高校中退 高卒,大卒未満 大卒以上 職業 事務職 研究職 営業 現場

定数項ダミー ln(wage) female=0の場合 b2 female=1の場合 a b2 図はb1<0の場合 a+b1 educ

傾きのダミー educ ln(wage) b2 a b2+b3 a+b1 female=0の場合 female=1の場合

問題 (2) femaleダミー変数を説明変数に加えた回帰を行え 賃金の男女格差は存在するか 学歴の効果に男女格差が存在するか 被説明変数 ln(wage) 説明変数 educ, exper, tenure, female 賃金の男女格差は存在するか 学歴の効果に男女格差が存在するか educ とfemaleの交差項を作成する exper, tenureの効果に男女格差が存在するか

問題 (3) 次の回帰を行う 被説明変数 ln(wage) 説明変数 educ, tenure, exper, female, female*educ, female*tenure, female*exper 男女別に回帰分析を行う EViewsのメニューでsampleを選択 If condition..のボックスに条件式を記入 female=0 とすれば男性のみ,female = 1 とすれば女性のみ; 戻すときはsample で条件式を消す 説明変数を  educ, tenure, exper として回帰 ダミー変数を用いた回帰と結果を比較せよ。

3つ以上のカテゴリー 例)学歴 この場合,2つのダミー変数をつくる N種類のカテゴリー  N-1 個のダミー変数 中卒 高卒 大卒 D1 1 D2 例)学歴 中卒, 高卒(短大卒を含む), 大卒 の3つのカテゴリー この場合,2つのダミー変数をつくる 中卒をベースにした効果 D1: 中卒とした比較した高卒の効果 D2: 中卒と比較した大卒の効果 高卒と大卒の比較は? 3つダミー変数を作るとどうなるか? N種類のカテゴリー  N-1 個のダミー変数

問題(4) 結婚ダミーが賃金に与える影響を調べよ 結婚が賃金に与える影響は男女間で異なるかもしれない married(結婚していれば1) 結婚×男女 の組み合わせで4通り married と female のそれぞれの組合せの観測度数を調べよ 二つの変数(married と female)を選択して,グループとして開く Menuから View/N way tabulation クロス集計票 被説明変数 ln(wage), 説明変数 female, married, female*married, + educ, exper, tenure として回帰 female*married  適当な名前で新しい変数を作る female, married, female*married の係数の意味は 定数項の大きさは? 男性既婚,男性独身,女性既婚,女性独身

問題(5) 教育年数の分布を調べよ 教育年数の影響は,連続変数で捉えるのではなく,学歴別に調べた方がよいかもしれない 教育年数から次のような学歴ダミー変数を作れ 高卒未満 ( educ < 12) 高卒以上 大卒未満 (12 <= educ <16) 大卒 以上 (16 <= educ) 次の回帰分析を行え 被説明変数:ln(wage),説明変数:学歴ダミー,その他の変数 (exper, tenure, female)

変数の作成方法 メニューの Genr ボタンをクリック新変数を作成する画面で次のように記述 ED1 = (educ<16) and (educ>=12) ED2 = (educ>=16) ED1は高卒ダミー,ED2は大卒ダミー(中卒がベース) (educ<16)等は論理式 (  ) の中が真なら1,偽なら0 and / or ED1は educが12年以上かつ16年未満の時に限り1,それ以外は0。 ED2はeducが16年以上の時に限り1,それ以外は0。