回帰分析 重回帰(1)
項目 重回帰モデルの前提 最小二乗推定量の性質 Eviewsでの回帰分析の実際 非線形効果 ダミー変数 仮説検定(単一の制約) 決定係数 定数項ダミー 傾きのダミー 3つ以上のカテゴリー
重回帰モデル multiple regression model 説明変数が2個以上 他の説明変数を一定に保っておいて,xi だけを1単位増加させたときに y が何単位増えるか 他の要因をコントロールした xi 固有の影響
重回帰モデル 前提 線型モデル(パラメータに関し) 誤差項の期待値は0 誤差項は互いに独立 誤差項の分散は一定(分散均一性) 誤差項は正規分布に従う BLUEの成立のためにはこの条件は不要
最小二乗法 残差平方和を最小にするようにパラメータを決定 a,b1,b2,..,bk : 未知パラメータ a,b1,b2,..bk の推定値 ei : 残差
最小二乗推定量 Sxxj : 説明変数 xj の平方和(xj を他の説明変数に回帰したときの残差の平方和) 誤差項の分散の推定量 k+1は説明変数の個数(定数項とx) SER (standard error of the regression)
仮説の検定 H0: bj=bj0 k+1は説明変数の個数(定数項とx)
当てはまりの良さ TSS=ESS+RSS 決定係数 自由度修正済み決定係数 adjusted R2 説明変数の数kを増やしていけば,R2は単調に増加する 決定係数 自由度修正済み決定係数 adjusted R2 説明変数の増加にペナルティーを課すように修正したR2
単回帰での結果 wage1.raw
重回帰での結果
重回帰での結果(2)
Educが1年増加すると賃金は9.2%上昇 Experが1年増加すると賃金は0.4%増加 Tenureが1年増加すると賃金は2.2%増加 被説明変数をln(wage)にした場合 ここをクリックすると,Representation Estimation output Coefficient Diagnostics Residual Diagnostics などのメニューが表れる (この画面はEstimation Output) Educが1年増加すると賃金は9.2%上昇 Experが1年増加すると賃金は0.4%増加 Tenureが1年増加すると賃金は2.2%増加
非線形効果 説明変数xの2次の項を説明変数として加える 係数の意味 係数の意味の直感的な把握の仕方 xが1単位増加したときyに与える効果 b1,b2の値をもとに xが与えられた場合の ∂y/∂x の大きさを計算する(Excelの活用) Eviewsの中では,例えば,xが平均値をとる場合の効果についてはコマンドラインで scalar dydx = @coefs(i) + @coefs(i+1)* @mean(x) とするとスカラー変数 dydxが作成される(@coefs(i) 直前の回帰のi番目の係数(xの係数:定数項は1番目とする), @coefs(i+1): x^2の係数,@mean(x) 変数xの平均値)
tenureの2乗項を加えた回帰
Eviewsでの回帰分析の統計量 スカラー変数 ベクトル変数 @regobs オブザベーション数,@f F統計量,@ssr 残差平方和 その他 @aic, @coefs(i), @stderrs(i), @tstats(i), @dw, @r2, @rbar2 ベクトル変数 @coefs 係数ベクトル @coefs(i) でi番目の説明変数の係数(定数項が1番目),@stderrs 係数の標準誤差,@tstats t値 コマンド行で scalar var1 = @ssr vector var2 = @coefs とタイプするとvar1やvar2@ssr, @coefsの中身が保存される
問題(1) ln(wage)を被説明変数にし,educ, exper, tenure, tenureの2乗を説明変数にして回帰分析を行え。 wage1.rawのデータを用いる tenureの範囲を調べよ。 tenureが1年増加したとき,wageは何%増加するか tenure=0, 5, 10, 20, 30, 40のそれぞれの場合について 上の回帰分析の係数の値を用い,tenureとwageの関係をグラフで表せ。 educの2乗を説明変数に加えるとどうなるか。
ダミー変数 質を表す変数 educ, wage, experはこれに対し連続変数 一般に,0または1をとるような変数をダミー変数と呼ぶ 女性ならば1,そうでなければ0 結婚していれば1.そうでなければ0 大学卒ならば1,そうでなければ0 educ, wage, experはこれに対し連続変数 一般に,0または1をとるような変数をダミー変数と呼ぶ
ダミー変数(2) 定数項ダミー 傾きに関するダミー 3つ以上のカテゴリーを持つ変数の場合 学歴 職業 中卒または高校中退 高卒,大卒未満 大卒以上 職業 事務職 研究職 営業 現場
定数項ダミー ln(wage) female=0の場合 b2 female=1の場合 a b2 図はb1<0の場合 a+b1 educ
傾きのダミー educ ln(wage) b2 a b2+b3 a+b1 female=0の場合 female=1の場合
問題 (2) femaleダミー変数を説明変数に加えた回帰を行え 賃金の男女格差は存在するか 学歴の効果に男女格差が存在するか 被説明変数 ln(wage) 説明変数 educ, exper, tenure, female 賃金の男女格差は存在するか 学歴の効果に男女格差が存在するか educ とfemaleの交差項を作成する exper, tenureの効果に男女格差が存在するか
問題 (3) 次の回帰を行う 被説明変数 ln(wage) 説明変数 educ, tenure, exper, female, female*educ, female*tenure, female*exper 男女別に回帰分析を行う EViewsのメニューでsampleを選択 If condition..のボックスに条件式を記入 female=0 とすれば男性のみ,female = 1 とすれば女性のみ; 戻すときはsample で条件式を消す 説明変数を educ, tenure, exper として回帰 ダミー変数を用いた回帰と結果を比較せよ。
3つ以上のカテゴリー 例)学歴 この場合,2つのダミー変数をつくる N種類のカテゴリー N-1 個のダミー変数 中卒 高卒 大卒 D1 1 D2 例)学歴 中卒, 高卒(短大卒を含む), 大卒 の3つのカテゴリー この場合,2つのダミー変数をつくる 中卒をベースにした効果 D1: 中卒とした比較した高卒の効果 D2: 中卒と比較した大卒の効果 高卒と大卒の比較は? 3つダミー変数を作るとどうなるか? N種類のカテゴリー N-1 個のダミー変数
問題(4) 結婚ダミーが賃金に与える影響を調べよ 結婚が賃金に与える影響は男女間で異なるかもしれない married(結婚していれば1) 結婚×男女 の組み合わせで4通り married と female のそれぞれの組合せの観測度数を調べよ 二つの変数(married と female)を選択して,グループとして開く Menuから View/N way tabulation クロス集計票 被説明変数 ln(wage), 説明変数 female, married, female*married, + educ, exper, tenure として回帰 female*married 適当な名前で新しい変数を作る female, married, female*married の係数の意味は 定数項の大きさは? 男性既婚,男性独身,女性既婚,女性独身
問題(5) 教育年数の分布を調べよ 教育年数の影響は,連続変数で捉えるのではなく,学歴別に調べた方がよいかもしれない 教育年数から次のような学歴ダミー変数を作れ 高卒未満 ( educ < 12) 高卒以上 大卒未満 (12 <= educ <16) 大卒 以上 (16 <= educ) 次の回帰分析を行え 被説明変数:ln(wage),説明変数:学歴ダミー,その他の変数 (exper, tenure, female)
変数の作成方法 メニューの Genr ボタンをクリック新変数を作成する画面で次のように記述 ED1 = (educ<16) and (educ>=12) ED2 = (educ>=16) ED1は高卒ダミー,ED2は大卒ダミー(中卒がベース) (educ<16)等は論理式 ( ) の中が真なら1,偽なら0 and / or ED1は educが12年以上かつ16年未満の時に限り1,それ以外は0。 ED2はeducが16年以上の時に限り1,それ以外は0。