Qualitative Response Model. 被説明変数がダミー変数の回帰 例) MROZ.RAW 女性労働 –inlf 女性が外で働いていれば 1 ,そうでなけれ ば 0 –inlf=f( 家計所得,教育年数,年齢,子育て費 用) 推定方法 – 線型確率モデル (linear probability.

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
回帰分析 重回帰 (2) 仮説検定. 単一の制約 –t 検定 – メニューから行う方法 複数の制約 –F 検定 – メニューから行う方法 –F 統計量を実際に求める 構造変化 最適なモデルの決定.
陰関数定理と比較静学 モデルの連立方程式体系で表されるとき パラメータが変化したとき 如何に変数が変化するか 至るところに出てくる.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
SPSS 入門 麻生良文.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
一般化線形モデル(GLM) generalized linear Models
【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
パネル分析について 中村さやか.
男性の育児が肥満に与える影響 富山大学 経済学部 経済学科 孫田 篤 専門ゼミ-報告会.
回帰分析 重回帰(1).
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Extremal Combinatorics 14.1 ~ 14.2
Bassモデルにおける 最尤法を用いたパラメータ推定
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
回帰分析.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
計量経済学入門 麻生良文.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
情報経済システム論:第11回 担当教員 黒田敏史 2018/9/20 情報経済システム論.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
補章 時系列モデル入門 ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
データ解析 静岡大学工学部 安藤和敏
第6章 連立方程式モデル ー 計量経済学 ー.
事例研究(ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 -
 統計学講義 第11回     相関係数、回帰直線    決定係数.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
顧客獲得.
一般化線型モデル generalized linear model; GLM
第9章 混合モデルとEM 修士2年 北川直樹.
正規分布確率密度関数.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
顧客維持に関するモデル.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
Black Litterman Modelによる最適化
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第7章 単回帰で「消費関数」を計測する 1.所得の定義 1.1 国民純生産 国内総生産(GDP) ⇔ 所得
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
行列式 方程式の解 Cramerの公式 余因数展開.
回帰分析(Regression Analysis)
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

Qualitative Response Model

被説明変数がダミー変数の回帰 例) MROZ.RAW 女性労働 –inlf 女性が外で働いていれば 1 ,そうでなけれ ば 0 –inlf=f( 家計所得,教育年数,年齢,子育て費 用) 推定方法 – 線型確率モデル (linear probability model) – プロビットモデル probit model – ロジットモデル logit model

線型確率モデル 被説明変数 y は 1 または 0 の値をとるダミー変数 線型モデルをそのまま当てはめる y 1 0 x 当てはめられた直線 y の予測値(当てはめ られた直線)は,説 明変数が特定の値を とるときに, y が 1 と なる確率を表すと解 釈することができる 係数 b は x の増加が y が 1 となる確率をどのく らい増加させるかを 表す

線型確率モデルの問題点 y の予測値が 0 と 1 の間に収まらない – Pr(y=1|x) のもっと良い定式化は ? – Pr(y=1|x)=F(b’x) – F( ) に確率分布関数を当てはめるとこの問題 は回避できる 分散不均一性の問題

分布関数の当てはめ

probit model, logit model 次のようなモデルを想定 F( ) は確率分布関 数 Probit model  標準正規分布 Logit model  logisitic 分布 ただし, y*=  ’x+u

係数の意味 probit model, logit model f( ) は確率密度関数, y*=  ’x+u probit model や logit model での係数の解釈 y の期待値に与える影響を正確に求めるためには, f(y*) の計算が必要  x 1,x 2,..,x k の水準に依存 (他の説明変数がとる値によっても異なる)

Probit model, logit model の考え方 ここで y は観察される変数であるが, y* は観察不可能な変数であるとする。 また,誤差項はある確率分布にしたがう。 例) 女性の労働参加を決定するある観察不可能な変数がある( y* )。 観察不可能な変数 y* は,説明変数 x の線型関数 + 誤差項で決定される。 y* がある閾値 (critical value) を超えると女性は労働に参加する (y=1) 。 しかし, y* が閾値を越えなければ女性は労働に参加しない (y=0)

Probit model, logit model の考え方 ( 続き) 最後の等式は,確率密度関数が x=0 に関して対称的な場合に成 立 標準正規分布, ロジスティック分布では成立

線形確率モデル

probit, logit モデルの推定 menu から Quick  Estimate equation を選択して,次の画面 の Estimation settings で method に BINARY を選択する。 specification に Binary estimation method とい う option が表れるので, Probit または Logit を 選択する

Probit model

係数の比較 olsprobitlogit coefs.e.coefs.e.coefs.e. C NWIFEINC EDUC EXPER AGE KIDSLT KIDSGE

Probit, Logit model の推定方法 最尤法による推定 尤度関数 likelihood function probit model, logit model : F( ) を特定化し,最尤法でパラメータを決 める

係数の意味 : marginal effect probit model, logit model f( ) は確率密度関数, y*=  ’x+u logit model の場合 probit model の場合 f(y*)=  (y*) 標準正規分布の密 度関数

係数の意味: marginal effect (2) probit model, logit model の係数の比は, marginal effect の相対 的な比率を表す

vector prob_b scalar yhat = prob_b(1)* 1 + prob_b(2) prob_b(5) + prob_b(6) + prob_b(7) scalar dnorm_y vector (7) dydx dydx(2) = dnorm_y * prob_b(2) dydx(3) = dnorm_y * prob_b(3) dydx(4) = dnorm_y * prob_b(4) dydx(5) = dnorm_y * prob_b(5) dydx(6) = dnorm_y * prob_b(6) dydx(7) = dnorm_y * prob_b(7) marginal effect の求め方 説明 を prob_b というベクトルに代入 説明変数が平均値をとる場合の y* を計算し, yhat というスカラー変 数に代入 yhat の値での標準正規分布の密度 関数の値を計算し,それを dnorm_y というスカラー変数に代 入 Marginal effects の結果を代入す るベクトルを dydx とする(要素 数は 7 個) 各要素に,それぞれの説明変数 の限界効果を代入 Eviews のコマンドウィンドウで次のようにタイプ probit 分析の結果を開いたまま, View/ Representation とたどり, そこの結果を張り付けて編集すると楽

説明変数の平均 値をここにコ ピーする(定数 項は 1 とする) 係数の値 この列は B 列 と C 列の掛け 算 上のセルの合計 関数を使って y* における密度関 数の値を得る norm.s.dist(, ) marginal effects marginal effect の求め方 Excel を用いた方法

問題 (1) MROZ.RAW のデータを用い,女性の労働 参加を,線型確率モデルと logit model, probit model で推計し,係数を解釈せよ。 – 被説明変数: inlf 労働力であれば 1 – 説明変数: nwifeinc( non wife income), educ( 教育年数), exper( 実際に働いた年 数),, age (年齢), kidslt6 ( 6 歳未満の子 供の数), kidsge6 ( 6-18 歳の子供の数) logit model の場合の f(y*) は ?

問題 (2)

vector prob_b scalar yhat = prob_b(1)* 1 + prob_b(2) prob_b(5) * ) )^2 + prob_b(6) + prob_b(7) + prob_b(8) scalar dnorm_y vector (8) dydx dydx(2) = dnorm_y * prob_b(2) dydx(3) = dnorm_y * prob_b(3) dydx(4) = dnorm_y * ( prob_b(4) + 2 * prob_b(5) ) dydx(6) = dnorm_y * prob_b(6) dydx(7) = dnorm_y * prob_b(7) dydx(8) = dnorm_y * prob_b(8) marginal effect の求め方 説明 を prob_b というベクトルに代入 説明変数が平均値をとる場合の y* を計算し, yhat というスカラー変 数に代入 Yhat の値での標準正規分布の密 度関数の値を計算し,それを dnorm_y というスカラー変数に代 入 Marginal effects の結果を代入す るベクトルを dydx とする(要素 数は 8 個) 各要素に,それぞれの説明変数 の限界効果を代入 この例では, expersq という exper の平方の項があるため, dydx(4) の計算は他とは異なって いる Eviews のコマンドウィンドウで次のようにタイプ probit 分析の結果を開いたまま, View/ Representation とたどり, そこの結果を張り付けると便利

説明変数の平 均値をここに コピーする 係数の値 この列は B 列 と C 列の掛け 算 上のセルの合計 関数を使っ て y* におけ る密度関数 の値を得る marginal effects marginal effect の求め方 Excel を用いた方法

Tobit model 耐久財の購入量 (y) の決定 – 購入しない人 (y=0) が存在 –y>0 と y=0 のみが観察される この場合も次のようなモデルを考える –y* 観察不可能な変数で,耐久財の購入量 (y) を決定する潜在変数

Tobit model の当てはめ x y OLS の当てはめ y* と x の関係 Tobit model

Tobit model の応用 女性の労働供給 –MROZ.RAW – 労働参加していない女性が一定割合存在 耐久財の購入 低賃金労働者の労働供給 – 生活保護の受給との関係で

Tobit model の解釈

Tobit model の解釈 (2) ここで, z~N(0,1) のとき,次の式が成り 立つことを用いている inverse Mills ratio y>0 の条件付きの期待値は, xb よりも大きく なることが重要

Tobit model の解釈 (3) y の unconditional expected value 説明変数 x が与えられた場合のyの期待値 y>0 の条件付き期待値は前頁

Tobit モデルの解釈 (4) 結果だけまとめておく

Tobit の推定方法 menu で Quick  Estimate equation Estimation settings の method で CENSORED -.. を選択する 誤差項の分布を選択 ( Tobit は正規分布) 打ち切りの位置 を指定する。 0 以外の値も,右 側の指定もでき る。

E-Views での Tobit model の推定  の推計値

Dependent varhours Tobit OLS Coefs.e.Coefs.e. C NWIFEINC EDUC EXPER EXPERSQ AGE KIDSLT KIDSGE  Tobit model と OLS の比較 E-Views での出 力 Tobit の場合, xj の 1 単位の増加 y の期待値に与え る影響をみるた めには, x’b/s を 計算し,標準正 規分布関数から その涙液分布を 計算する必要あ り。単純に比較 できない

問題 (3) MROZ.RAW 女性の労働時間の回帰分析 –40% 強が労働時間 0 – 被説明変数: hours – 説明変数: nwifeinc, educ, exper, exper^2, age, kidslt6,kidsge6 –OLS と Tobit model で推計し,結果を解釈せよ