実証分析の手順 経済データ解析 2011年度.

Slides:



Advertisements
Similar presentations
2006 年度 統計学講義内容 担当者 河田正樹
Advertisements

1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
入門B・ミクロ基礎 (第4回) 第2章 2014年10月13日 2014/10/13.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第4章補足 分散分析法入門 統計学 2010年度.
入門 計量経済学 第02回 ―本日の講義― ・マクロ経済理論(消費関数を中心として) ・経済データの取得(分析準備) ・消費関数の推定
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
Excelによる統計分析のための ワークシート開発
第3章 2変量データの記述 統計学基礎 2010年度.
収量を推測する -Excel- 2011年6月24日 理学部3回 青木陽輔.
重回帰分析入門 経済データ解析 2009年度.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第2章 単純回帰分析 ー 計量経済学 ー.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
テーマ 自殺 ~なぜ地域差が出るのか~ 村瀬ゼミ.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
日経平均株価の時系列データ分析 B03007 明田 剛慈.
貧困と出産の関係.
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
統計学 第3回 10/11 担当:鈴木智也.
第5章 回帰分析入門 統計学 2006年度.
経済データのダウンロードと グラフの作成 経済データ解析 2011年度.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
計量経済学 経済の構造を推定する 浅野 晳 筑波大学.
頻度論とベイジアンの比較 慶應義塾大学 SFC 小暮研究会 梶田幸作
離婚が出生数に与える影響 -都道府県データを用いた計量分析
補章 時系列モデル入門 ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
シミュレーション論 Ⅱ 第15回 まとめ.
相関分析.
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
第6章 連立方程式モデル ー 計量経済学 ー.
動学的一般均衡モデルについて 2012年11月9日 蓮見 亮.
4章までのまとめ ー 計量経済学 ー.
経済データのダウンロードと グラフの作成 経済データ解析 2009年度.
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
(回帰分析)推計結果の見方(1) 決定係数 回帰式のあてはまりの良さをはかる 回帰式による予測の信頼度を見るひとつの尺度
数量分析 第2回 データ解析技法とソフトウェア
担当者: 河田 正樹 年度 管理工学講義内容 担当者: 河田 正樹
部分的最小二乗回帰 Partial Least Squares Regression PLS
第3章補足2 多変量データの記述 統計学基礎 2010年度.
シミュレーション論Ⅰ 第14回 シミュレーションの分析と検討.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
シミュレーション論 Ⅱ 第1回.
回帰分析(Regression Analysis)
重回帰分析入門 経済データ解析 2008年度.
構造方程式ゼミナール 2012年11月14日-11月21日 構造方程式モデルの作成.
重回帰分析入門 (第5章補足) 統計学 2007年度.
議論の前提 ある人獣共通感染症は、野生動物が感染源となって直接又は媒介動物を通じて人に感染を起こす。
回帰分析入門 経済データ解析 2011年度.
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
最終プレゼンテーション 「合併率と都道府県格差の 関係について」 2006年1月24日(火) 2002359 秦 数正
転移学習 Transfer learning
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

実証分析の手順 経済データ解析 2011年度

実証分析とは 実証分析とはこれらの理論や仮説が正しいかどうかを、統計データを用いて検証する方法である。 経済学をはじめ、経営学、心理学などではさまざまな理論が提唱されている。 また、これらの理論に加え、知識や経験をもとに、ある問題についての仮説を考えることができる。 実証分析とはこれらの理論や仮説が正しいかどうかを、統計データを用いて検証する方法である。 実証分析の結果は、過去の理論の修正や新しい理論の構築に用いられる。 実証分析には回帰分析がよく用いられる。 一致すれば理論や仮説が正しいとみなされ、不一致の場合には再検討をおこなう。 一致? さまざまな 理論・仮説 統計データによる 分析結果 不一致?

実証分析の手順 <ステップ1> モデルの定式化 <ステップ2> モデルに含まれる変数と実際のデータの対応 <ステップ3> パラメータの推定と統計量の算出 <ステップ4> モデルの検討 合格 不合格 <ステップ5> 政策・予測への応用 <ステップ3>のパラメータの推定と統計量の算出というのは、Y=a+bXというモデルを想定した回帰分析において、係数推定値a,bや決定係数などを算出することである。Excelの分析ツールで計算できる。

→ Y(消費) = a + b X(所得) <ステップ1> モデルの定式化 <ステップ1> モデルの定式化 分析目的が数式の形(これをモデルという)であらわされていることが実証分析の出発点である。 (例) 「消費が増大する原因には、所得の増大がある」 すなわち、      (所得↑ → 消費↑) を分析目的とするなら、  → Y(消費) = a + b X(所得)      ↑    ↑    結果    原因  という形のモデルに定式化できる。 「消費が増大する原因には、所得の増大がある」   ⇒ 消費関数といわれる、経済理論の中の1つ これは消費関数という理論が、現実経済に適合しているかどうかを検証する実証分析である。

このような理論がないか、探せない場合  ⇒ 自分の知識、経験にもとづいて仮説をたて、これをモデルとして定式化する。 (例)死亡率は都道府県によって異なる。なぜこのような違いが出るのか、その原因を分析したい。

死亡率を決定する理論が見つけられなかった場合、自分で仮説を立てる。 ここでは、おもな原因として次の3つを考えた。  寿命 - 高齢者の多い県は死亡率が高いはずである  医療 - 医療機関が充実していれば死亡率は低いはずである  衛生 - 衛生状態が悪いと死亡率が高いはずである この仮説を定式化すると次のモデルになる。   Y(死亡率)=a+bX(寿命)+cZ(医療)+dW(衛生) 考えた3つの原因が3つの説明変数になる

定式化されたモデルを分析するためには、モデルに含まれる変数に適当なデータを対応させる必要がある。 <ステップ2> モデルに含まれる変数と実際のデータとの対応 定式化されたモデルを分析するためには、モデルに含まれる変数に適当なデータを対応させる必要がある。 最初に分析目的に応じて、2種類の統計データのうちどちらを用いるかを決める。 時系列データ データを時間の順序にならべたものであり、過去の変動から現状を把握し、将来を予測するなどの目的に用いる。 クロスセクションデータ ある1時点において何らかの属性に関してならべたものであり、地域差などの現状を把握するために用いる。

などが候補になる。 次に各変数に対応する適当なデータを探す 死亡率の大小を表す原因として、「医療の充実」という原因を考えたが、これを表すデータとしてどのようなものがあるか? 医師数 病院数 病床数  などが候補になる。 これらの候補の中で、どのデータが最適であるかを考えてみる。 一方で、入手可能かどうかも重要な点となる。 ⇒ 以上のことから「人口10万対医師数」のデータを「医療の充実」を表すデータとして用いる。

死亡率の分析では、各変数に次のようなデータを対応させることにしよう。  Y(死亡率) - 人口千人あたりの死亡率  X(寿命) - 高齢者比率(65歳以上人口/総人口)  Z(医療) - 人口10万対医師数  W(衛生) - し尿処理水洗化率 これらのデータは、代表的な統計資料集である『日本統計年鑑』から得ることができる。 総務省統計局のホームページには日本統計年鑑のすべての表がExcel形式で掲載されている。

モデルの変数に対応する適切なデータが見つかったら、分析ツールで分析をおこなえば良い。 <ステップ4> モデルの検討 モデルの変数に対応する適切なデータが見つかったら、分析ツールで分析をおこなえば良い。  ⇒ これが<ステップ3> 分析ツールの結果で、最初に見るのは次の2点 係数推定値 - モデル定式化の際に想定した因果関係と分析結果が一致するかどうか、その符号に着目する。 決定係数および自由度修正済み決定係数 - 決定係数が1に近ければ分析をおこなう意味があったといえるが、0.6以下などの場合には、その他の説明変数を加える必要があったと考えられる。また、重回帰の場合には、自由度修正済み決定係数も見る。

高齢者比率の高い都道府県ほど、死亡率は高いはずである。 分析ツールで分析をおこなった結果、 X(高齢者比率)の係数推定値の符号は+となった。 ※ 係数推定値の符号の検討 一致? さまざまな 理論・仮説 統計データによる 分析結果 不一致? 高齢者比率の高い都道府県ほど、死亡率は高いはずである。  ⇒ X(高齢者比率)の係数推定値の符号は+となるはず。 分析ツールで分析をおこなった結果、 X(高齢者比率)の係数推定値の符号は+となった。 一致 人口10万対医師数の多い都道府県ほど、死亡率は低いはずである。  ⇒ Z(人口10万対医師数)の係数推定値の符号は-となるはず。 分析ツールで分析をおこなった結果、 Z(人口10万対医師数)の係数推定値の符号は+となった。 不一致

という2つの原因が考えられる。 分析結果がよくない場合 定式化の際の誤り(元になった理論や各自の知識、経験などが誤り) データや分析手法の誤り  という2つの原因が考えられる。 「係数推定値の符号が想定したものと異なる」「決定係数(または自由度修正済み決定係数)の値が小さい」場合には、モデルをどのように改良すべきかを考えてみる。 ⇒ 実際の分析をおこなうときのことで、この講義のレポートとしては、そこまで要求しない。