データ分析入門(12) 第12章 単回帰分析 廣野元久.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
EXCELで学ぶマーケティング統計 第4章 経営学研究科 M1  真島 健.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
林俊克&廣野元久「多変量データの活用術」:海文堂
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
自己回帰モデルへの橋渡し 高崎経済大学 宮田庸一
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
パネル分析について 中村さやか.
重回帰分析入門 経済データ解析 2009年度.
実証分析の手順 経済データ解析 2011年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第2章 単純回帰分析 ー 計量経済学 ー.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2011年度.
データ分析入門(10) 第10章 クロス集計表と仮説検定 廣野元久.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
計量経済学入門 麻生良文.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
データ分析入門(13) 第13章 主成分分析 廣野元久.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
補章 時系列モデル入門 ー 計量経済学 ー.
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
相関分析.
データ解析 静岡大学工学部 安藤和敏
市場規模の予測.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
最小自乗法.
(回帰分析)推計結果の見方(1) 決定係数 回帰式のあてはまりの良さをはかる 回帰式による予測の信頼度を見るひとつの尺度
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場規模の予測.
第134回(2018-2)品質管理セミナー・ベーシックコース
統計処理2  t検定・分散分析.
部分的最小二乗回帰 Partial Least Squares Regression PLS
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第3章 線形回帰モデル 修士1年 山田 孝太郎.
データ解析 静岡大学工学部 安藤和敏
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

データ分析入門(12) 第12章 単回帰分析 廣野元久

本章の概要 2つの量的データのばらつき方に直線的な傾向が見とめられる場合には,その傾向線(回帰直線)を, データから求めよう 回帰直線が計算できれば,その関係を利用して,因果関係の検証や将来の予測を行ってみよう JMP INを使って散布図に回帰直線を描画する方法や,その解釈を理解する 第12章 単回帰分析 廣野元久 高橋行雄

1.回帰分析 1.1 回帰分析とは 1.2 単回帰分析と重回帰分析 1.3 回帰係数の求め方 1.4 決定係数 1.5 回帰係数の有意性の検定 1.6 回帰分析の利用法 第12章 単回帰分析 廣野元久 高橋行雄

1.1回帰分析とは(1) 回帰分析とは 因果を持つ2つの量的データの直線的関係を表す,直線の方程式を求めること 町の人口とごみ排出量 一人当りのごみ排出量がほぼ同じなら,人口が増えれば,それだけごみ排出量は増えるであろう. この関係を式(直線)で表せれば, 将来の町の人口が分かれば,町のごみ排出量が 直ちに,推定され,市政に役立つであろう 第12章 単回帰分析 廣野元久 高橋行雄

1.1回帰分析とは(2) 原因に左右されて 回帰直線 結果として,ばらつく変量 被説明 変量 原因となる 変量 or 従属 説明変量 or 独立変量 X 第12章 単回帰分析 廣野元久 高橋行雄

1.1回帰分析とは(3) 第12章 単回帰分析 廣野元久 高橋行雄

1.2 単回帰分析と重回帰分析(1) 単回帰分析 単回帰式 ε 残差 ごみ排出量 人口 結果 Y 定数項 原因 X 誤差項 回帰係数 傾き 第12章 単回帰分析 廣野元久 高橋行雄

1.2 単回帰分析と重回帰分析(2) 重回帰分析 (原因がたくさんあるという意味) 結果;ごみ排出量 原因;人口 商店の数 リサイクルの取組み 事業所数 etc…. ε 残差 結果 Y 原因1 X1 原因2 X2 原因p Xp 第12章 単回帰分析 廣野元久 高橋行雄

1.3 回帰係数の求め方(1) 最小2乗法のイメージ 第12章 単回帰分析 廣野元久 高橋行雄

1.3 回帰係数の求め方(2) 回帰直線はめのこで引いてはいけない 第12章 単回帰分析 廣野元久 高橋行雄

1.4 決定係数(1) 従属変数Yの平方和Sは,回帰で説明できる部分と,回帰では説明できない部分に分解できる. 1.4 決定係数(1) 従属変数Yの平方和Sは,回帰で説明できる部分と,回帰では説明できない部分に分解できる. 決定係数は,従属変数Yの平方和のうち,回帰で説明できる平方和の割合を示すもの 第12章 単回帰分析 廣野元久 高橋行雄

1.4 決定係数(2) 第12章 単回帰分析 廣野元久 高橋行雄

1.5 回帰係数の有意性の検定 傾きbの検定 帰無仮説Ho:回帰直線の傾きは0である b=0 (説明変量xに,従属変数yを説明する力はない xとyは無関係) 対立仮説H1:回帰直線の傾きは0でない b=0 帰無仮説が棄却された:回帰直線はYのばらつきを 説明するのに有効 他の変量を 探索 帰無仮説が棄却できない:回帰直線はYのばらつきを 説明のに有効でない 第12章 単回帰分析 廣野元久 高橋行雄

1.6 回帰分析の利用法 因果の確認 知識経験として,因果が想定される2変量が,実際に因果があるかどうかをデータから判断できる 1.6 回帰分析の利用法 因果の確認 知識経験として,因果が想定される2変量が,実際に因果があるかどうかをデータから判断できる 金属の抵抗値は,周辺の温度に依存する 予測 回帰式が有効なら,それを予測に用いることができる 周辺温度が100℃のときの抵抗値を予測できる 制御 説明変量をある値に固定すると,従属変動のばらつきは 小さくなり,平均値も目的の値に留めることができる 抵抗値が100Ωになるように,周辺温度を50℃に制御 する(工場の製品管理などに使われる) 第12章 単回帰分析 廣野元久 高橋行雄

2 単回帰分析の操作 2.1 単回帰分析の操作 2.2 回帰分析の結果の書き方 2.3 信頼区間曲線の表示 2.4 残差の分析 2 単回帰分析の操作 2.1 単回帰分析の操作 2.2 回帰分析の結果の書き方 2.3 信頼区間曲線の表示 2.4 残差の分析 第12章 単回帰分析 廣野元久 高橋行雄

2.1 単回帰分析の操作(1) 廃棄物処理.jmpをロードする ここをクリック 第12章 単回帰分析 廣野元久 高橋行雄

2.1 単回帰分析の操作(2) 1.人口をクリック 2.Xをクリック 6.ゴミ収集量の 役割が決まる 7.OKボタンを押す 3.人口の 2.1 単回帰分析の操作(2) 1.人口をクリック 2.Xをクリック 6.ゴミ収集量の 役割が決まる 7.OKボタンを押す 3.人口の 役割が決まる 4.ゴミ収集量をクリック 5.Yをクリック 第12章 単回帰分析 廣野元久 高橋行雄

2.1 単回帰分析の操作(3) 1.人口とゴミ収集量の 散布図が表示される 2.ここをクリックする 3.直線のあてはめをクリックする 2.1 単回帰分析の操作(3) 1.人口とゴミ収集量の 散布図が表示される 2.ここをクリックする 3.直線のあてはめをクリックする 4.回帰直線 が表示 される 第12章 単回帰分析 廣野元久 高橋行雄

2.1 単回帰分析の操作(4) 回帰式 人口1人増加すると 決定係数R2 標準誤差 回帰で説明できない 回帰係数の検定結果 回帰係数 2.1 単回帰分析の操作(4) 回帰式 人口1人増加すると ごみは0.29988t増加する 決定係数R2 標準誤差 回帰で説明できない 残差の標準偏差 回帰係数の検定結果 切片 :定数項 人口:傾き 傾きのp値が<.0001と 非常に小さいので高度に有意 回帰直線は意味がある 回帰係数 第12章 単回帰分析 廣野元久 高橋行雄

2.2 回帰分析の結果の書き方 書き落としてはいけないこと 回帰式 回帰係数のt値(あるいは,標準誤差) 決定係数 標準誤差 第12章 単回帰分析 廣野元久 高橋行雄

2.3 信頼区間曲線の表示(1) 1.直線のあてはめの▼マークをクリック 2.回帰の信頼区間をクリック 3.95%の信頼区間 2.3 信頼区間曲線の表示(1) 1.直線のあてはめの▼マークをクリック 2.回帰の信頼区間をクリック 3.95%の信頼区間 曲線が表示される 第12章 単回帰分析 廣野元久 高橋行雄

2.3 信頼区間曲線の表示(2) 1.ここをクリック 2.平均のあてはめをクリック 3.Yの標本平均が表示される 標本平均の線の全域が 2.3 信頼区間曲線の表示(2) 1.ここをクリック 2.平均のあてはめをクリック 3.Yの標本平均が表示される 標本平均の線の全域が 信頼区間曲線内に含ま れるとき 回帰の傾きは 有意ではない 第12章 単回帰分析 廣野元久 高橋行雄

2.4 残差の分析(1) 目的 回帰モデル(回帰直線)がデータによく当てはまっているかどうかのチェックを行う 1.ここをクリック 2.4 残差の分析(1) 目的 回帰モデル(回帰直線)がデータによく当てはまっているかどうかのチェックを行う 1.ここをクリック 2.残差プロットをクリック 3.残差プロットが表示される ラベルで 外れ値を 表示 良いモデルは 残差のプロットはランダムである 第12章 単回帰分析 廣野元久 高橋行雄

2.4 残差の分析(2) 外れ値の特徴を調べる データの背後にある知識を活用して,外れ値の 特徴を調べる この例では ホテルや 観光地 2.4 残差の分析(2) 外れ値の特徴を調べる データの背後にある知識を活用して,外れ値の 特徴を調べる この例では 厚木,大和,小田原,鎌倉 ホテルや 歓楽街 観光地 観光客などが多い ごみを出す人口に カウントされていない 第12章 単回帰分析 廣野元久 高橋行雄

2.4 残差の分析(3) 不等分散 系列相関 時系列データの場合には,残差に波状の系列相関が現れることがある 2.4 残差の分析(3) 系列相関 時系列データの場合には,残差に波状の系列相関が現れることがある 自己相関モデルを追加するなどの特殊なテクニックが必要 不等分散 残差が説明変量の値に従い大きくなる 対数変換や2次項の追加などの変数変換が必要 第12章 単回帰分析 廣野元久 高橋行雄