多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2009年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
重回帰分析入門 経済データ解析 2011年度.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
12月4日 伊藤 早紀 重回帰分析.
回帰分析/多変量分析 1月18日.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
相関分析.
データ解析 静岡大学工学部 安藤和敏
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
第3章補足2 多変量データの記述 統計学基礎 2010年度.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
パターン認識特論 カーネル主成分分析 和田俊和.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日

1.重回帰式の求め方 最小2乗法 p個の説明変数 について、n個のデータが測定されたとする 求める重回帰式: x1 x2 ・・・ xj xp y 1 x 11 x 12 x 1j x 1p y1 2 x 21 x 22 x 2j x 2p y2 : i x i1 x i2 x ij x ip yi n x n1 x n2 x nj x np yn 求める重回帰式: i番目のサンプルの理論値を  とすると: i番目のサンプルの残差: 残差平方和  :   を最小にする  を求める 最小2乗法

正規方程式 正規方程式 を最小にするための係数 を で編微分して0とおき、(p+1)元の連立方程式を作り、解く ●基本統計量   を最小にするための係数    を         で編微分して0とおき、(p+1)元の連立方程式を作り、解く 正規方程式 ●基本統計量 ・平均:目的変数の平均を     説明変数の平均を ・積和:yとj番目の変数との積和 ・平方和・積和行列:    各説明変数における偏差平方和、    変数相互の積和で作られる行列 ・偏差平方和:変数yの偏差平方和   における偏差平方和 逆行列:

偏回帰係数の公式 正規方程式を変形させる この連立方程式を解くことで、偏回帰係数         が求まる (正規方程式をサンプル数nで割る) これから、

平方和・積和行列の適用 平方和・積和行列を適用すると以下のようになる ・偏回帰係数 ・残差平方和 ・重相関係数 ・偏相関係数 ・標準誤差 各行列は以下の通り(p=2の場合) : 行列  のi行j列目の要素の余因子 :平方和・積和行列の逆行列のi j成分

相関行列の適用 相関行列を とする : のi行j列目の 余因子行列 : のi行j列目の 余因子行列の逆行列 ・連立方程式 ・残差平方和 相関行列を   とする :   のi行j列目の         余因子行列 :   のi行j列目の      余因子行列の逆行列 ・連立方程式 ・残差平方和 ・標準偏回帰係数 ・標準誤差 ・重相関係数

2.重回帰式の係数に関する 推定と検定 ●標準誤差 ・標本調査を何度も行い、各調査ごとに重回帰式を得たとする 2.重回帰式の係数に関する                推定と検定 ●標準誤差 ・標本調査を何度も行い、各調査ごとに重回帰式を得たとする ・求められた偏回帰係数  別々に、度数分布、ヒストグラムを作成する ここで、ある変数  の母集団の偏回帰係数を  とする ヒストグラムは平均  標準偏差        の正規分布に                          近づくことがわかっている 標準誤差 定数項  の標準誤差: n:サンプル数、  :逆行列、     ;説明変数の平均

係数・定数項の推定 信頼幅:100(1-α)% 自由度:n-p-1 t値:   の区間推定:   の区間推定:

T値・F値と係数・定数項の検定 ●T値と係数・定数項の検定 ・有意水準α、自由度n-p-1におけるt値を ・j番目変数の偏回帰係数を標準誤差  で割った値   は母集団の偏回帰係数が    という仮説の下に自由度のt分布に従う であれば、  は有意 ・定数項  を標準誤差  で割った値 であれば、  は有意 T値 母集団の偏回帰係数が    という仮説の下に自由度          のF分布に従う ●係数検定のためのF値 :  (j番変数のT値)を2乗した値 変数選択法を用いる場合、F値を使って検定する

3.理論値に関する分析 ●ダーヴィンワトソン比 値が2前後のときランダム 重回帰分析:残差 がランダムでなければならない 重回帰分析:残差  がランダムでなければならない ダーヴィンワトソン比(Dw):一つ前の  との系列相関を見ることによって                   に何らかの傾向があるか判断する

理論値の区間推定 理論値の区間推定 ある特定のサンプルi番目の理論値を とする 理論値が標本調査より得たものであるとき、        「何%の信頼度でこの理論値は○から△の間にある」 という 理論値の区間推定 :残差変動の不偏分散 理論値の標準偏差: n : サンプル数   は平方和・積和行列なのでn倍 :点  と平均  とのマハラノビスの汎距離 (j=1,・・・,p) i番目サンプルの母集団の理論値を  、標本調査による理論値を  とすると 区間推定(有意水準α、n-p-1の          とする)

4.変数選択法[1] 説明変数選択の注意点 目的変数と相関の高い変数を選ぶ 説明変数相互で相関の高いものは、いずれかの変数を除外する マルチコ(多重共線性)の原因 説明変数の候補の中から、変数を選択して重回帰式を求める方法    A.分析者自身が変数を選択する方法  ・・・・・・・・一般的な重回帰分析    B.ある基準を設け、これとの大小関係から             自動的に変数を選択させる方法 ・・・変数選択法

変数選択法[2] 変数選択法(各偏回帰係数に対応するF値と、あらかじめ設定した           F-in・F-outの値とを比較して、当該変数の取り込み・除外を行う) 変数増加法 : 変数が1つも含まれていないモデルから出発し、 変数を一つずつ増加させて、変数選択を行う 変数減少法 : 説明変数全部を用いたモデルから出発し、                  変数を1つずつ減少させ、変数選択を行う 変数増減法 : 増加法と減少法との問題点(増加法では1度採用された           変数は落とされない、減少法では1度落とされた変数は           採用されることが無い)を改良した方法

5.重回帰分析における1つの工夫 重回帰分析 説明変数が多くなるとマルチコが起こりやすくなる 変数選択を厳しくすると説明変数の数が3~4個となり重回帰分析の本来の意味をなさない 重回帰分析 「説明変数の数を多くとってもマルチコ現象が起こらない重回帰分析」 主成分への回帰    説明変数に主成分分析を適用し、相互に相関の無い固有ベクトルで表す    求められた固有ベクトルとサンプルデータから、主成分得点を算出    目的変数と主成分得点の重回帰分析を行う    重回帰分析の偏回帰係数と固有ベクトルとの積和により係数を求める 短回帰の合成    p個の説明変数各々について単回帰分析を行う。それを合成して  重回帰式を作る    残差平方和  を求め、最小2乗法により係数を求める    求めた係数により回帰式の係数を求める