寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
寺尾 敦 青山学院大学社会情報学部 R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2009年度.
実証分析の手順 経済データ解析 2011年度.
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
重回帰分析入門 経済データ解析 2011年度.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
確率・統計Ⅱ 第7回.
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
12月4日 伊藤 早紀 重回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
相関分析.
データ解析 静岡大学工学部 安藤和敏
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
最小自乗法.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
部分的最小二乗回帰 Partial Least Squares Regression PLS
社会統計 第11回 多重分割表分析の論理(第10章)
分散分析、判別分析、因子分析.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
データ解析 静岡大学工学部 安藤和敏
クロス表とχ2検定.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
相関分析 2次元データと散布図 共分散 相関係数.
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
プログラミング論 相関
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

11.2.7. 独立変数が2つの場合の 偏相関 Y と Xj の偏相関係数(partial correlation):Xi を統制した場合の,Y と Xj の相関係数. Y と Xj の変動それぞれから,Xi で説明できる変動を除去した後の, Y と Xj の相関

θ 竹内啓・柳井晴夫『多変量解析の基礎』(東洋経済新報社)p.75

Y と Xj の偏相関係数は,重回帰分析における Xj の偏回帰係数とよく似ている. 符号は同じ 数値は近いことが多い 偏相関係数: 標準偏回帰係数:

11.3. 独立変数が3つ以上の 重回帰分析 説明変数(独立変数)の数が3つ以上のときの,回帰モデルと予測式 11.3. 独立変数が3つ以上の 重回帰分析 説明変数(独立変数)の数が3つ以上のときの,回帰モデルと予測式 傾き α と偏回帰係数 βj を,最小2乗法によって,標本から推定する. 偏回帰係数 βj は,他の k-1 個の独立変数を統制したときの,従属変数に対する変数 Xj の影響をあらわす.

11.3.1. 独立変数が3つ以上の場合の決定係数の検定 帰無仮説:母集団での決定係数はゼロ(すべての偏回帰係数がゼロ) 11.3.1. 独立変数が3つ以上の場合の決定係数の検定 帰無仮説:母集団での決定係数はゼロ(すべての偏回帰係数がゼロ) 回帰の自由度が k,誤差の自由度がN-k-1,全体の自由度が N-1

練習問題 SSTOTAL = SSREGRESSION + SSERROR という関係式を数式(平方和の分解)で書け. それぞれの項の自由度も示せ. 自由度は負の数にならない.このことから,N はいくつ以上でなければならないか?

11.3.2. 独立変数が3つ以上の場合の回帰係数の検定 偏回帰係数それぞれについて,母集団値がゼロという帰無仮説を検定する. 11.3.2. 独立変数が3つ以上の場合の回帰係数の検定 偏回帰係数それぞれについて,母集団値がゼロという帰無仮説を検定する. 母集団での偏回帰係数の推定値を,その推定量の標準誤差(標準偏差)で割って「標準化」すると,帰無仮説が正しいとき,この統計量は自由度 N-k-1 の t 分布に従う.

多重共線性(multicollinearlity):ある独立変数が,他の独立変数から(ほとんど)構成できてしまうこと. 独立変数が2つの場合は,独立変数間の相関が非常に高いこと. 多重共線性が生じた場合,偏回帰係数の標準誤差が大きくなる. データをとりなおすと,偏回帰係数がかなり異なることがある.決定係数の変動も大きくなる.

多重共線性を検出する方法はいくつかある.簡単に実行できる方法は,変数間の相関行列を見て,非常に高い相関係数がないかを調べること. 高い相関係数を示す2変数は,一方だけを回帰分析に使用するか,合成する.

市川の「驚愕」重相関係数 従属変数との相関がゼロの 独立変数(X1)と,相関が ほぼゼロの独立変数(X2)から, 非常に高い決定係数が 得られることがある. 独立変数の値が少し変わるだけで, これらの張る平面が大きく変化する ことに注意.

11.3.3. 例示:性的寛容性に対する 性別の影響の検討 11.3.3. 例示:性的寛容性に対する 性別の影響の検討 伝統的に,女性は男性よりも家族に密接に結びついている(良妻賢母が期待される).そのため,性的寛容性には男女差があるかもしれない. P3:女性の性的寛容性は男性よりも小さい H3:女性の性的寛容性指数の得点は男性よりも低い. 性的寛容性指数:婚前性交,婚外性交,同性愛に対する態度得点から合成される指数

女性=1,男性=0という2値変数を,第3の独立変数 X3 として導入する. 得られた回帰式: 他の変数が一定のとき,女性であることにより,性寛容性指数(Y)は0.039上昇する.ただし,この係数は有意ではない(テキスト参照).

11.4. ダミー変数を用いた回帰分析 ダミー変数(dummy variable):ある属性の値が「存在」の場合に1,「存在しない」の場合に0をわりあてる変数. 例:女性ならば1,男性ならば0 カテゴリが J 個あれば,J-1 個のダミー変数で,各個体(データを提供した個人)の反応カテゴリを表すことができる.

信仰する宗教の質問項目(アイテム) コード化 プロテスタント カトリック ユダヤ それ以外 D1:プロテスタントならば1,それ以外は0

この人は「その他」カテゴリに属することがわかる. ダミー変数は4つでなく3つでよい. 2つ以上のカテゴリに1が入ることはない. プロテスタント カトリック ユダヤ 個人1 1 個人2 個人3 個人4 この人は「その他」カテゴリに属することがわかる. ダミー変数は4つでなく3つでよい. 2つ以上のカテゴリに1が入ることはない.

第3の独立変数がダミー変数であるときの予測式: カテゴリが3つ以上あるアイテムでは,複数(カテゴリ数より1少ない)のダミー変数が予測式に含まれる.

11.4.1. 交互作用の検定 2つの独立変数間の交互作用は,それら2つの独立変数を掛け合わせた積の項を回帰モデルに含めることで検討できる. 11.4.1. 交互作用の検定 2つの独立変数間の交互作用は,それら2つの独立変数を掛け合わせた積の項を回帰モデルに含めることで検討できる. 少なくとも一方の変数はダミー変数であるとする.(そうでない場合は話が難しくなるので扱わない) 量的変数 X1(たとえば,年齢)と,ダミー変数 D2(たとえば,性別)の交互作用を検討するには,

男性(D2=0): 女性(D2=1): 性と年齢の交互作用は,傾きの違いに反映される.(テキストp.326 図11.4) 性の主効果(男性と女性の差)は,交互作用がなければ(β12=0),切片の違いに反映される. → 共分散分析(analysis of covariance)

交互作用の有無を検討するために,交互作用項を含まない予測式(独立変数の個数はk1)での決定係数(R12)に比べて,交互作用項を加えた予測式(独立変数の個数はk2)での決定係数(R22)が上昇したかどうかを検定する.

交互作用が有意でなければ,男性での回帰直線と,女性での回帰直線の傾きは同じであると考えられる(正確には,「異なるとは言えない」). 性的寛容性 男性 女性 年齢

理解確認のポイント 偏相関係数とは何か,説明できますか? 偏相関係数を計算することができますか? 定義式は覚えなくてもよい 重回帰分析のモデル式を書くことができますか? 偏回帰係数の意味を説明できますか? 他の変数の値を一定に保ち,その変数の値を1単位だけ増加させたときの,目的変数の値の変化.

決定係数の定義式を書き,その意味を説明できますか? データが与えられたとき,決定係数の有意性検定を実行できますか? 回帰モデルのパラメータを求める 予測値を計算する 目的変数 Y の,平均からの平方和を分解する 平方和を自由度で割る F 統計量を計算する

データが与えられたとき,偏回帰係数の有意性検定を実行できますか? 偏回帰係数の標準誤差は,ソフトウェアが与えてくれるものとする. データが与えられたとき,偏回帰係数の信頼区間を構成できますか?

多重共線性とは何か,説明できますか? 多重共線性が生じていないかどうか,簡単にチェックする方法を知っていますか? 多重共線性が疑われるときには,どのような対処をするべきかわかりますか?

ダミー変数を用いて,J 個のカテゴリがある質的変数への反応をコード化し,重回帰分析に組み込むことができますか? ダミー変数とは何か,説明できますか? ダミー変数を用いて,J 個のカテゴリがある質的変数への反応をコード化し,重回帰分析に組み込むことができますか? 交互作用を検討するための,重回帰モデルの式を書くことができますか? 一方は量的変数,もう一方はダミー変数とします.

ダミー変数を用いて,交互作用を表す項をモデルに入れたとき,これは2つの予測式を得ることになります.これはなぜか説明できますか? 交互作用は,2つの予測式での,何の違いとなりますか? 交互作用がなければ,ダミー変数で表されたカテゴリの違いは,2つの予測式での何に反映されますか?