寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
グラフィカル多変量解析 ----目で見る共分散構造分析----
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
重回帰分析入門 経済データ解析 2009年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
12月4日 伊藤 早紀 重回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
離婚が出生数に与える影響 -都道府県データを用いた計量分析
相関分析.
データ解析 静岡大学工学部 安藤和敏
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
尺度化について 狩野 裕 大阪大学人間科学部.
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
社会統計 第11回 多重分割表分析の論理(第10章)
第3章補足2 多変量データの記述 統計学基礎 2010年度.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経営学研究科 M1年 学籍番号 speedster
データ解析 静岡大学工学部 安藤和敏
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析入門 経済データ解析 2011年度.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

イントロダクション 単回帰分析:ひとつの独立変数(説明変数)から,ひとつの従属変数(目的変数)を説明する. 重回帰分析(multiple regression analysis):複数の独立変数から,ひとつの従属変数を説明する.

11.1. 例示:性的寛容性の説明 家族社会学者アイラ・ライス(Ira Reiss)による,性的寛容性に関する理論:ある集団が自律的で自由な求愛方法を持つほど,性に対して寛容になる可能性が高くなる. 社会統制制度からの自立を促す要因は,性的寛容性を高める. P1:信仰心が篤いほど,性に対して寛容でなくなる. P2:教育達成が高いほど,性に対して寛容になる.

従属変数である性的寛容性は,3つの観測変数から合成する. 独立変数である信仰心と教育達成はそれぞれ,週あたりの教会への参列日数と,教育を受けた年数で測定する. H1:教会へ参列する頻度が多いほど,性に対する寛容性が小さくなる. H2:教育年数が長いほど,性に対する寛容性が大きくなる.

性的寛容性の指数(index):以下の3つの項目(表11.1)に対する反応を個人ごとに合計して3で割ったもの. 婚前性交 婚外性交 同性愛 指数:ある潜在的な構成概念(construct)を反映すると仮定されるいくつかの変数を合成した変数.

指標(indicators):潜在変数を反映.観察される. 性的寛容性(Y) 参考:因子分析 婚前性交 婚外性交 同性愛 指標(indicators):潜在変数を反映.観察される.

コラム11.1 指数構成法入門 社会科学者や心理学者は,構成概念を用いて観察結果を説明することがよくある. コラム11.1 指数構成法入門 社会科学者や心理学者は,構成概念を用いて観察結果を説明することがよくある. 知能(知能指数として測定) 宗教性 構成概念が実在するのかは,本当はわからない. しかし,構成概念を用いれば,簡潔で論理的に観察結果を説明できる.

1組の指標があるひとつの構成概念を反映しているならば,指標となった項目間には高い相関がなければならない. 項目間の相関が一定であるとすれば,指標となる項目数が多いほど,それらから構成される指数の信頼性は高まる. テストの項目が多くなれば,その結果は偶然の要素が小さく,真の実力を反映している. 信頼性:測定の安定性.測定を繰り返したときに測定値が大きく変動しない.

指数を構成する各項目間の平均的な相関(内部一貫性)と,項目数(k)から,信頼性の推定値を得ることができる. クロンバックのα(Chronbach’s alpha) 各項目が測定している「同じもの」が,意図した構成概念であるかどうかは,別の問題(妥当性の問題).

11.2. 3変量回帰モデル 重回帰モデルでも,単回帰モデルと同様に,従属変数は独立変数と線形関係にあると仮定される. 回帰モデル: 11.2. 3変量回帰モデル 重回帰モデルでも,単回帰モデルと同様に,従属変数は独立変数と線形関係にあると仮定される. 回帰モデル: 予測式: モデルの母数(切片 α,および,2つのβ)を推定するのに,最小二乗法を用いる.

母数(切片および傾き)の推定値

テキストの例題での,切片と偏回帰係数:

すべての変数の標本平均および標準偏差と,すべての変数間の相関係数がわかれば,すべてのパラメータを推定することができる. 回帰分析を行うときには,これら統計量を報告するとよい. 変数間の相関係数は,相関行列として示すとよい.(表11.2)

データに欠損値がある場合の扱い: 全変数についての削除(listwise deletion):欠損値のある測定対象(個体)を,まるごと除外 変数の対ごとの削除(pairwise deletion):相関係数を計算する機会ごと,いずれかの変数に欠損がある測定対象を除外.X1 が欠損である個体は,X2 と Y の相関の計算には含められることに注意.

あまりに多くのデータが失われない限り,一般には,全変数についての削除を行えばよい. 特定の測定対象が削除されていないか注意する. 例:ある項目で,女性に欠損値が多い.

11.2.1. 偏回帰係数の解釈 偏回帰係数(partial regression coefficient, b1および b2):他の独立変数の値を一定(従属変数に対する影響を一定)に保った場合に,ある独立変数の1単位あたりの変化が,従属変数をどの程度変化させるかを示す.

第1の独立変数(X1)を使って単回帰分析を行い,その後,第2の独立変数(X2)を追加することにする.

2つの独立変数が無相関ならば,回帰係数は単回帰分析のときと同じ値になる. 単回帰分析のときの回帰係数

重回帰分析での偏回帰係数は,その独立変数と従属変数との相関係数とは異なる.2変数の相関は正なのに,偏回帰係数が負になることもある. 単回帰分析では,回帰係数は,独立変数と従属変数の相関係数と考えることができた(変数を標準化すれば,回帰係数=相関係数).

Y X2 X1

予測値のベクトルは,従属変数のベクトルの,独立変数によって張られる平面への正射影である. 予測値は独立変数の線形結合. 予測値のベクトルを独立変数のベクトルから構成するとき,独立変数のベクトルを定数倍して伸縮させる.この定数が偏回帰係数.

Y X2 X1 単純相関と偏回帰係数の符号が一致しない例

11.2.2. 標準偏回帰係数 変数を標準化してから重回帰分析を行って得られる偏回帰係数を,標準偏回帰係数と呼ぶ.

標準偏回帰係数は,従属変数に対する,独立変数の影響力を,相対的に比較するのに役立つ.ただし,解釈にあたっては,「この独立変数の組み合わせでは」という条件を忘れないこと. 独立変数の組み合わせを変えたり,独立変数を追加したりすれば,標準偏回帰係数は変化する.

テキストの例題での,標準偏回帰係数: 信仰と教育達成では,信仰達成の方が,性的寛容性への影響が相対的に大きい.

11.2.3. 3変数の場合の決定係数 決定係数:従属変数の分散のうち,回帰によって説明できる分散の割合

重相関係数:従属変数の予測値と実測値の 相関係数 Y X2 θ X1

11.2.4. 独立変数が2つの場合の 決定係数の有意性検定 11.2.4. 独立変数が2つの場合の 決定係数の有意性検定 帰無仮説:母集団での決定係数はゼロ 回帰の自由度が2,誤差の自由度がN-3,全体の自由度がN-1

11.2.5. 偏回帰係数の有意性検定 単回帰分析では,偏回帰係数の有意性検定は,決定係数の検定を行うことと同じ. 11.2.5. 偏回帰係数の有意性検定 単回帰分析では,偏回帰係数の有意性検定は,決定係数の検定を行うことと同じ. 重回帰分析では,偏回帰係数それぞれについて,母集団値がゼロという帰無仮説を検定する. 母集団値がゼロならば,その変数を独立変数として組み入れる必要がない.ただし,変数の組み合わせの問題である(モデルに投入する変数が異なれば,偏回帰係数も異なる)ことを忘れずに.

母集団での偏回帰係数の推定値(b1およびb2)を,その推定量の標準偏差で割って「標準化」すると,帰無仮説が正しいとき,この統計量は自由度 N-3 の t 分布に従う. (推定値) (推定値)

11.2.6. 偏回帰係数の区間推定 自由度の大きな t 分布では, そこで,次の区間は,偏回帰係数の99%信頼区間となる.

理解確認のポイント 社会学や心理学での構成概念はどのように測定されるか,説明できますか? 重回帰分析のモデル式を書くことができますか? 偏回帰係数の意味を説明できますか? 他の変数の値を一定に保ち,その変数の値を1単位だけ増加させたときの,目的変数の値の変化.

重回帰分析での偏回帰係数は,一般に単回帰分析での回帰係数と一致しません.一致するのはどのような場合か,わかりますか? 偏回帰係数は相関係数とも異なります. 標準偏回帰係数に基づいて,従属変数に対する,独立変数の相対的影響の大きさを議論することができますか?

決定係数の定義式を書き,その意味を説明できますか? 単回帰分析の場合と同じ 重相関係数との関係は? データが与えられたとき,決定係数の有意性検定を実行できますか?

データが与えられたとき,偏回帰係数の有意性検定を実行できますか? 偏回帰係数の標準誤差を推定する式は覚えなくてよい. データが与えられたとき,偏回帰係数の信頼区間を構成できますか?