社会統計 第11回 多重分割表分析の論理(第10章)

Slides:



Advertisements
Similar presentations
分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
Advertisements

2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
分散分析マスターへの道.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
実証分析の手順 経済データ解析 2011年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
確率・統計Ⅱ 第7回.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
因果関係3原則 2009年月曜日・3時限 社会理論と調査法.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
12月4日 伊藤 早紀 重回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
相関分析.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
再討論 狩野裕 (大阪大学人間科学部).
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
コードクローンの理解支援を目的としたコードクローン周辺コードの解析
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
要因Aの差,要因Bの差を見たい 2つの要因なので二元配置分散分析の適用 要因B 水準A 水準B 水準C 要因A 水準a
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

社会統計 第11回 多重分割表分析の論理(第10章) 社会統計 第11回 多重分割表分析の論理(第10章) 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

イントロダクション ここまでは,主に,2変数間の関係を検討してきた 2変数の分割表 1要因分散分析 第10章と第11章では,3変数以上の関係を検討する.多変量解析(multivariate analysis) 多重分割表(multivariate contingency table) 重回帰分析(multiple regression analysis)

10.1 . 付加変数の統制 イギリスでは,コウノトリの多い地域では,出生率が高い.コウノトリが赤ちゃんを連れてくるのだろうか? イギリスでは,コウノトリの多い地域では,出生率が高い.コウノトリが赤ちゃんを連れてくるのだろうか?  参考:太郎丸『カテゴリカル・データ解析入門』第6章 10.1.1節では,イギリスではなくオランダとしている. X と Y に共変動(covariation)が見られても,それは直ちに因果関係の存在を意味しない. X が Y に影響(間に Z を媒介する場合も含む) Y が X に影響 第3の変数 Z が X と Y の両方に影響

都市化が進むと,コウノトリの数は少なくなり,出生率も下がる. 都市化の程度 出生率

コウノトリの数と出生率の間に因果関係がまったく存在しないことは,常識的に明らか. これは明らかに,みかけの共変動 一般に,2変数間の関係を明確化するために,この関係に混入しうる第3の変数の影響を統制する必要がある.

2変数の真の関係を明確にするために,他の変数(Z)の影響を統制したい. 2変数間の真の共変動がどれだけあるかを確かめるには,みかけ上の共変動から他変数に起因する部分を除去する必要がある. 実験における変数の統制 恒常化:どの条件においても,変数の影響を一定にする 無作為化:変数の影響をランダムにする.

調査研究では,実験のような変数統制ができないことがほとんど. 研究対象となる人あるいはものの属性を,研究者が物理的に操作できない. 2変数の関係に影響すると考えられる付加変数を確定し,その付加変数を測定し,統計的操作によって付加変数の影響を統制する.

2変数関係に影響する要因のすべてを識別して分析に加えることは不可能. したがって,付加変数として何を取り上げるかを決めるために,理論が極めて重要となる.

2変数間関係に他変数が混入するパターン 疑似関係(疑似相関) 媒介関係 複合因果

10.1.1. 疑似関係 疑似関係(spuriousness):2変数 X と Y の共通原因となっている別の変数 Z が存在するために,2変数 X と Y の間に相関関係(疑似相関,spurious correlation)が見られること. 例:コウノトリの数(X)と出生率(Y) 因果関係を主張するために必要なこと 時間的順序 理論的説明 疑似相関の検討

興味ある2変数間に因果関係はないが,共通する原因変数が2変数間に共変動をもたらしている場合,その共通原因の影響を統計的に一定に保つことによって,見かけ上の共変動を除去できる. 統計的統制を行っても共変動関係が残れば,2変数間に因果関係が存在する可能性は高くなる.

10.1.2. 媒介関係 媒介関係(intervening relation):独立変数と従属変数を媒介する変数が存在する関係. X Z Y 10.1.2. 媒介関係 媒介関係(intervening relation):独立変数と従属変数を媒介する変数が存在する関係. 例:年齢(X)と道徳的保守性(Y)を信仰の強さ(Z)が媒介.信仰の強さを一定にすれば(たとえば,信仰の程度が同程度の人を集めれば),年齢と道徳的保守性の共変動は小さくなる. X Z Y 媒介関係

直接効果と間接効果 直接効果 Y X 間接効果 Z 安田三郎『社会統計学』p.103 直接効果がなくても,X と Y の相関を疑似相関とは言わない.間接的とはいえ,因果関係が存在するから.

媒介関係と疑似関係 X Y X Y Z Z

疑似関係と媒介関係は,第3の変数の影響を一定に保ったときに興味ある2変数の共変動関係が小さくなるという点において同じ. しかし,関係の実質的意味は異なる. 疑似関係なのか媒介関係なのかは,統計分析からは決定できない.理論や,解釈のしやすさから決まる.

10.1.3. 複合因果 人間の行動が単一要因によるものだと断定する社会理論はほとんどない. 10.1.3. 複合因果 人間の行動が単一要因によるものだと断定する社会理論はほとんどない. 複合因果(multiple causation):原因となる変数が複数ある因果関係 興味ある従属変数に対して,複数の独立変数が持つ,複合的で同時的な関係を検討する.

検討されるもの 分析方法 独立変数(要因)の集合全体としての効果 疑似関係や媒介関係を統制したときの,独立変数それぞれの効果(相対的な重要性) 要因の組み合わせの効果(交互作用) 分析方法 多要因の分散分析 重回帰分析 多重分割表の分析(疑似関係,媒介関係の分析によく用いられる)

10.2. 2×2 表における 第3の変数の統制 多重クロス表:3変数以上の変数のクロス表 10.2. 2×2 表における 第3の変数の統制 多重クロス表:3変数以上の変数のクロス表 2変数間の関係がクロス表に整理されているとする.このとき,第3の変数の影響を検討するために,3重クロス表を用いる. 立体的な表を作ることは難しいので,第3の変数の値に応じて,2重クロス表を複数作成する. ここでは,どの変数も2値変数である場合を説明する. 2×2×2表

10.2.1. 仮想例:家族の信仰と 10代の性行動 零次の表(zero-order table):統制される変数がない分割表 信仰の強さと婚前性交の間に相関関係 家族は信仰深い? 計 いいえ [0] はい [1] 婚前性交 ある [1] 39.1% 16.0% 27.1% ない [0] 60.9% 84.0% 72.9% 100% (92) 100% (100) 100% (192) ファイ係数:φ = -0.26

家族の信仰と婚前性交との関係に,何らかの第3の変数は存在するか? 性体験を促す機会が頻繁にあるかどうかが,婚前性交の有無に影響するのでは? 信仰深い家庭は,行動への束縛が強く,そうした機会が少ないのでは? 自動車を日常的に使用しているかどうかを,第3の変数として検討してみてはどうだろうか.

第3の変数の影響を検討するために,1次の表(first-order table)を作る. 第3の変数のカテゴリごとに,興味ある2変数のクロス表を作成する. 次数は統制される変数の数を表す. これにより,第3の変数の影響を一定にして(第3の変数の影響が同じ部分ごとに),興味ある2変数間の関係を検討できる.

10.2.2. 第3変数に効果がない場合 1次の表(下位表)で認められる関係が,零次の表で認められる関係と変わらなかったとする(次のスライド).このとき,第3の変数は(零次の表での)共変動に効果を持たない. 条件つき相関係数(conditional correlation coefficient):第3の変数ごとに作った分割表(下位表)におけるファイ係数.これらの値はほぼ同じで,零次の表でのファイ係数と変わらない. オッズ比も変化していない.(確かめてみよ)

ファイ係数:φ = -0.27 ファイ係数:φ = -0.25 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある 39.7% 15.9% 27.3% (36) ない 60.3% 84.1% 72.7% (96) 100% (63) 100% (69) 100% (132) ファイ係数:φ = -0.27 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 37.9% 16.1% 26.7% (16) ない 62.1% 83.9% 73.3% (44) 100% (29) 100% (31) 100% (60) ファイ係数:φ = -0.25

統制される変数(自動車の使用)と,興味ある2変数それぞれとのクロス集計表を作成してみる. 1次の表での周辺度数を使って作成できる. 信仰深い家庭では,そうでない家庭に比べ,自動車を自由に使用させているのか? 自動車を日常的に使用している若者は,そうでない若者に比べ,婚前性交の経験率が高いのか?

ファイ係数:φ = -0.006 ファイ係数:φ = -0.006 家族は信仰深い? 計 いいえ はい 自動車を使用? 31.5% (29) 31.0% (31) 31.25% 68.5% (63) 69.0% (69) 68.75% 100% (92) 100% (100) 100% (192) ファイ係数:φ = -0.006 自動車を使用? 計 いいえ はい 婚前性交 ある 27.3% (36) 26.7% (16) 27.1% ない 72.7% (96) 73.3% (44) 72.9% 100% (132) 100% (60) 100% (192) ファイ係数:φ = -0.006

10.2.3. 第3変数が部分的効果を 持つ場合 下位表において,興味ある2変数の関係は依然として認められるが,その関係の強さが弱くなったとする.(次のスライド) このとき,第3の変数は,2変数間の連関を部分的に説明する. 家族が信仰深くてもそうでなくても,自動車を使用することで,婚前性交の経験率が上昇する. 興味ある2変数の共変動関係は,弱くはなったが残っている.

ファイ係数:φ = -0.16 ファイ係数:φ = -0.17 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある 25.5% 12.9% 17.4% ない 74.5% 87.1% 82.6% 100% (47) 100% (85) 100% (132) ファイ係数:φ = -0.16 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 53.3% 33.3% 48.3% ない 46.7% 66.7% 51.7% 100% (45) 100% (15) 100% (60) ファイ係数:φ = -0.17

10.2.4. 第3の変数による完全な説明 2つの下位表におけるファイ係数がゼロ.つまり,第3の変数の影響を一定にすると,興味ある2変数間の関係が消失したとする. このとき,第3の変数は,興味ある2変数間の関係を完全に説明する. 家族の信仰は10代の若者が自家用自動車を日常的に使用できるかを規定し,自動車使用機会が婚前交渉の主要な決定因となる.

ファイ係数:φ = 0.00 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある 9.1% ない 90.9% 100% (44) 100% (88) 100% (132) ファイ係数:φ = 0.00 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 66.7% ない 33.3% 100% (48) 100% (12) 100% (60) ファイ係数:φ = 0.00

練習問題 第3変数の効果がない場合の表をつくりかえたように,第3変数による完全な説明が成り立つ場合の表を作り変えよ(テキスト表10.4を作り変える).2つの下位表の周辺度数を用いればできる.ファイ係数も計算してみよ. 信仰と自動車使用機会の表 自動車使用機会と婚前性交の表

ファイ係数:φ = -0.43 ファイ係数:φ = 0.60 家族は信仰深い? 計 いいえ はい 自動車を使用? 52.2% 12.0% 31.25% 47.8% 88.0% 68.75% 100% (92) 100% (100) ファイ係数:φ = -0.43 自動車を使用? 計 いいえ はい 婚前性交 ある 9.1% 66.7% 27.1% ない 90.9% 33.3% 72.9% 100% (132) 100% (60) 100% (192) ファイ係数:φ = 0.60

周辺度数分布において,X と Z,および,Z と Y に関連があるために, X と Y の間に関連が現れた. 周辺度数による elaboration(後述) X(家族の信仰)と Z(行動への束縛)の関連について,次のスライドを参照. 参考:安田三郎『社会統計学』p.101

ファイ係数:φ = 0.00 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある 9.1% ない 90.9% 100% (44) 100% (88) 100% (132) ファイ係数:φ = 0.00 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 66.7% ない 33.3% 100% (48) 100% (12) 100% (60) ファイ係数:φ = 0.00

第3の変数が,元の2変数(X,Y)のいずれともゼロでない相関を示すときだけ,この第3の変数を媒介変数として,もとの2変数の共変動を説明できる可能性がある. 一般には,2変数の相関が正なら,第3の変数とこれら2変数との相関はどちらも正か,あるいは,どちらも負.(そうでないこともありうる) 2変数の相関が負なら,第3の変数との相関は,一方が正で他方が負. (そうでないことも)

第3の変数による完全な説明は,媒介関係の場合だけでなく,2変数の相関が疑似関係であるときにも見られる. 第3の変数を媒介変数と考えるか,2変数の共通原因と考えるかは,理論や解釈のしやすさによる.統計的な結果からは決められない.

10.2.5. 第3変数の交互作用効果 がある場合 2つの下位表で連関の程度(ファイ係数,オッズ比)が大きく異なる. 零次の表と比べると,たとえば,一方の下位表では連関が減少し,もう一方の下位表では連関が増大する. 連関が逆方向(プラスとマイナス)になることもある. 交互作用効果(interaction effect):第3の変数の値によって,興味ある2変数の関係が異なる.

ファイ係数:φ = -0.42 ファイ係数:φ = 0.00 自動車を日常的に使用しない 家族は信仰深い? 計 いいえ はい 婚前性交 ある 50.0% 11.8% 28.3% (34) ない 88.2% 71.7% (86) 100% (52) 100% (68) 100% (120) ファイ係数:φ = -0.42 自動車を日常的に使用する 家族は信仰深い? 計 いいえ はい 婚前性交 ある 25.0% 25.0% (18) ない 75.0% 75.0% (54) 100% (40) 100% (32) 100% (72) ファイ係数:φ = 0.00

ファイ係数:φ = -0.12 ファイ係数:φ = -0.04 家族は信仰深い? 計 いいえ はい 自動車を使用? 43.5% 32.0% 37.5% 56.5% 68.0% 62.5% 100% (92) 100% (100) ファイ係数:φ = -0.12 自動車を使用? 計 いいえ はい 婚前性交 ある 28.3% 25.0% 27.1% ない 71.6% 75.0% 72.9% 100% (120) 100% (72) 100% (192) ファイ係数:φ = -0.04

3重クロス表を構成してみないと,交互作用効果の発見はできない. 2変数 X と Y の単純相関が,条件つき相関と,どのように,どれぐらい異なるのかは,3重クロス表を構成しなければわからない.

10.2.6. 条件つき効果のまとめ グラフを利用すると,3重クロス表から明らかになった関係が,よりわかりやすくなることが多い(テキスト p.239 ,図10.2) 2要因分散分析で学習した図と本質的に同じ.

第3の変数を導入して3重クロス集計を行い,関連の分析を深化させることを,elaboration と呼ぶ. 零次の表での関連が疑似相関かどうか 原因と結果の間を媒介する変数は何か どんな条件のもとで,零次の表での関連が明確になるか 安田三郎『社会統計学』2.4節

疑似相関を暴いて,零次の表での単純関連の見かけ性を説明するタイプの elaboration を,explanation と呼ぶ. 媒介関係の分析は,独立変数と従属変数の間の間接的な因果関係をより詳しく解釈することに役立つので,interpretation と呼ばれる. 注意:テキスト(p.284)では,explanation と interpretation の意味を区別していない.

交互作用効果を明らかにする elaboration は,specification と呼ばれる. 特に,第3の変数が独立変数 X と関連を持たない場合.たとえば,第3の変数が性別,独立変数が年齢の場合.

10.3. 偏相関係数 条件つき相関係数は,第3の変数 Z のカテゴリごとに,X と Y の相関係数を計算したもの. X と Y それぞれから Z と関連した部分を除去したときの,X と Y の相関.

偏相関係数(partial correlation):第3の変数を統制したときの,興味ある2変数間の相関係数. 3変数とも連続変数の場合に定義された式だが,これを離散変数間の相関にも適用する.

変数 X と Y の相関係数 [XY] は,いくつかの要素の,ある種の和である. [XY: z1]:第3の変数 Z のカテゴリが z1 であるときの,X と Y の条件つき相関係数.[XY:z2] も同様. [XZ]:X と Z の相関係数.[ZY] も同様. ここが偏相関係数 [XY: Z]

通常の数式のように変形(移項)すると,以下の式が得られる.これは,偏相関の定義式で分母を無視した形である.

[XZ] および [ZY] の両方がゼロでないとき,疑似関係あるいは媒介関係による elaboration が可能になる.偏相関係数の値は,零次の表での単純相関 [XY] よりも小さな値になる.

[XZ] または [ZY] がゼロであるなら,偏相関係数の値は,零次の表での単純相関 [XY] と近い値になる.[ZY] = 0 とすると,

偏相関係数がゼロなら,[XY] は [XZ] と [ZX] の積に等しい.

テキスト(p. 294)では,交互作用効果がない場合に偏相関係数を計算できると書かれている. 実際には,交互作用効果の有無にかかわらず,偏相関係数を計算することができる. 定義式の右辺にある,3つの相関係数が計算できればよい.

ただし,交互作用があるときには,偏相関係数を計算することにあまり意味はない. 交互作用がないとき,2つの条件つき相関係数は似た値になるので(図10.2参照),これらをあわせて偏相関係数としている.

交互作用効果があると,X と Y の偏相関係数は,単純相関(零次の表での相関係数)と近い値になることが多い. 家族の信仰深さと婚前性交の例では,単純相関は -0.26 であり,偏相関は -0.27 となる. 偏相関係数だけ見ても,Z が無効果の場合(偏相関係数は単純相関と一致)と区別できない.

偏相関係数は3つの単純相関([XY], [XZ], [ZY])から計算する.これら3つの相関を示すクロス表からは,詳細な関係(たとえば,交互作用効果)はわからなかったことに注意.偏相関係数を計算するだけでなく,必ず3重クロス表を検討するべきである.

10.3.1. 例示:3変数間相関 外に飲みに行った経験(X)と,婚前性交への態度(Y)とのクロス表 ファイ係数:φ = -0.371 計 ない ある 婚前性交 悪い 55.2% 19.3% 37.2% 悪くない 44.8% 88.2% 71.7% 100% (774) 100% (781) 100% (1,555) ファイ係数:φ = -0.371 1983年GSS調査より

家庭外で飲酒した経験がある者は,そうでない者に比べ,婚前性交を悪くないと考える. 「経験がない者は悪いと考える」と言ってもよい これら2変数の両方に相関を持つ変数として,性別(Z)が考えられる. 女性は,家庭外での飲酒と,婚前性交の両方に,あまり寛容ではないだろう. 性別を共通原因とする疑似相関ではないのか?

性別(Z)と,婚前性交への態度(Y)とのクロス表 計 男 女 婚前性交 悪い 30.0% 42.6% 37.2% 悪くない 70.0% 57.2% 62.8% 100% (669) 100% (866) 100% (1,555) ファイ係数:φ = 0.128 1983年GSS調査より

10.3.1. 例示:3変数間相関 性別(Z)と,外に飲みに行った経験(X)とのクロス表 ファイ係数:φ = -0.190 性別 計 男 女 ある 61.1% 42.0% 50.2% ない 38.9% 58.0% 49.8% 100% (774) 100% (781) 100% (1,555) ファイ係数:φ = -0.190 1983年GSS調査より

偏相関係数を計算すると, これは X と Y の単純相関(-0.371)よりも低いが,その差はわずか.性別による elaboration はうまくいかない.

性別が共通原因である疑似相関を疑ったが,2変数 X と Y に対して性別(Z)はあまり影響しておらず,偏相関は単純相関と少ししか違わなかった. 偏相関係数を説明するための例だったので,3重クロス表の構成は行っていない.もちろん,実際の分析では3重クロス表を構成するべきである.

10.3.2. 偏相関係数の有意性検定 第3の変数による統制を行っても,興味ある2変数間には相関が存在する(つまり,母集団での偏相関係数はゼロではない)と言えるか? 帰無仮説 H0:母集団での偏相関係数は0 対立仮説 H1:母集団での偏相関係数は0ではない(両側検定の対立仮説) 注意:テキストでは,外に飲みに行った経験があると婚前性交に対して寛容になると考えて,対立仮説を片側にしている.

検定統計量

理解確認のポイント 第3の変数 Z による,(X と Y の)疑似関係とは何か,説明できますか? 多重クロス表を構成する目的を説明できますか?

多重クロス表を構成することができますか? 零次の表 1次の表 条件つき相関係数から,媒介関係あるいは疑似関係を明らかにすることができますか? 条件つき相関係数から,交互作用効果を見つけることができますか?

偏相関係数とは何か,説明できますか? 偏相関係数を計算することができますか? 定義式は覚えなくてもよい. 第3の変数 Z による媒介関係あるいは疑似関係が存在する場合,X と Y の偏相関係数は,零次の表での相関係数と比べて,どのように変化しますか?