平均構造モデル・多母集団の同時分析 実験データの分析 潜在曲線モデル 第3章 共分散構造分析で何ができる:応用編 平均構造モデル・多母集団の同時分析 実験データの分析 潜在曲線モデル
AMOSマニュアル 例9&例16 EQSマニュアル 第9章 狩野(1997/3) BASIC 数学 3.1節 平均構造モデルと多母集団の同時分析 トレーニング効果の分析 出展:Sorbom(1978) AMOSマニュアル 例9&例16 EQSマニュアル 第9章 狩野(1997/3) BASIC 数学
データ:Olsson(1973) コントロール群(n=105) 一回目のテスト 二回目のテスト 類似語 反対語 類似語 反対語 分散・共分散 37.626 24.933 34.680 26.639 24.236 32.013 23.649 27.760 23.565 33.443 平均 18.381 20.229 20.400 21.343 トレーニング群(n=108) 一回目のテスト 二回目のテスト 類似語 反対語 類似語 反対語 分散・共分散 50.084 42.373 49.872 40.760 36.094 51.237 37.343 40.396 39.890 53.641 平均 20.556 21.241 25.667 25.870
データの素性 語彙(同意語と反対語)に関するテストを 一ヶ月おいて2回繰り返し実施する トレーニング群には,2回のテスト間に, 語彙に関するトレーニングを3回行う コントロール群には何もしない
解析目的と留意点 目的 留意点 トレーニング効果の有無を検討したい 1回目のテストの練習効果を消す 2つの群への被験者割付のばらつきを 調整したい 2種のテストを同時に分析したい 次元縮小をしてから分析 希薄化を修正してから分析
平均の比較
平均構造モデル コントロール群の分析 練習効果の評価
基本モデルと推定結果 Chi-square=0 (df=0)
標準解 Chi-square=0 (df=0)
通常は(潜在変数の)平均は0に固定してある 0, 0, 0, 0, 18.38 20.23 20.40 21.34 0, 0, 0,
潜在変数の平均の意味 二回目のテストで平均が上昇しているのは一回目のテストがトレーニングになっているからである これを,語彙に関する力が(やや)ついたからだと解釈しよう つまり,E(post_verbal)>0 となったとして, この平均に関する推測を行う
潜在変数に平均を導入する 18.58 20.05 18.58 20.05 0, 1.68
テスト受験効果あり
因子平均と切片 平均 切片 因子平均 データ モデル pre_syn 18.38 18.58 = 18.58+1.00×0 pre_opp 20.23 20.05 = 20.05+0.90×0 post_syn 20.40 20.26 = 18.58+1.00×1.68 post_opp 21.34 21.48 = 20.05+0.85×1.68 切片:① データが採られた状況に依存する量 問題のレベル,採点の方法... ② 因子からの影響を受ける前の平均
多母集団の同時分析
多母集団の同時分析 トレーニング群とコントロール群を二つの母集団とみて分析する. 37.626 24.933 34.680 コントロール群(n=105) 一回目のテスト 二回目のテスト 類似語 反対語 類似語 反対語 分散・共分散 37.626 24.933 34.680 26.639 24.236 32.013 23.649 27.760 23.565 33.443 平均 18.381 20.229 20.400 21.343 トレーニング群(n=108) 一回目のテスト 二回目のテスト 類似語 反対語 類似語 反対語 分散・共分散 50.084 42.373 49.872 40.760 36.094 51.237 37.343 40.396 39.890 53.641 平均 20.556 21.241 25.667 25.870
個別分析:コントロール群
個別分析:トレーニング群
同時分析の手順 個別分析を行う 統計的検定により,群間のパラメータが 等しい(等置制約)かどうかを検討する 等置制約の無い最も制約のゆるいモデルからスタートし,徐々に制約の数を増やし,最後に全部のパラメータが等しいという 最も制約が強いモデルを検討する
モデルの検討
最終モデル:コントロール群
最終モデル:トレーニング群
平均構造の入れ方 個別分析では,観測変数の平均(切片項)をPREとPOSTで等置することにより,潜在変数 pre_verbal と post_verbal の平均間の比較が できるようになった 同時分析では,さらに,観測変数の平均(切片項)を群間で等置する 潜在変数 verbal の4つの平均が比較可能になる. E[pre_verbal_c]=0 とおくことで, E[pre_verbal_t], E[post_verbal_t], E[post_verbal_t] が推定できる
母集団の非均一性を調整した トレーニング効果 E[post_v] E[pre_v] トレーニング群(T)6.94 = 5.31+0.90 × 1.81 コントロール群(C)1.61 = 1.61+0.90 × 0 差 5.33 3.70
平均差3.70の意味 トレーニングによって,潜在変数 post_verbal の平均が 3.70 上昇する. 被験者の割付けの偏りを修正したもの 一回目のテストの受験効果を除いた純粋な効果 (一回目のテストを受けず)3回のトレーニングだけすると, post_verbal の平均が 3.70 上昇することが期待される テスト得点に関しては,synonyms は 3.70点,opposites は 3.70×0.89=3.29点 の上昇が見込める.
分析方法についてのまとめ 潜在変数(因子)の平均 平均構造モデル 同一の内容を測っている因子の平均は比較可能である.一方の平均を0とおく 男女間の比較など,多母集団の同時分析で因子平均の比較ができる 平均構造モデル 独立変数にはその変数の平均を,従属変数には切片項を設定する
分析方法についてのまとめ:続 多母集団の同時分析 複数の母集団間で似た構造が認められることがある 因果モデルが,どの程度母集団間で等置できるか 測定モデルの同等性,構造モデルの同等性を 検討する 母集団間で潜在変数平均が比較可能
簡便法
トレーニング効果の検定 簡便法 training を表すグループ変数(X5=0,1)を 分析に組み入れる 共分散行列の等質性の仮定が必要
データ
モデルと推定結果
分析結果のまとめ 簡便法からも,多母集団の同時分析と 同様の結論が得られるようである しかし,実は,群間で共分散行列が等質であるという仮定が必要である 多母集団の同時分析で,この仮定は偽であることが分かっている. このデータに対しては,簡便法は適切な分析とは言いがたい.
二値変数を含む解析について 二値変数が独立変数であるときは,それを連続な変数とみなして分析しても罪は重くない 群間で共分散行列が等質であるという仮定のチェックが必要 二値変数が従属変数であるときは,特殊な推定 方法が要求される LISREL,EQS,Mplus などのプログラムでは分析可能 2群のデータを合併して分析するときは,群を0,1で表した変数Xを導入し,この変数がどの様に他の変数に効くかをモデル化して分析する必要あり 合併したデータを上記Xを入れずに分析するのはマズイ
実験データの分析について 共分散構造分析で実験データの分析を することができる 代表的な分析方法が,多母集団の同時 分析である. 実験条件を0,1の記号で表し分析する 簡便法もある 共分散行列の等質性 比較する群が多いときには,簡便法しか 適用できないことがある
3.2節 実験データの分析 顧客満足度データの分析 出展:Churchill and Surprenant (1982 JMR) An investigation into the determinants of customer satisfaction 「菊の花」 の満足度を測定する
CSの基礎理論 期待度 顧客満足度 (知覚された) 不一致度 (知覚された) パフォーマンス 不一致度(disconfirmation) 期待度とパフォーマンスの差 MRでの定訳は不確認
実験の手順と被験者の割付 2要因,各3水準の実験データ
期待度の操作(例) 3つの刺激文の中から一つを提示する 期待度を高める刺激: 「菊の花」はよろしいで.なんというても心が和むわ.自分で育てるのはムズイけど,売ってんのは花数も多いし立派で形もきれいや. 期待度をそこそこにする刺激: 期待度を低める刺激: 「菊の花」なんて 自分で育てるのは難しいし,売ってんのは花数が少ないしちっこい.買うんやったら,やっぱり菊よりバラやカーネーションやな.
パフォーマンスの操作
簡便法での分析 多母集団の同時分析は実行しにくい 2要因で各要因が3水準 9つの母集団の比較.......多すぎる 各母集団における標本サイズは20.... ...小さすぎる 簡便法 実験水準を1,2,3 (or -1,0,1) で表し,これを普通のデータとみなして分析 分析結果は因果の構造と平均の構造の 両方を表す
モデルと分析結果
潜在変数の平均 平均の計算例(3番目のF3) 0.98=(-1)*(-0.35+0.84*0.04+0.84*0.44*0.22) +(+1)(0.64+0.47*0.22)
「実験データの分析」のまとめ 実験データの分析とは複数個の母集団の比較である 母集団の数が少なければ「多母集団の同時分析」を行う 普通は,母集団ごとに平均は異なるが,共分散構造は同一であるという設定で分析する(簡便法) パス図は,普通の共分散構造分析と同様に因果関係を示すが,平均構造をも表す
3.3節 潜在曲線モデル アルコールデータの分析 出展:Curran, P. J. (1999). A latent curve framework for the study of development trajectories in adolescent substance use
データ
全体平均の推移
個人のプロフィール
潜在変数モデルへ
属性による違い
属性の違いを取り込んだモデル
属性の違いを取り込んだモデル:解説 属性によって系統的にβ0やβ1が影響を受けることがある β0とβ1をその属性に回帰するのは自然 平均構造モデルで解析する α0,α1 は切片項 E[性別]は“性別” の平均 β0とβ1の相関は,この属性だけでは 完全に説明できない可能性あり D1とD2間に相関を許しておく 他にもβ0とβ1に影響する変数もあり得る
実際の分析モデル1
因果の方向を探る 因果の大きさを正確に測定する 第4章 因果分析について 因果の方向を探る 因果の大きさを正確に測定する
因果推論 因果の方向を如何に探るか 因果の大きさを如何に正確に (バイアスなく)測るか 同値モデル,操作変数法,共分散選択 第三変数の影響,共変量選択(バックドア規準)
相関係数から因果の方向は決まらない ---同値モデルの問題--- 相関構造 データから区別できないモデルを同値モデルという 「区別できない」とは適合度が同一であることをいう
同値モデル例
因果の方向を決める: 操作変数法(Instrumental variable method) 相関構造 相関構造
操作変数法とは X,Yのいずれかに影響を及ぼし,他方への直接効果をもたない変数Z(操作変数)を観測する. X,Y,Zの相関構造から,X→Y or Y←X を判断する. 操作変数の適切さが検討できる.
双方向因果モデル(非逐次モデル)
ひとつの例 出展: AMOSマニュアル
共分散構造分析による因果の決定 対立モデルが同値モデルにならないようにする. そのための一つの方法が操作変数の導入. 因果を決定したか? X→Y,X←Y,X←→Yのいずれかであるという仮定の下で,どれがデータに矛盾しないかを決定しているにすぎない.つまり,「因果関係にない」という可能性を排除していない. 「X→Y」が分かっても,「XはYの“主要な”原因であるとは言いきれない.R2の大きさに注意すべきである.R2=0.1でもモデルは適合する(モデルの適合度とR2は別概念).このような場合,XはYの原因のごく一部である.
第三変数(未分析変数)の影響 観察データ分析の最大の ウィークポイント 因果の大きさを正確に測定する 第三変数(未分析変数)の影響 観察データ分析の最大の ウィークポイント
観察研究と実験研究 実験研究 観察研究 原因系の変数に水準を設定し,水準ごとに 無作為化を行いデータを採取する 水準の恣意性に問題 第三変数(未分析変数)の影響をシャットアウト 観察研究 無作為に被験者を抽出して全変数を観測する 第三変数(未分析変数)の影響
第三変数の影響 観察研究にはバイアスが生じる Y × × × × × × X 実験研究にはバイアスが生じない Y × × × × × × X
第三変数の影響:例
因果方向決定にも影響 誤ってY→Xと結論してしまう
適合度による 第三変数の影響の検出 検出可能な例 モデル 真の状況1 真の状況2
「因果分析」のまとめ 共分散構造分析は,観察研究の弱点である第三変数の影響を受ける. 状況によっては、適合度の悪化により第三変数による影響を疑うことができよう. モデル構築の段階で,因果仮説を十分に吟味し,重要な影響を与える変数を分析から落とさないようにする. データを採る前が大事 因果の方向に興味があるときは,操作変数法などを用いて,対立モデルを識別できるようにしたモデル構成を行う.
応用編終了です お疲れさまでした 早く飲みたい!
予稿集訂正: 参考文献の出版年,巻,ページにタイプミスが ありました Bollen, K. A., & Paxton, P. (1998). 5, 267-293. Bullock, H. E., Harlow, L. L., & Mulaik, S. A. (1994). 1, 253-267 Chou, C. P., Bentler, P. M., & Pentz, M. A. (1998). 5, 247-266. McArdle, J. J., & McDonald, R. P. (1984). 37, 234-251.
以下第3章・第4章の 参考スライド
質問項目 その1 期待度1 花の色 美しい....美しくない (7項目) 花の数 多い....少ない 期待度1 花の色 美しい....美しくない (7項目) 花の数 多い....少ない 期待度2 全体的評価 すばらしい....よくない パフォ1 花の色 優れている....劣っている (7項目) 花の数 多い....少ない パフォ2 全体的評価 すばらしい....よくない 不一致度1 私が期待していた花の数は (10項目) 多すぎた...正確であった...少なすぎた 不一致度2 私の全体的評価に関する期待度は 高すぎた...正確であった...低すぎた 提示された花は私が想定していたよりも少ない 提示された花は私が想定していたとおり 提示された花は私が想定していたよりも多い 提示された花は私が想定していたよりも悪い 提示された花は私が想定していたとおり 提示された花は私が想定していたよりも良い
質問項目 その2 注: 分析には満足度1,2を用いた 満足度1 花の数は十分多い (10項目) 大いに賛成である.....まったく反対である 満足度1 花の数は十分多い (10項目) 大いに賛成である.....まったく反対である 満足度2 これぐらいの花の数は (10項目) 好きだ....どちらでもない....嫌いだ 満足度3 全体的評価 おおいに満足.......おおいに不満足 満足度4 全体的評価 顔から選ぶ 満足度5 購入可能性(%) 0 50 100 注: 分析には満足度1,2を用いた
コントロールがうまくいっているか
平均が異なる母集団を合併して分析するには 異なる平均をモデル化して分析する 母集団を表す(ダミー)変数を独立変数に配して,どの変数の平均に影響するかを検討する ダミー変数間には相関を設定しておく 「平均が異なる」という情報を無視して,一つの 母集団と思って分析するのは間違い 「平均が異なる」という情報を無視すると観測変数の相関係数が大きくなり,分析結果はそれらしくなることがある.しかし,それは誤りである.要注意!!
例 単一母集団からのデータと見なせる場合 平均も因果モデルも 全属性に関して共通 男女で平均は異なるが,共通の因果モデル(共分散構造)が成立
例:つづき 男女で因子平均が異なるが,共通の因果モデル(共分散構造)が成立 属性(グループ)がたくさんある場合 属性間で因子平均が異なるが,共通の因果モデル(共分散構造)が成立
実際の分析モデル2