マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会
本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか? 従来の方法は何が不十分なのか? 階層的データ分析 階層的データ分析 本発表ではマルチレベル共分散構造分析 ( MCA )を紹介 本発表ではマルチレベル共分散構造分析 ( MCA )を紹介 HLM との比較などHLM との比較など
個人 - 集団データの階層性 データの階層性 データの階層性 集団ごとにネストされたデータ 集団ごとにネストされたデータ 集団ごとに共通した値が入力されるデータ 集団ごとに共通した値が入力されるデータ 集団内で類似したデータ 集団内で類似したデータ 学校 - 生徒、カップルデータ、反復測定データ・・・ etc 学校 - 生徒、カップルデータ、反復測定データ・・・ etc このようなデータを階層的データと呼ぶ
階層的データ 例:会話実験のデータ 集団で一致したデー タ 集団で類似したデー タ
◆従来の分析手法◆ これまでの階層データの扱い これまでの階層データの扱い サンプルを独立なものとして扱う サンプルを独立なものとして扱う 集団ごとに平均して集団数をサンプル数とす る 集団ごとに平均して集団数をサンプル数とす る 集団のうち、一人しか使わない 集団のうち、一人しか使わない 上記の方法の問題点 上記の方法の問題点 サンプルは独立ではない → 集団内で類似して いる サンプルは独立ではない → 集団内で類似して いる 平均値は純粋な集団の性質を反映しない 平均値は純粋な集団の性質を反映しない データがもったいない データがもったいない
集団で平均化されたデータ
従来の方法の問題 「サンプルの独立性仮定」の違反 「サンプルの独立性仮定」の違反 統計学は、サンプルが独立していることを仮 定 統計学は、サンプルが独立していることを仮 定 階層的データは、サンプルが独立していない 階層的データは、サンプルが独立していない つまり、情報量を多く見積もっている つまり、情報量を多く見積もっている → タイプⅠエラーを犯す危険がある → タイプⅠエラーを犯す危険がある 平均値は集団の性質を反映しない 平均値は集団の性質を反映しない 平均値は集団の性質と個人の性質が混在 平均値は集団の性質と個人の性質が混在 得られた相関係数が何を表しているか不明 得られた相関係数が何を表しているか不明 人数が少ないときほど、危険 人数が少ないときほど、危険
◆集団内類似性◆ 個人 - 集団データの集団内類似性 個人 - 集団データの集団内類似性 発言量や会話満足は、個々の集団内で類似す る 発言量や会話満足は、個々の集団内で類似す る → 盛り上がっている集団は全員の発話量が多 い → 盛り上がっている集団は全員の発話量が多 い 類似性こそが階層的データの特徴 類似性こそが階層的データの特徴 個人の得点同士に類似性が見られることに よって、サンプルの独立性が違反される 個人の得点同士に類似性が見られることに よって、サンプルの独立性が違反される 類似性を適切に扱えば、問題は回避される 類似性を適切に扱えば、問題は回避される
階層的データ分析 階層的データ分析 階層的データ分析 階層的データを適切に分析する手法 階層的データを適切に分析する手法 「集団内類似性」を評価し、それにあわせた モデリングを行う 「集団内類似性」を評価し、それにあわせた モデリングを行う 階層的線形モデル( HLM ) 階層的線形モデル( HLM ) 重回帰分析の階層的データ分析版 重回帰分析の階層的データ分析版 近年注目されている方法 近年注目されている方法 しかし、限界点も多くある(清水, 2006) しかし、限界点も多くある(清水, 2006)
◆マルチレベル共分散構造分析◆ Multilevel Covariance structure Analysis (以下、 MCA ) Multilevel Covariance structure Analysis (以下、 MCA ) 共分散構造分析の階層的データ分析版 共分散構造分析の階層的データ分析版 多変量を扱ったモデリングが可能 多変量を扱ったモデリングが可能 適合度指標を参照できる 適合度指標を参照できる 以降、 MCA の簡単な説明と、 Muthen 法 (Muthen1994) の簡便法を実行するためのプ ログラムを紹介 以降、 MCA の簡単な説明と、 Muthen 法 (Muthen1994) の簡便法を実行するためのプ ログラムを紹介
MCA のイメージ 類似した部分 独自の部分 相互に独立 集団の性質 集団レベル 個人の性質 個人レベル 個々人のデータ(情 報)
個人レベルと集団レベル 各レベルごとにモデルを解釈 各レベルごとにモデルを解釈 個人レベル・・・個人の心理プロセスを表す 個人レベル・・・個人の心理プロセスを表す おしゃべりな人は、会話によく満足している おしゃべりな人は、会話によく満足している 集団レベル・・・集団の現象を現す 集団レベル・・・集団の現象を現す みんながよくしゃべると、凝集性が高まる みんながよくしゃべると、凝集性が高まる 各レベルの比較 各レベルの比較 扱おうとしている現象は、個人内のプロセス なのか、集団全体のプロセスなのか? 扱おうとしている現象は、個人内のプロセス なのか、集団全体のプロセスなのか?
MCAのイメージ 個人のデータから集団レベルを推定する 個人のデータから集団レベルを推定する 集団レベル 個人レベル 集団レベル 個人レベル 各個人のデータ Between モデル Withinモ デル 発話量会話満足
分析の流れ 集団内類似性の評価 集団内類似性の評価 級内相関係数の算出 級内相関係数の算出 有意性の確認・・・.10 以上ならあると見る 場合も 有意性の確認・・・.10 以上ならあると見る 場合も 共分散行列を Within と Between に分割 共分散行列を Within と Between に分割 個人レベル= Within モデル 個人レベル= Within モデル 集団レベル= Between モデル 集団レベル= Between モデル 二つの行列を SEM のソフトウェアに投入 二つの行列を SEM のソフトウェアに投入 モデリングをして推定値を算出 モデリングをして推定値を算出 Mplus なら、データから直接分析できるMplus なら、データから直接分析できる
事前分析プログラム HAD4 HAD4 階層的データ分析用マクロ 階層的データ分析用マクロ Microsoft Excel の VBAMicrosoft Excel の VBA 機能 機能 級内相関係数の算出と有意性検定 級内相関係数の算出と有意性検定 集団ごとの平均値と、その平均値から個人が どれほどずれているかを算出(センタリン グ) 集団ごとの平均値と、その平均値から個人が どれほどずれているかを算出(センタリン グ) 簡便法のための、 Within と Between の共分散 行列、相関行列を出力 簡便法のための、 Within と Between の共分散 行列、相関行列を出力
HAD4 データ入力 データ入力 集団を識別するための ID 変数を B 列に入力 集団を識別するための ID 変数を B 列に入力 その隣に分析したい変数を入力 その隣に分析したい変数を入力
MCA の簡便法 豊田( 2000 )の簡便法 豊田( 2000 )の簡便法 Kenney の個人 - 集団レベル相関と同じKenney の個人 - 集団レベル相関と同じ Within と Between を同じ行列で表示Within と Between を同じ行列で表示 推定値だけを出力する 推定値だけを出力する 個人レベル相関集団レベル相関
Amos での分析 従来法 MCA 簡便法 個人レベル 集団レベル
MCAとHLM 同じ点 同じ点 階層的なデータを分析できる 階層的なデータを分析できる 非標準化推定値、有意性検定はほぼ一致 非標準化推定値、有意性検定はほぼ一致 MCAがHLMより優れている点 MCAがHLMより優れている点 標準化推定値が算出できる 標準化推定値が算出できる 豊富な適合度指標(CFI、RMSEAな ど)を出力 豊富な適合度指標(CFI、RMSEAな ど)を出力 モデリングが自由( HLM は従属変数が一つ) モデリングが自由( HLM は従属変数が一つ) 個人のデータから、集団レベルの独立変数を 推定できる( HLM は平均値を算出する必要が ある) 個人のデータから、集団レベルの独立変数を 推定できる( HLM は平均値を算出する必要が ある)
MCA と HLM のイメージ 従属変数 集団レベル 個人レベル 独立変数 個人レベル 分解 センタリング 平均化 集団レベル 独立変数 HLM
MCA と HLM 従属変数 集団レベル 個人レベル 独立変数 個人レベル 分解 MCA 集団レベル 分解 集団レベルのモデルは、 MCA のほうがより正確に分析できる
MCA の利点 従来の方法の問題点を解決 従来の方法の問題点を解決 集団内類似性を適切に評価 集団内類似性を適切に評価 それにあわせて、データを 2 つに分割する それにあわせて、データを 2 つに分割する 個人レベルと集団レベルを比較 個人レベルと集団レベルを比較 個人特性による効果なのか、集団の効果なの かを吟味することができる 個人特性による効果なのか、集団の効果なの かを吟味することができる SEMの要領で分析できる SEMの要領で分析できる 自由なモデリング、豊富な適合度指標 自由なモデリング、豊富な適合度指標
MCA の限界 比較的、多くのサンプルを必要とする 比較的、多くのサンプルを必要とする 20 集団以上が望ましい20 集団以上が望ましい 合計サンプルは 100 程度 合計サンプルは 100 程度 モデリングが複雑 モデリングが複雑 正式な方法を実行するには、習熟が必要 正式な方法を実行するには、習熟が必要 Mplus ならば容易に実行することができるMplus ならば容易に実行することができる 解釈の困難さ 解釈の困難さ 個人レベル、集団レベルごとの解釈が必要 個人レベル、集団レベルごとの解釈が必要 測定した変数は、理論的にどのレベルか? 測定した変数は、理論的にどのレベルか?
結論 個人 - 集団データと MCA 個人 - 集団データと MCA 集団内類似性が多く見られるデータには、必 要とされる分析手法 集団内類似性が多く見られるデータには、必 要とされる分析手法 もし類似性がないなら、使う必要がない もし類似性がないなら、使う必要がない 「従来の方法では正しい分析ができない」か ら使うというよりは・・・ 「従来の方法では正しい分析ができない」か ら使うというよりは・・・ 「より多くの知見を得ることができる」という、積極的な意義を強調したい