マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
マルチレベルモデルで 何ができるのか 清水裕士 広島大学大学院総合科学研究科. マルチレベルモデル Multilevel modeling データに階層性がある場合の統計手法 – 個人 ‐ 集団、測定 ‐ 個人、など さまざまなバージョンがある – 階層的線形モデリング HLM – マルチレベル構造方程式モデリング.
スタートアップゼミ 社会基盤交通研 B4 佐津川功季. 多項プロビットモデル  ロジットモデルの弱点である 、 誤差項の独立性という仮定に 対して 、 多変量正規分布を用いて選択肢間の相関を表現した モデル 。 効用関数 において確率項ベクトル において、平均値をそれぞれ 0 、共分散行列を Ω(J×J.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ解析
データ分析入門(12) 第12章 単回帰分析 廣野元久.
科学技術振興機構 (現所属は統計数理研究所) 尾崎幸謙
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析1 分割法タイプのデータ
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
データ解析 静岡大学工学部 安藤和敏
階層線形モデル(Hierarchical Linear Modeling, HLM)の概要と適用例
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
GD07WS マルチレベル共分散構造分析 指定討論
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
Bassモデルにおける 最尤法を用いたパラメータ推定
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
浅野 良輔 名古屋大学大学院教育発達科学研究科 日本学術振興会
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
回帰分析.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
主成分分析                     結城  隆   .
12月4日 伊藤 早紀 重回帰分析.
ワークショップ ユーザーとメーカーの公開相談会
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
構造方程式モデリング(SEM) Structural Equation Modeling.
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
独立成分分析 (ICA:Independent Component Analysis )
数量分析 第2回 データ解析技法とソフトウェア
予測に用いる数学 2004/05/07 ide.
主成分分析 Principal Component Analysis PCA
東京工科大学 コンピュータサイエンス学部 亀田弘之
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
第4章 社会構造概念はどのように豊穣化されるか
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
データ解析 静岡大学工学部 安藤和敏
データ解析 静岡大学工学部 安藤和敏
保守請負時を対象とした 労力見積のためのメトリクスの提案
データ解析 静岡大学工学部 安藤和敏
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
心理学研究の自己点検(6): 心理学研究における 探索的因子分析の基本問題 企画・講演:堀 啓造氏
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
Presentation transcript:

マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会

本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか? 従来の方法は何が不十分なのか? 階層的データ分析 階層的データ分析 本発表ではマルチレベル共分散構造分析 ( MCA )を紹介 本発表ではマルチレベル共分散構造分析 ( MCA )を紹介 HLM との比較などHLM との比較など

個人 - 集団データの階層性 データの階層性 データの階層性 集団ごとにネストされたデータ 集団ごとにネストされたデータ 集団ごとに共通した値が入力されるデータ 集団ごとに共通した値が入力されるデータ 集団内で類似したデータ 集団内で類似したデータ 学校 - 生徒、カップルデータ、反復測定データ・・・ etc 学校 - 生徒、カップルデータ、反復測定データ・・・ etc このようなデータを階層的データと呼ぶ

階層的データ 例:会話実験のデータ 集団で一致したデー タ 集団で類似したデー タ

◆従来の分析手法◆ これまでの階層データの扱い これまでの階層データの扱い サンプルを独立なものとして扱う サンプルを独立なものとして扱う 集団ごとに平均して集団数をサンプル数とす る 集団ごとに平均して集団数をサンプル数とす る 集団のうち、一人しか使わない 集団のうち、一人しか使わない 上記の方法の問題点 上記の方法の問題点 サンプルは独立ではない → 集団内で類似して いる サンプルは独立ではない → 集団内で類似して いる 平均値は純粋な集団の性質を反映しない 平均値は純粋な集団の性質を反映しない データがもったいない データがもったいない

集団で平均化されたデータ

従来の方法の問題 「サンプルの独立性仮定」の違反 「サンプルの独立性仮定」の違反 統計学は、サンプルが独立していることを仮 定 統計学は、サンプルが独立していることを仮 定 階層的データは、サンプルが独立していない 階層的データは、サンプルが独立していない つまり、情報量を多く見積もっている つまり、情報量を多く見積もっている → タイプⅠエラーを犯す危険がある → タイプⅠエラーを犯す危険がある 平均値は集団の性質を反映しない 平均値は集団の性質を反映しない 平均値は集団の性質と個人の性質が混在 平均値は集団の性質と個人の性質が混在 得られた相関係数が何を表しているか不明 得られた相関係数が何を表しているか不明 人数が少ないときほど、危険 人数が少ないときほど、危険

◆集団内類似性◆ 個人 - 集団データの集団内類似性 個人 - 集団データの集団内類似性 発言量や会話満足は、個々の集団内で類似す る 発言量や会話満足は、個々の集団内で類似す る → 盛り上がっている集団は全員の発話量が多 い → 盛り上がっている集団は全員の発話量が多 い 類似性こそが階層的データの特徴 類似性こそが階層的データの特徴 個人の得点同士に類似性が見られることに よって、サンプルの独立性が違反される 個人の得点同士に類似性が見られることに よって、サンプルの独立性が違反される 類似性を適切に扱えば、問題は回避される 類似性を適切に扱えば、問題は回避される

階層的データ分析 階層的データ分析 階層的データ分析 階層的データを適切に分析する手法 階層的データを適切に分析する手法 「集団内類似性」を評価し、それにあわせた モデリングを行う 「集団内類似性」を評価し、それにあわせた モデリングを行う 階層的線形モデル( HLM ) 階層的線形モデル( HLM ) 重回帰分析の階層的データ分析版 重回帰分析の階層的データ分析版 近年注目されている方法 近年注目されている方法 しかし、限界点も多くある(清水, 2006) しかし、限界点も多くある(清水, 2006)

◆マルチレベル共分散構造分析◆ Multilevel Covariance structure Analysis (以下、 MCA ) Multilevel Covariance structure Analysis (以下、 MCA ) 共分散構造分析の階層的データ分析版 共分散構造分析の階層的データ分析版 多変量を扱ったモデリングが可能 多変量を扱ったモデリングが可能 適合度指標を参照できる 適合度指標を参照できる 以降、 MCA の簡単な説明と、 Muthen 法 (Muthen1994) の簡便法を実行するためのプ ログラムを紹介 以降、 MCA の簡単な説明と、 Muthen 法 (Muthen1994) の簡便法を実行するためのプ ログラムを紹介

MCA のイメージ 類似した部分 独自の部分 相互に独立 集団の性質 集団レベル 個人の性質 個人レベル 個々人のデータ(情 報)

個人レベルと集団レベル 各レベルごとにモデルを解釈 各レベルごとにモデルを解釈 個人レベル・・・個人の心理プロセスを表す 個人レベル・・・個人の心理プロセスを表す おしゃべりな人は、会話によく満足している おしゃべりな人は、会話によく満足している 集団レベル・・・集団の現象を現す 集団レベル・・・集団の現象を現す みんながよくしゃべると、凝集性が高まる みんながよくしゃべると、凝集性が高まる 各レベルの比較 各レベルの比較 扱おうとしている現象は、個人内のプロセス なのか、集団全体のプロセスなのか? 扱おうとしている現象は、個人内のプロセス なのか、集団全体のプロセスなのか?

MCAのイメージ 個人のデータから集団レベルを推定する 個人のデータから集団レベルを推定する 集団レベル 個人レベル 集団レベル 個人レベル 各個人のデータ Between モデル Withinモ デル 発話量会話満足

分析の流れ 集団内類似性の評価 集団内類似性の評価 級内相関係数の算出 級内相関係数の算出 有意性の確認・・・.10 以上ならあると見る 場合も 有意性の確認・・・.10 以上ならあると見る 場合も 共分散行列を Within と Between に分割 共分散行列を Within と Between に分割 個人レベル= Within モデル 個人レベル= Within モデル 集団レベル= Between モデル 集団レベル= Between モデル 二つの行列を SEM のソフトウェアに投入 二つの行列を SEM のソフトウェアに投入 モデリングをして推定値を算出 モデリングをして推定値を算出 Mplus なら、データから直接分析できるMplus なら、データから直接分析できる

事前分析プログラム HAD4 HAD4 階層的データ分析用マクロ 階層的データ分析用マクロ Microsoft Excel の VBAMicrosoft Excel の VBA 機能 機能 級内相関係数の算出と有意性検定 級内相関係数の算出と有意性検定 集団ごとの平均値と、その平均値から個人が どれほどずれているかを算出(センタリン グ) 集団ごとの平均値と、その平均値から個人が どれほどずれているかを算出(センタリン グ) 簡便法のための、 Within と Between の共分散 行列、相関行列を出力 簡便法のための、 Within と Between の共分散 行列、相関行列を出力

HAD4 データ入力 データ入力 集団を識別するための ID 変数を B 列に入力 集団を識別するための ID 変数を B 列に入力 その隣に分析したい変数を入力 その隣に分析したい変数を入力

MCA の簡便法 豊田( 2000 )の簡便法 豊田( 2000 )の簡便法 Kenney の個人 - 集団レベル相関と同じKenney の個人 - 集団レベル相関と同じ Within と Between を同じ行列で表示Within と Between を同じ行列で表示 推定値だけを出力する 推定値だけを出力する 個人レベル相関集団レベル相関

Amos での分析 従来法 MCA 簡便法 個人レベル 集団レベル

MCAとHLM 同じ点 同じ点 階層的なデータを分析できる 階層的なデータを分析できる 非標準化推定値、有意性検定はほぼ一致 非標準化推定値、有意性検定はほぼ一致 MCAがHLMより優れている点 MCAがHLMより優れている点 標準化推定値が算出できる 標準化推定値が算出できる 豊富な適合度指標(CFI、RMSEAな ど)を出力 豊富な適合度指標(CFI、RMSEAな ど)を出力 モデリングが自由( HLM は従属変数が一つ) モデリングが自由( HLM は従属変数が一つ) 個人のデータから、集団レベルの独立変数を 推定できる( HLM は平均値を算出する必要が ある) 個人のデータから、集団レベルの独立変数を 推定できる( HLM は平均値を算出する必要が ある)

MCA と HLM のイメージ 従属変数 集団レベル 個人レベル 独立変数 個人レベル 分解 センタリング 平均化 集団レベル 独立変数 HLM

MCA と HLM 従属変数 集団レベル 個人レベル 独立変数 個人レベル 分解 MCA 集団レベル 分解 集団レベルのモデルは、 MCA のほうがより正確に分析できる

MCA の利点 従来の方法の問題点を解決 従来の方法の問題点を解決 集団内類似性を適切に評価 集団内類似性を適切に評価 それにあわせて、データを 2 つに分割する それにあわせて、データを 2 つに分割する 個人レベルと集団レベルを比較 個人レベルと集団レベルを比較 個人特性による効果なのか、集団の効果なの かを吟味することができる 個人特性による効果なのか、集団の効果なの かを吟味することができる SEMの要領で分析できる SEMの要領で分析できる 自由なモデリング、豊富な適合度指標 自由なモデリング、豊富な適合度指標

MCA の限界 比較的、多くのサンプルを必要とする 比較的、多くのサンプルを必要とする 20 集団以上が望ましい20 集団以上が望ましい 合計サンプルは 100 程度 合計サンプルは 100 程度 モデリングが複雑 モデリングが複雑 正式な方法を実行するには、習熟が必要 正式な方法を実行するには、習熟が必要 Mplus ならば容易に実行することができるMplus ならば容易に実行することができる 解釈の困難さ 解釈の困難さ 個人レベル、集団レベルごとの解釈が必要 個人レベル、集団レベルごとの解釈が必要 測定した変数は、理論的にどのレベルか? 測定した変数は、理論的にどのレベルか?

結論 個人 - 集団データと MCA 個人 - 集団データと MCA 集団内類似性が多く見られるデータには、必 要とされる分析手法 集団内類似性が多く見られるデータには、必 要とされる分析手法 もし類似性がないなら、使う必要がない もし類似性がないなら、使う必要がない 「従来の方法では正しい分析ができない」か ら使うというよりは・・・ 「従来の方法では正しい分析ができない」か ら使うというよりは・・・ 「より多くの知見を得ることができる」という、積極的な意義を強調したい