SEMFAQ: 共分散構造分析に関する10の質問

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
グラフィカル多変量解析 ----目で見る共分散構造分析----
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
コメント 狩野裕 (大阪大学 人間科学研究科).
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
【MedR】第12回 東京大学医学系研究科 特任助教 倉橋一成.
共分散構造分析(SEM)は パス解析,因子分析,分散分析のすべてにとって代わるのか?
論文紹介 青年期における恋愛相手の選択基準とアイデンティティ発達との関係
コメント 「ファセット・アプローチの 魅力とパワー」
因子分析と共分散構造分析 狩野 裕 大阪大学人間科学部 日本行動計量学会 春の合宿セミナー
実証分析の手順 経済データ解析 2011年度.
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
GD07WS マルチレベル共分散構造分析 指定討論
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
突然ですが、 金政分析へのコメント 大阪大学大学院人間科学研究科 平井 啓 2017年3月13日(月)
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
日本行動計量学会第29回大会 於:甲子園大学 (2001/9/14-16)
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
ワークショップ ユーザーとメーカーの公開相談会
於:科学警察研究所 日時:2003年3月17日 SEMと犯罪心理学研究 II 狩野 裕 大阪大学 大学院人間科学研究科.
構造方程式モデリング(SEM) Structural Equation Modeling.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
狩野 裕 大阪大学 大学院人間学研究科 行動データ科学研究分野
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
数量分析 第2回 データ解析技法とソフトウェア
予測に用いる数学 2004/05/07 ide.
東京工科大学 コンピュータサイエンス学部 亀田弘之
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
クロス表とχ2検定.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
相関分析 2次元データと散布図 共分散 相関係数.
重回帰分析入門 (第5章補足) 統計学 2007年度.
心理学研究の自己点検(6): 心理学研究における 探索的因子分析の基本問題 企画・講演:堀 啓造氏
Presentation transcript:

SEMFAQ: 共分散構造分析に関する10の質問 三浦麻子×狩野裕 (大阪大学 大学院人間科学研究科) 配布資料 日本GD学会 第50回大会@京都

1.SEMによるパス解析は “must”なのか? なんとか実行はできたのですが,適合度が低く,とてもじゃないですが論文に載せられたもんじゃありません こんなとき,私はどうすればいいのでしょう?  論文取り下げ&もう一度データ取り直しなんでしょうか?

1.回答 Yes. “must”である 不適合の理由を特定し,モデルを改善する モデルが不適切 偏相関が説明できていない 直接効果の欠落 未観測の剰余変数の存在 層別を示唆(交互作用の存在) 偏相関が説明できていない 誤差共分散

誤差共分散の設定 誤差間に共分散を設定する

2.標準化尺度のEFA・CFA 質問紙調査の場合,既存の標準化された尺度を使うことがよくあります このような場合にも,先行研究の構造が再現されるかどうかを確認するために探索的因子分析をしていたのですが,なんだか変な気がします まず検証的因子分析をして構造を確認してから,場合によっては探索的にやりなおす方がよいのでしょうか?

2.回答 Yes and No Establishされている尺度については EFA・CFAを行う必要はない 理屈上 EFAやCFAによってサンプルの妥当性を チェック

EFA versus CFA CFAでは より厳しいチェックが行われる 尺度を吟味したあと SEMへ移行するなら,CFAが必須 古典的方法を利用するなら,EFAでもよいのではないか 合計得点を算出して分析するなど

しかし 信頼性が不十分のとき 尺度分析の結果 誤差の制御が必要 多重指標を利用したSEMで分析する必要 尺度解析においてもCFAが必要に

3.適合度が悪いモデルは 「ダメダメ」なの? 仮説モデルにしたがってSEMをすると,適合度がいまいちよくありません.全然ダメなら捨てるのですが,どうも微妙なラインなんです 試行錯誤すると,どうやら仮説にやや合わないモデルの適合度が高いようです こんなとき,私はどちらのモデルを選べばよいのでしょう? 本心を言えば,前者を選びたいのですが…

3.回答 気持ちはよくわかる 仮説モデルの適合度を向上させるために あらゆる手段を講じる このような事態はSEMに限ったことではない e.g., 回帰分析で重要な変数の効果が非有意 統計解析における共通の悩み それゆえ,分析は自動化できない

あらゆる手段 適合度を低めている部分の同定 粗データの吟味 誤差相関 層別(交互作用) 未観測交絡変数 観測変数の選択 parceling モデルの部分評価 粗データの吟味 誤差相関 層別(交互作用) 未観測交絡変数 観測変数の選択 parceling SEMの専門家に訊く

コメント 適合度の小さいな違いは実質的な意味はない 研究分野によって基準は異なる 適合度の良いモデルが複数個ある場合は,分析者の責任において最終モデルを選択 ランダムな現象を扱うことの限界 研究分野によって基準は異なる 各分野のコンセンサス 先行研究の適合度を参考にする 研究が積み重ねられている分野 More confirmatory nature.より厳しい基準 新しい研究分野 Less confirmatory nature.やや緩い基準

4.欠損値のあるデータの 処理方法 いくつか欠損値が含まれたデータを用いてSEMをやりたいと思っています 4.欠損値のあるデータの 処理方法  いくつか欠損値が含まれたデータを用いてSEMをやりたいと思っています 欠損値の処理方法には場合によっていくつかあるようですが,明らかに実施時に特殊な事情がある場合以外はどうしたらいいのでしょう? また,欠損値の処理方法を論文に明記すべきでしょうか? そこまで書いている論文を見たことが(まだ)ありません

4.回答 欠測が1割程度ならばLD 相当数の欠測がある場合はFIMLを 用いる LD,FIMLは明示する必要あり 日本GD学会第50回大会@京都 4.回答 欠測が1割程度ならばLD 相当数の欠測がある場合はFIMLを 用いる 欠測のプロセスに関してMARを仮定 MARの仮定が崩れていても,共分散構造分析においては,そこそこ使える 経験則だが LD,FIMLは明示する必要あり 因子得点は欠測のないobservationに対して計算する 欠測があるobservationで,何らかの方法を用いて(代入法) 完全データ化し,因子得点を計算するのには無理がある SEMFAQ10資料

LDとFIML Listwise Deletion (LD) 一つでも欠測のあるobservationは,分析から外して 分析する 捨てられるデータがもったいない 統計的推測の精度が低くなる 欠測が多いと分析できないことがある MCARである必要 Full Information Maximum Likelihood (FIML) 観測されたデータにもとづく最尤法 AMOSなどSEMの代表的なプログラムで利用可 MARでよい

統計理論から Missing Completely At Random (MCAR) Missing At Random (MAR) どの値が欠測するかは完全にランダムである LD, PDは,このときのみ使える Missing At Random (MAR) どの値が欠測するかはデータに依存してもよいが, 欠測値には依存しない FIMLの適用が薦められる Nonignorable Missing どの値が欠測するかが欠測した値に依存する 欠測のメカニズムにモデリングが必要

5.調査データでの 「因果関係の同定」 調査データの多くは,一時点で採取された認知データであり,本来は因果関係は論ずることができないことはよくわかっています しかし私たちはそれを知りつつも,SEMを使って因果関係があるかのように議論を進めています こんなことをしていいのか?という根本的な疑問がふと頭をかすめることがあるのですが…

5.回答 SEMは強力な因果推論の道具 調査データにもとづく因果推論の限界 因果の大きさ(因果関係のあるなし) 因果の方向 交絡変数がないという前提 パス図が正しいという前提 調査データにもとづく因果推論の限界 未観測交絡(剰余)変数の存在を否定できない 因果の大きさ(因果関係のあるなし) パス係数の推定と検定 第三変数のモデル化が容易 因果の方向 適合度にもとづくモデル比較により,因果の方向を決定 当該モデルの適合と逆方向のモデルの不適合

実例 「スマートさ」から「うつくしさ」への影響が強い

対応策 十分な検討の下で,正確なパス図を作成 強い結論を主張しない 縦断的データを取るデザインを考える 大幅なモデル探索はしない 強い結論を主張しない ...という関係が示唆された 縦断的データを取るデザインを考える 調査データの分析は積み重ねることが大事

6.双方向因果モデル (にわとりたまご) よくテキストで見るパスモデルは,因果の方向が一定であることが多いようですが,双方向の因果モデルというのはSEMでうまくモデリングできるのでしょうか? いわゆる鶏と卵の関係のようなモデルです

6.回答 YES 縦断的データの場合 横断的データの場合 しかしながら パス解析 双方向因果モデル 調査データにもとづく因果方向の決定は難しい

縦断的データの利用 2時点でデータをとり,時間差を利用する 民主主義⇒経済発展 or 経済発展⇒民主主義 日本GD学会第50回大会@京都 SEMFAQ10資料

双方向因果モデル

政治的社会化モデル 出典:Asher(1976). Causal Modeling. Sage

7. 「不適解」地獄から 抜け出したい!! 突然ですが,不適解に泣かされています データの打ち込みや読み込み,あるいはモデルの記述などつまらない原因はすべて探りましたが,どれも問題ないようです こんなとき不適でない解を導き出す努力として,私たちには一体何ができるのでしょう?

7.回答 不適解とは(improper solutions) 原因を切り分けてから対応する 誤差Eや撹乱項Dの分散が0または負の値に推定 相関の推定値が,絶対値1以下でない 基本的には,これらを最終解として報告してはならない 原因を切り分けてから対応する

原因と対応 不適解は何らかの不適切性を表す 単純ミスなど モデルが不適切(model misspecification) 潜在変数モデル固有の問題 サンプル変動 この場合のみ,V(e)≧0などとして解を報告する その他・不明

4. サンプル変動 サンプル変動によって不運にも偶然 不適解となってしまった 残念!! 不適解がサンプル変動によることが確定した場合は,V(e)=0 とおいた解を報告できる場合がある

サンプル変動のための条件 サンプル変動による不適解と判断できるためには さらなるモデルの改良が考えられない 絶対値が大きすぎない.少しマイナス V(e)±2SEが原点を含んでいる 測定モデルで不適解が生じた場合は,因子を合計得点で置き換えてみて,推定値などが大きく変化しないことを確かめる 上記の条件が満たされていても,モデルが小さいと,論文を出版するのは認められにくい

8.よりどりみどりすぎる 適合度指標 AMOS(EQS,CALIS)を使っていますが,プログラムを走らせると,大量の適合度指標が出てきます 8.よりどりみどりすぎる  適合度指標 AMOS(EQS,CALIS)を使っていますが,プログラムを走らせると,大量の適合度指標が出てきます 残念ながらすべての適合度指標を載せるだけの紙幅は論文にありません 私たちが主張したいことはこのモデルが正しいということに尽きるのですが,一体どの指標(たち)を記述すれば必要かつ十分でしょうか?

8.回答 適合度指標にはいくつかの側面がある 側面を代表する指標を報告する モデル局所評価も必要 同じ性質を持つ指標を複数報告しない カイ2乗値 GFI,CFI,RMSEA モデル局所評価も必要 適合度はモデルの全体的評価 パスの有意性 R^2の大きさ

使い方 カイ2乗値 GFI,CFI RMSEA 大標本のときは見ない 一般に,0.90 or 0.95 以上を要求する see Bentler & Bonnet (1980), Hu (1999) RMSEA 0.05以下⇒OK 0.10以上⇒不適 see Browne & Cudeck (1993)

Reference Hu, Li-tze and Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(1), 1-55. Bentler, P.M. & Bonnet, D.G. (1980). Significance tests and goodness of fit in the analysis of covariance structures. Psychological Bulletin, 107, 238-246 Browne, M.W. & Cudeck, R. (1993) Alternative ways of assessing model fit. In K.A. Bollen & J.S. Long [Eds.] Testing Structural Equation Models. Beverley Hills, CA: Sage, 132-162

9.適合度指標の 検定ってないの? 私は今,SEMを使って書かれた論文の査読を依頼されています あるモデルが「適合度が高い」とされているのですが,その根拠として示されている適合度指標が本当に高いのかどうかわかりません.論文によって基準とする値にもばらつきがあるように思えてなりません 適合度指標が本当に高いことを示せる検定などはないのですか?

9.回答 カイ2乗値による検定がそれにあたる 歴史的には カイ2乗検定の限界が指摘され,その代替と して適合度指標が提案されてきた

RMSEA RMSEAは,点推定値だけでなく信頼上限と下限を出力する(信頼率90%) 信頼上限が0.10以下かどうかという判断 基準もよく用いられる 以下の検定もできる H0:RMSEA=0   (exact fit) H0:RMSEA≦0.05 (close fit)

10.SEM論文の 「正しい」書き方 さて,試行錯誤の艱難辛苦を乗り越えて,SEMをおこなったモデリング結果を論文に書こうと思います 「すべてを丁寧に書く」のがベストなのは分かり切っていますが,それだけの紙幅はありません 論文を読む人のことを考えた場合にどのような情報が必要かを,できれば優先順位つきで教えてください

10.回答 必須項目 心理学・行動学の知見にもとづく初期(仮説) モデルの記述 最終モデルの記述 初期モデルと最終モデルとの違いを説明 適合度,パス係数の有意性 読者がduplicateできるようにする 初期モデルと最終モデルとの違いを説明 モデルの変遷や経過を全て記述する必要はない

オプション 直接効果なし パスを引いても非有意 因果の方向 対立モデルが適合しない 男女差なし 多母集団同時分析

SEMによるパス解析が“must”な理由 双方向因果モデルの構築 さまざまな適合度指標の特徴と適切 な使い方 重要FAQ:詳細解説編 SEMによるパス解析が“must”な理由 双方向因果モデルの構築 さまざまな適合度指標の特徴と適切  な使い方

SEMによるパス解析が“must”な理由 FAQ1 SEMによるパス解析が“must”な理由

詳細:直接効果の欠落 LM検定や適合度指標で改善のための 指針を得ることができる

未観測の剰余変数の存在 f2 f1

層別を示唆(交互作用の存在) A+B: 適合度× 0.5 0.5 0.4 0.5 0.6 集団A: 適合度○ 集団B: 適合度○

補足 交互作用と交絡_1 A+B: 適合度○ A+B: 適合度×

補足 交互作用と交絡_2 0.3 0.4 B A r=0.4 X11 X21 B A r=0.6 r=0.4 X11 X21

誤差共分散_1 誤差間に共分散を設定する

誤差共分散_解説 パスの意味 直接効果を表現したもの 交絡要因として導入したもの 誤差共分散を置くことが多い 偏相関が残ることが多いから 測定モデル 誤差共分散なしが一般的

FAQ6 双方向因果モデル (にわとりたまご)

相関係数から因果の方向は決まらない ---同値モデルの問題--- 日本GD学会第50回大会@京都 相関係数から因果の方向は決まらない ---同値モデルの問題--- 相関構造 データから区別できないモデルを同値モデルという 「区別できない」とは適合度が同一であることをいう SEMFAQ10資料

因果の方向を決める: 操作変数法(Instrumental variable method) 日本GD学会第50回大会@京都 因果の方向を決める: 操作変数法(Instrumental variable method) 相関構造 相関構造 SEMFAQ10資料

因果の方向を決める:適合度との関係 適合度が低い 適合度が高い X→Y の因果関係が示唆される 日本GD学会第50回大会@京都 SEMFAQ10資料

日本GD学会第50回大会@京都 双方向因果モデル (非逐次モデル) SEMFAQ10資料

政治的社会化モデル 出典:Asher(1976). Causal Modeling. Sage

交絡変数はこわい 盛山(1986,行動計量学)

因果方向決定にも影響 誤ってY→Xと結論してしまう

まとめ 双方向の因果関係を同定するモデリングがある 縦断的データに基づくモデリングの方が説得性が高いと考えられている 縦断的データに対するパス解析 横断的データに対する非逐次モデル “→”と“←”のモデルが同値にならないようなモデリング 推定可能なモデルを作成するには操作変数法が有効 欠点 交絡変数の影響を無視し得ない 操作変数となるための条件が満足されているか 成功例が少ない 縦断的データに基づくモデリングの方が説得性が高いと考えられている

FAQ8 さまざまな適合度指標の 意味と使い分け

詳細:考え方 適合度評価の考え方 一般的なコンセンサスはない どの指標においても,そこそこの適合が得られて いることが必要 データの相関行列とモデルによる相関行列の食違いの 程度を評価...S-Σ^ 多次元量を1次元に縮約するため多種多様な方法 一般的なコンセンサスはない 開発者は自分が開発した指標を薦める 回帰分析におけるR2においても百家争鳴 査読者に求められたら,素直に報告する どの指標においても,そこそこの適合が得られて いることが必要

いくつかの「側面」 ベース 相対評価 vs 絶対評価 自由度を考慮するか SとΣ^の食い違いを評価 cf. 回帰モデルの場合は,y-y^ 最小モデルを導入する 独立モデル,ゼロモデル 自由度を考慮するか けちの原理(parsimony) 自由度にくらべてどの程度の適合かをみる

好ましい性質 nに依存しないことが望ましい 自由度を考慮した方がよい? 最小モデルの導入については両論ある 自由度dが小さい(パラメータが多い)モデルは適合が良いのはあたりまえ しかし,回帰分析でもR2が活きている 最小モデルの導入については両論ある 回帰分析では「一般平均のみ」の最小モデルを導入している 指標が最小モデルの選択に依存する

比較 自由度による調整 なし 比 差 絶対評価 カイ 2乗値 RMSEA F0, mk AIC 相対評価 GFI AGFI NFI IFI NNFI RFI CFI

補足:指標の定義 自由度による調整

カイ2乗検定について 統計的検定にもとづく方法論 専門家の意見 統計的モデル評価の基本 H0: モデルが正しい H1: モデルが正しくない Do not rely only on the chi-square test Bollen & Long (1993). Testing Structural Equation Models. Sage: CA (page.8)

カイ2乗検定の問題点 検定力がnに依存する 統計モデルは厳密にはデータの発生機構を 表さない データ分布に関する基礎仮定が厳しい 第二種の過誤を評価していない 第一種の過誤を問題とする通常の検定と逆 統計モデルは厳密にはデータの発生機構を 表さない データ分布に関する基礎仮定が厳しい nが小さいときはカイ2乗近似が正しくなく,大きいときは殆ど確実にモデルを棄却する