コメント 狩野裕 (大阪大学 人間科学研究科)
ここでの疑問 ①適合度、共通性、因子の負荷量、 最初にどれを指標にして項目選択を すべき? 最初にどれを指標にして項目選択を すべき? ②適合度指標は色々あるけど、 どれを 参考にすればいいのか?
次の疑問・・・ ③適合度はどこまで上げればいいのか? ④今回は2因子解から始めて、項目選 択をしたけど他にも方法はあるか? ④今回は2因子解から始めて、項目選 択をしたけど他にも方法はあるか? (因子の数を多いと、一項目の増減で他の項目がうろつ く場合がある。それを避けるための方法はあるのか?) ⑤どうしても外したくない項目(因子の代表 項目と考えているもの)外せと言ってくるんで すがどうすればいいのでしょうか?
適合度 適合度評価の考え方 一般的なコンセンサスはない どの指標においても,そこそこの適合が得られて いることが必要 データの相関行列とモデルによる相関行列の食違いの 程度を評価...S-Σ^ 多次元量を1次元に縮約するため多種多様な方法 一般的なコンセンサスはない 開発者は自分が開発した指標を薦める 回帰分析におけるR2においても百家争鳴 査読者に求められたら,素直に報告する どの指標においても,そこそこの適合が得られて いることが必要
いくつかの「側面」 ベース 相対評価 vs 絶対評価 自由度を考慮するか SとΣ^の食い違いを評価 cf. 回帰モデルの場合は,y-y^ 最小モデルを導入する 独立モデル,ゼロモデル 自由度を考慮するか けちの原理(parsimony) 自由度にくらべてどの程度の適合かをみる
好ましい性質 nに依存しないことが望ましい 自由度を考慮した方がよい? 最小モデルの導入については両論ある 自由度dが小さい(パラメータが多い)モデルは適合が良いのはあたりまえ しかし,回帰分析でもR2が活きている 最小モデルの導入については両論ある 回帰分析では「一般平均のみ」の最小モデルを導入している 指標が最小モデルの選択に依存する
比較 自由度による調整 なし 比 差 絶対評価 カイ 2乗値 RMSEA F0, mk AIC 相対評価 GFI AGFI NFI IFI NNFI RFI CFI
補足:指標の定義 自由度による調整
カイ2乗検定について 統計的検定にもとづく方法論 専門家の意見 統計的モデル評価の基本 H0: モデルが正しい H1: モデルが正しくない Do not rely only on the chi-square test Bollen & Long (1993). Testing Structural Equation Models. Sage: CA (page.8)
最後の疑問 今回SEFAをやってみて、項目を削れば 削るほど適合度は上がるという感覚が ある。 それゆえ、適合度だけを考えれば、 削るほど適合度は上がるという感覚が ある。 それゆえ、適合度だけを考えれば、 項目をどんどん削ってしまいたくなる。 しかし、尺度の妥当性や信頼性係数な どのことを考えるとできるだけ項目数 を減らしたくないという思いもある。
今回は、二因子から始めた項目数の多 いモデルと、一因子から始めた項目数 の少ないモデルとの間にそれほどの違 いは見られなかったが、そこら辺の バランスをどのようにとればいいのか? 数理統計的な側面から項目数が多い 場合のモデルと少ない場合のモデル、 双方の特徴と考慮すべき点について お聞かせください。
仮想抑うつ尺度の作成の例 (平井2001より) 以下の6つの項目からなる尺度を構成 仮想抑うつ尺度の作成の例 (平井2001より) 以下の6つの項目からなる尺度を構成 ◆食欲不振 ◆不眠 ◆うつ気分 ◆意欲減退 ◆焦燥感 ◆希死念慮 について「当てはまる」〜「当てはまらない」の 5件法で回答
抑うつ尺度の仮想データ 対象者:300人
「食欲不振」が適合度を下げている!
Just fit! α=0.73
そこで 食欲不振をはずした5項目で「抑うつ尺度」を構成し、投稿する 仮想「抑うつ尺度」 適合度は高い 信頼性も十分 項目が少なく、利便性高い
仮想査読者のお言葉 「食欲不振は抑うつの診断において欠かすことのできない指標。よって、この項目を削除することは、この尺度の内容的な妥当性を著しく損なうことになる!」
2つのモデル α=0.86 α=0.76
どちらのモデル(尺度)を採用? 大きなモデル 小さなモデル 第三の道を探る!! 尺度項目が多く,α係数が高いが,適合度の低いモデル 1つの尺度項目を落とし,α係数がやや低いが,適合度は高いモデル 第三の道を探る!!
再分析!! 信頼性=0.77 信頼性=0.68 α=0.86 α=0.86
補遺:信頼性の公式
適合度が低いモデルは? 適合度が低いモデルを採用するのは避けたい ストラテジー 推定値(因子負荷量)が不正確 信頼性が正しく評価できない,α係数が不正確 ストラテジー モデルに合わない変数を落とす 因子モデルからのズレをモデル化する 誤差共分散の導入 解釈できることが重要
比較 信頼性=0.77 信頼性=0.68 α=0.76 α=0.86
結論 内容的妥当性のためどうしても「食欲不振」を 尺度に含めるなければならない,ということであれば,それは可能 統計的分析からわかること ただし,信頼性の低下を甘受しなければならない α係数は不正確 統計的分析からわかること 「食欲不振」と「意欲減退」には予定外の重複があり,それは,(おそらく)尺度には不必要で,信頼性を低下させる原因となっている 次スライド
補足 「食欲」は,意欲減退を除いた 他の項目との相関が低すぎる
STERA STEpwise Reliablity Analysis SEFAの類型 誤差共分散を設定して適合度を改善するモデリングを支援するプログラム