1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学
2 主成分分析( PCA ) 観測変数の合成変数( PC )を作成 – 観測変数は PC の構成要素 PC は結果系変数
3 因子分析( FA ) FA は外的基準しかないモデル – 観測変数が従属変数となる同時回帰モデル – 原因系変数である潜在変数を探索・検証す る – 観測変数は潜在変数と共変
4 まとめると
5 推定についての定義 「独自性(誤差) 」を評価するかしな いか –PCA 誤差なしで分析 –FA 誤差を入れて分析 「共通性」という概念を使うならば FA
6 定義のまとめ 成分・因子(構成概念)が原因系か結果系か – 結果ならば PCA – 原因ならば FA 推定方法 誤差の扱い –PCA 観測変数は構成概念の構成要素であり誤差は無視可能 –FA 観測変数には構成概念の情報以外に誤差が含まれている
7 例: Bollen(1989, p.65) 人種・性別⇒差別 結婚・離婚・解雇・昇進⇒ストレス 自尊心⇒ “ I feel that I am as good as the next person ”
8 例:豊田 (1992) 因子分析は心理学における知能の研究にしば しば用いられるが,それは知能(構成概念) が高いことが原因でテスト得点(観測変数) が高くなると考える方が,テストの成績が高 いことが原因で知能が高くなると考えるより 自然だからである.主成分分析は経済学の各 種指標にしばしば用いられるが,それはたと えば物価 ( 観測変数 ) が高いことが原因で,そ の結果として物価指数(構成概念)を高く設 定すると考える方が,物価指数が高いことが 原因で物価が高くなると考えるより自然だか らである.
9 FA がふさわしい状況で PCA を使うと 良い点 –PCA は安定している まずい点 – 誤差を無視した分析 一般に V(Y) の半分以上は誤差 – 因子負荷が不当に大きく推定される PCA の方が魅力的な分析結果にみえる
10 PCA のバイアス
11 SMC と最終共通性の比較
12 FA がふさわしい状況だが うまく分析できないため PCA を 使う セカンドベストという意味で許容? –PCA よりも非反復主因子法を勧めたい いつも FA でうまく分析できるとは限らない – 二値変数が含まれている – 四分位相関を分析している – 分布が極度に標準分布から外れている – 標本サイズが十分大きくない – 2変数にしか関わらない因子がある – 局所独立性が崩れている – 他
13 PCA がふさわしい状況で FA を使うと あえて FA を使う意義はない 推定に問題が生じることがある – 変数間の相関が高くないことがある – 不適解 – 反復の非収束
14 テクニカルな分析 PCA の高めのバイアスは,因子負荷量 の2乗和大きければ緩和される – 因子負荷量が大きい – 項目数が多い 項目数が無限に多くなると一致 因子負荷量 主成分負荷量
15 FA は不安定である PCA よりも複雑なので不安定 – モデル探索に向かない 分析過程においては安定した 非反復主因子法を利用することができる 最終結果においては,できれば「最尤 解」,つぎに「反復主因子解」を報告し たい
16 SEM のススメ FA がふさわしい状況だがうまく分析できないと き – 二値変数が含まれている.四分位相関を分析してい る SEM は二値変数を適切に分析可 – 分布が極度に標準分布から外れている 変数変換,変数の削除 – 標本サイズが十分大きくない CFA は EFA よりも安定 – 2変数にしか関わらない因子がある CFA で分析可 – 局所独立性が崩れている 誤差相関のある CFA で分析
17 まとめ 因果の方向によってモデルを決める – たとえ分析結果が似ていても,使うべき分 析方法を使う FA は PCA に比べて不安定である – モデル探索の過程では,非反復主因子法・ PCA を用いてもよい – 最終結果は最尤解・反復主因子解を報告す る –SEM の利用も考えてみる