1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日.

1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日

2 １．主成分分析・因子分析（直交モデル）主成分分析はデータの集約因子分析は潜在因子を仮定するこの違いを示す。

3 データの作成全く相関しない乱数データを多数作る。 N=1000 の変数を任意に作成する。 SPSS 使用互いに独立な正規乱数生成マクロ http://www.ec.kagawa-u.ac.jp/~hori/spss/ spss.html#ranzero

4 Ｆ１因子Ｆ１因子Ｆ２因子Ｆ２因子＝０．６ × ＝０．５ × Ｖ１Ｖ２Ｖ３Ｖ４Ｖ５Ｖ６Ｖ７Ｖ８Ｖ９Ｖ１０Ｅ１Ｅ１Ｅ２Ｅ２Ｅ３Ｅ３Ｅ４Ｅ４Ｅ５Ｅ５Ｅ６Ｅ６Ｅ７Ｅ７Ｅ８Ｅ８Ｅ９Ｅ９Ｅ１０＋０．８ × ＋０．８７ ×

5 変数の作成 (v1 ～ v10) 第１因子 compute x1=0.6**2. compute w1=sqrt(x1). compute w2=sqrt(1-x1). compute v1=w1*f1+w2*e1. compute v2=w1*f1+w2*e2. compute v3=w1*f1+w2*e3. compute v4=w1*f1+w2*e4. compute v5=w1*f1+w2*e5. 第２因子 compute x1=0.5**2. compute w1=sqrt(x1). compute w2=sqrt(1-x1). compute v6=w1*f2+w2*e6. compute v7=w1*f2+w2*e7. compute v8=w1*f2+w2*e8. compute v9=w1*f2+w2*e9. compute v10=w1*f2+w2*e10.

6 相関行列 V1V2V3V4V5V6V7V8V9V10 V11.000.360.360.360.360.000.000.000.000.00 V20.361.000.360.360.360.000.000.000.000.00 V30.360.361.000.360.360.000.000.000.000.00 V40.360.360.361.000.360.000.000.000.000.00 V50.360.360.360.361.000.000.000.000.000.00 V60.000.000.000.000.001.000.250.250.250.25 V70.000.000.000.000.000.251.000.250.250.25 V80.000.000.000.000.000.250.251.000.250.25 V90.000.000.000.000.000.250.250.251.000.25 V100.000.000.000.000.000.250.250.250.251.00

7 1 ．００ + ０．３６＊４ 1 ．００ + ０．２５＊４０．３６＊５０．２５＊５

10 主成分分析を行う FACTOR /VARIABLES v1 to v10 /ANALYSIS v1 to v10 /PRINT extraction /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION pc.

11 sqrt(2.44/5) ＝ 0.6985

12 因子分析はモデルをきれいに再現させた。主成分分析はもとのモデルよりも負荷量・共通性とも大きくなる。主成分分析がデータの記述であることを示すにはもう一つつっこむ必要がある。変数の数を減らしてみる。 v9,v10 をカット

15 主成分分析と因子分析の違い主成分分析は関係する変数の数が変わると負荷量・共通性が変わる。 → 主成分分析は記述しかも，数値はその因子に関連する変数の数によって意味が違っていて，結果を誤読するおそれがある。因子分析は関係する変数の数が変わっても負荷量・共通性の値は変化しない。

16 ２．主成分分析と因子分析の直交解・斜交解斜交解が適切な場合におこる問題を指摘し，斜交解が適切であることを示す。特に主成分分析は斜交解が適切な場合におおきな問題を抱えている。回転をしない解の問題を指摘する。斜交回転は直接 oblimin(0)

17 データの作成 compute a1=0.5. /* 因子 compute a3=0.3. /* g compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v6=w1*f2+w3*f5+w2*e6. compute v7=w1*f2+w3*f5+w2*e7. compute v8=w1*f2+w3*f5+w2*e8. compute v9=w1*f2+w3*f5+w2*e9. compute v10=w1*f2+w3*f5+w2*e10. compute a1=0.3. /* 因子 compute a3=0.3. /*g compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v16=w1*f4+w3*f5+w2*e16. compute v17=w1*f4+w3*f5+w2*e17. compute v18=w1*f4+w3*f5+w2*e18. compute v19=w1*f4+w3*f5+w2*e19. compute v20=w1*f4+w3*f5+w2*e20. exec.

18 Ｇ因子Ｇ因子Ｆ１因子Ｆ１因子Ｆ２因子Ｆ２因子＝０．５５ × ＋０．７１ × ＋０．５５ × Ｖ１Ｖ２Ｖ３Ｖ４Ｖ５Ｖ６Ｖ７Ｖ８Ｖ９Ｖ１０Ｅ１Ｅ１Ｅ２Ｅ２Ｅ３Ｅ３Ｅ４Ｅ４Ｅ５Ｅ５Ｅ６Ｅ６Ｅ７Ｅ７Ｅ８Ｅ８Ｅ９Ｅ９Ｅ１０＋０．４５ × ＋０．６３ × （ｓｑｒｔ（０．３））（ｓｑｒｔ（０．５））

22 ｒ＝．４３３０．８９４＝ｓｑｒｔ（０．３＋０．５）０．７７５＝ｓｑｒｔ（０．３＋０．３）

23 主成分分析をすると

25 一般因子がある場合，主成分分析（回転をしない本来のもの）は，意味もなく，２つの因子をひっつける。これは単に分散を最大化するためのもの。だから，解釈する意味はないと考えたほうがいい。実際にはいろんな複雑な関係があるから，解釈したくなる。意味づけできるものでも分散最大化の人工的なものと抑える。

26 ｒ＝．３９７ｒ＝．４３３

27 主成分分析変数の数を減らす因子分析の負荷量は変化しないが，主成分負荷量は変化する。

28 主成分間相関・因子間相関主成分分析 5+2.383 主成分分析 5+5.397 因子分析 5+5.433 因子分析 5+2.433 主成分分析の主成分間相関はもとのモデルを再現できないし，変数の数によって変化する

29 Ｇ因子Ｇ因子Ｆ３Ｆ３Ｆ４Ｆ４＝Ｖ１Ｖ２Ｖ６Ｖ７Ｖ１１Ｖ１２Ｖ１６Ｖ１７Ｅ１Ｅ１Ｅ２Ｅ２Ｅ６Ｅ６Ｅ７Ｅ７Ｅ１１Ｅ１２Ｅ１６Ｅ１７Ｆ１Ｆ１Ｆ２Ｆ２

30 ４因子データ (2,4 は前と同じ） compute a1=0.6. /* 因子 compute a3=0.3. /*g */ compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v1=w1*f1+w3*f5+w2*e1. V2 ～ v5 compute a1=0.4. /* 因子 compute a3=0.3. /*g */ compute a2=1-a1-a3. compute w1=sqrt(a1). compute w3=sqrt(a3). compute w2=sqrt(a2). compute v11=w1*f3+w3*f5+w2*e 11.v12 ～ v15

32 主成分を解釈したくなるが，あくまで分散最大化するためのもの意味がなくても結合するのである。但し，第１主成分は主として一般因子

33 Varimax 回転と直接 oblimin Varimax 解には小さな負荷量がつく。小さな負荷量であっても必ずしも無視できるものではない。

34 因子間相関 r=0.433

35 Varimax 回転直接 oblimin

36 高次因子階層因子分析

37 変数因子高次因子階層因子１次因子

38 高次因子因子間相関行列から計算一般因子の負荷量の設定は同じ： sqrt(0.3)=0.548 F1=0.577*0.949 ＝ 0.548 F2=0.613*0.894 ＝ 0.548 F3=0.655*0.837 ＝ 0.548 F4= 0.707*0.775 ＝ 0.548 絶対量でなく比率

39 参考： Statistica の階層因子分析変数大幅に省略（各因子の１変数のみ記載） sqrt(0.3)= 0.548 sqrt(0.6)= 0.775 sqrt(0.5)= 0.707 sqrt(0.4)= 0.632 sqrt(0.3)= 0.548

40 斜交の図（省略） promax k の指定：３，４，６，８ｋが大きい方が単純解直接 oblimin γ または δ ＝０指定－方向は直交解に近くなる＋方向はより斜交０がもっともよい (promax よりも単純解）

41 promax k=3 r=0.373 θ=68.1°

42 promax k=4 r= 0.428 θ=64.7°

43 直接 oblimin γ=0 r=0.442 θ=63.7°

44 第２部因子抽出法 (1) ＭＬ最尤法 (2) ULS 最小２乗法＝反復主因子法 (3) 非反復法（ Kano, 1990; Cudeck,1991) Cudeck(2000)

45 (1) 最尤法（ＭＬ） (a) 多変量正規分布を前提はっきりと正規分布からはずれる場合には使わない → 最小２乗法 (b) 検定法がいろいろある →good (c) 変数が非常に多いときにはよくないかもしれない。 Cudeck(2000) では５０以内。 (d) 不適解になる可能性が他の方法より多い →bad であり診断としては good (e) 初期値を変えたら不適解でなくなるかもしれない

46 (2) 最小２乗法 (ULS) (a) 収束すれば反復主因子法， Minres などと同じ結果。 (b) 反復主因子法に比べ収束がはやい (c) 多変量正規分布の前提がない (d) どの因子数でもそれなりにフィットする（これは欠点） (e) 不適解

47 (3) 不適解「共通性が１を超えました」 (a) 反復主因子法をやってみる（不適解か？） (b) 非反復因子分析 (Kano, 1990; Cudeck, 1991) (c) 不適解がどうして起こっているか検討する狩野裕 (1998). 不適解の原因と処理：探索的因子分析大阪大学人間学部紀要, 24, 303-327. (d) 因子数を減らしてみる (e) その因子の変数の減（またはなくす） (f) 主成分分析または非反復の主因子法 (g) その因子の変数増（再調査） (h) サンプル増（良性の場合）（再調査）

48 第３部因子数の決定因子分析と主成分分析との違いは分かった。しかし，因子数をうまく決定しないと因子分析は結局意味ないよ。探索的因子分析なんて風水みたいなもんじゃない。

49 １．因子数決定の主たる方法 (1) 市川雅教,1990 in 柳井・繁桝・前川・市川『因子分析ーその理論と方法』朝倉書店 (1) 対角１の相関行列の固有値１以上の数 (2) 相関行列の対角にＳＭＣを入れて固有値０以上の数 (3) スクリープロット (4) 共通因子により説明される割合 (5) 尤度比検定 (6) 情報量 AIC

50 １．因子数決定の主たる方法 (2) Cudeck, R. (2000). Exploratory factor analysis. In Handbook of applied multivariate statistics and mathematical modeling. Academic Press. (1)Eigenvalues Greater than Unity (2)Scree Test (3)Test of Exact Fit (4)Root Mean Square Error of Approximation (RMSEA)

51 (a) 固有値１以上 →parallel analysis ランダムなデータを因子分析したときの固有値の期待値よりもその固有値が大きい Horn, J.L. (1965). 同一変数，ケース数の乱数を生成し，比較する。その都度生成せず，（変数数，因子数，ケース数をつかう）重回帰により固有値の大きさを推測する。 –Montanelli & Humphreys (1976) ＳＭＣ –Allen and Hubbard(1986) など主成分分析

52 (b) ＭＡＰ (Velicer, 1976) 最小平均偏相関 minimum average partial correlation (MAP) １因子あたりの指標の数が多いときにもっともいい成績 Velicer, W.F. (1976). Determining the number of components from the matrix of partial correlations. Psychometrika, 41, 321- 327.

53 ２．因子の範囲を絞り込むＭＡＰ＜＝主成分ＰＡ＜＝ＳＭＣのＰＡ基本的にこの範囲の中に解がある。さらに以下のことを考慮するＲＭＳＥＡが 0.08 以下である。 0.05 以下ならよい（ＡＩＣ），ＢＩＣ，ＢＩＣ＊の最小値不適解にならない結果が解釈可能変数の増減，サンプルの削除

54 柳井・繁桝・前川・市川『因子分析ーその理論と方法』朝倉書店の性格検査男女各１００名合計２００名１３性格尺度

56 ３～５因子

57 ４因子が有望

61 ３．因子のチェック一つの変数だけの因子になっていないか – 独自因子高い負荷量であっても標準誤差が大きくないか？ Browne らのＣＥＦＡを使用する果たして直交解でいいのか？

62 ４．過小因子数と過大因子数このタイプの研究はいくつかある。 Wood et al.(1996) の研究からまとめる。 – （シミュレーション実験）過小因子数は過大因子数よりも大きな問題がある。独自因子だけの変数がある場合、かつ１または２の過大因子数による被害はほとんどない。独自因子だけの変数がない場合は本来の因子を分割する。

63 第４部被験者，変数の数相関係数を安定させるためにはかなりの被験者の数を要求する。きれいな構造をもつデータで１００～２００程度は必要というものもある。それ以外は２００以上。しかし，変数の数とも関係する。

64 １．変数の数その因子に所属する変数の数。共通性が高ければ変数の数は少なくてもいい。しかし，その因子をどの程度代表するのか問題。広範に変数をとる。変数のサンプリングは重要 Velicer らの実験結果をまとめた Stevens の考え。次に →

65 因子と変数の数 Guadagnoli and Velicer(1988) (1) 絶対値 0.60 以上の負荷をもつ変数が４つ以上の因子（サンプル数に関係ない） (2) 低い負荷量 (0.40) の因子が１０以上の変数でサンプル数が１５０以上 (3) サンプル数が３００以上でない場合は、少数の低負荷量変数しかない因子は解釈すべきでない。追加。 0.80 以上の負荷量の変数が少なくとも３あるときはいい。

66 (2)RMSEA から必要サンプルを求める SAS のマクロがある。これを SPSS の syntax にした。 http://www.ec.kagawa-u.ac.jp/~hori/spss/spss.html #samplefactor 探索的因子分析の必要サンプル数求める syntax （参考）１因子当たりの変数の数が増えると必要なケース数は減る

67 第５部モデル知能テスト児玉ら (1978) 『日本版 WISC-R 知能検査法』男女５０人ずつ６歳児１２の下位検査 (1) 知識 (2) 類似 (3) 算数 (4) 単語 (5) 理解 (6) 数唱 (7) 絵画完成 (8) 絵画配列 (9) 積木模様 (10) 組み合わせ (11) 符号 (12) 迷路

71 第１因子に注目

74 Varimax 解

75 varimax 解

76 promax 解ｋ＝４ r=0.444

77 階層因子分析Ｓｔａｔｉｓｔｉｃａ（元ｒ＝０．５１４）

78 モデル直交解でいいのか？ → 一般因子や因子間相関を見えなくする高次因子でいいのか → 斜交の当てはまりの良さを強調する。きちんと理論モデルを立てていないとなにか分かりにくい階層因子分析でいいのか → モデルがあまりきれいでない下位尺度をつくるなら，一般因子があるはず。 – 高次因子または階層因子を想定する → 斜交解いろんなモデルの立て方を学ぶ

79 結局は探索的因子分析である。確定するためには検証するための他の研究が必要因子の単純構造がはっきりしている場合にはどの方法を使っても，因子数を含め簡単に決定できる。人間は何でも解釈できるという欠点をもっている。

1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日.

Similar presentations

Presentation on theme: "1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日."— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

1 心理学の基礎 (6) 因子分析の基本問題 香川大学経済学部 堀 啓造 日本心理学会第回大会 ２０００年１１月６日.

Similar presentations

Presentation on theme: "1 心理学の基礎 (6) 因子分析の基本問題 香川大学経済学部 堀 啓造 日本心理学会第回大会 ２０００年１１月６日."— Presentation transcript:

Similar presentations

About project

フィードバック

1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日.

Presentation on theme: "1 心理学の基礎 (6) 因子分析の基本問題香川大学経済学部堀啓造日本心理学会第回大会２０００年１１月６日."— Presentation transcript: