観測変数に共通する原因を推定 分散と共分散を最大限に表現 反復による高精度化

Similar presentations


Presentation on theme: "観測変数に共通する原因を推定 分散と共分散を最大限に表現 反復による高精度化"— Presentation transcript:

1 観測変数に共通する原因を推定 分散と共分散を最大限に表現 反復による高精度化
因子分析 観測変数に共通する原因を推定 分散と共分散を最大限に表現 反復による高精度化

2 観測変数に共通する原因を推定 人口 x 旅券発行 割合 y 結婚率 z 共通因子 F 主成分分析が,複数の観測変数から,新しい指標を 合成 するのに対し,因子分析は観測変数に 共通する因子 (原因)を括りだすことが目的

3 1因子モデルを定式化 共通因子 F: 複数の変数に影響する共通の因子 独自因子 ex,ey,ez:共通因子で説明しきれない 変数ごとの情報
人口 x 旅券発行 割合 y 結婚率 z 共通因子 F 共通因子 F: 複数の変数に影響する共通の因子 独自因子 ex,ey,ez:共通因子で説明しきれない            変数ごとの情報 因子負荷量 a,b,c: 共通因子が各変数に影響する強さ パス図 主成分分析とは 矢印の向きが逆 共通因子 F 人口 x 旅券発行割合y 結婚率 z ex ey ez

4 目標は分散と共分散 簡単化された式 実測値の分散と共分散をもっとも正確に表現する数式 共通因子と独立因子に 相関がない
たとえば,xの分散 sx2 と, xとyの共分散 sxy は となり,複雑すぎる.よって,以下の現実的仮定を導入 共通因子と独立因子に 相関がない 独立因子に 相関がない 簡単化された式

5 実測データを標準化(standardization) 8歳の中では大きい人は,大人の中では小さい
平均をとる ⇒  母集合の大小 からの脱却 平均を0にする ⇒ 平均値の違い からの脱却   (ex) 象と蚤の体重の比較 標準偏差σで割る ⇒ 散らばり具合 からの脱却 (ex) ガソリンは米ではgal,日本ではℓ.単位を捨てる 標準化(平均を0,分散を1に) モデルで,x, y, z,Fの分散を1に,共分散は 相関係数 に      [理由] xとyの相関係数 = (x,yの共分散)/ (xの標準偏差)(yの標準偏差) 結局,分散・共分散を用いた1因子モデルの定式化は は平均 は標準偏差

6 標準化された表より計算 表から相関係数を計算して 掛け合わせて ab,bc,caで割って 人口,旅券発行,婚姻率のそれぞれに対して,
全国平均が0,標準偏差が1.0になるように標準化

7 因子の解釈 因子の解釈 探索的 因子分析(今回はこちら) 確認的 因子分析 F は地域の生活の活性度を表現
共通因子 F 0.857 0.879 因子の解釈 F は地域の生活の活性度を表現 探索的 因子分析(今回はこちら) 因子の意味を仮定せずに分析し,最後に意味を考える 確認的 因子分析 因子の意味を最初から仮定して分析を進める 0.864 人口 x 旅券発行割合y 結婚率 z ex ey ez

8 複数の因子 5変数を2因子で説明する場合 数式から計算した 分散・共分散 が,実測値の分散・共分散にできるだけ一致するように,各因子負荷量を決定 すべての観測値は標準化したものを使用 分散は 1 共分散は 相関係数 主成分分析と同じ,成績データ

9 3つの仮定 共通因子と独自因子は独立で相関がない 相関があるなら,独自因子にまだ共通性が残っている 独自因子どうしは独立で相関がない
共通因子と独自因子は独立で相関がない 相関があるなら,独自因子にまだ共通性が残っている 独自因子どうしは独立で相関がない 共通因子どうしは独立で相関がない 2つの原因は無関係. (一般には言えない) 数学 x 理科 y 社会 u ex ey eu 英語 v ev 国語 w ew 0.912 0.882 共通因子 F G ax ay au bx bw

10 分散を計算 のうち, とおく. これは共通因子F, Gを使って計算した x の予測値. 同様にして 分散の公式③より FとGは無相関
            のうち,         とおく. これは共通因子F, Gを使って計算した x の予測値. 同様にして 分散の公式③より FとGは無相関 公式②より F,Gはex とは無相関 先の結果より

11 共分散を計算 分散の公式⑤より     公式⑤より ○以外は 0と仮定 分散の公式④より 分散の公式①より 同様にして

12 因子分析の基本方程式 (分散は1,共分散は相関係数)

13 基本方程式を行列で表現 基本方程式を 相関係数の対称行列 ( 相関行列 )を用いて,以下のように表すことができる.
(相関係数は 実測値 より求めることに注意)

14 共通性 であり,かつ, だから xの分散 = 1 独自因子の分散 hx2 : xのもつ情報量のうちで共通因子が説明する情報の量
            であり,かつ, だから 数学 x 理科 y 社会 u ex ey eu 英語 v ev 国語 w ew 0.912 0.882 共通因子 F G ax ay au bx bw xの分散   = 1 独自因子の分散 hx2 : xのもつ情報量のうちで共通因子が説明する情報の量 xの共通性と呼ばれる.

15 x, y, u, v, w の 共通性 xの共通性 yの共通性 uの共通性 vの共通性 wの共通性

16 基本方程式の独自因子に着目

17 左辺の対角成分が共通性 左辺へ独自因子を移項すると,対角成分が 共通性 になっている

18 共通性の推定 左辺の対角成分 を推定できれば,左辺はすべて既知

19 共通性の算出(SMC法) 先の行列を解くには共通性の推定が必須 SMC(Squared Multiple Correlation)法
            のうち,         は 共通因子F, Gを使って計算したx の予測値.よって決定係数は よって           となり,因子分析せずとも,重回帰分析で 決定係数を求めれば,それを共通性として使える. (先の分散の計算での算出結果とsx2=1より)

20 因子決定行列 を因子決定行列と呼ぶ. [ex] 主成分分析でも用いた20人の成績データで相関係数を計算. 共通性はSMC法で求める.
相関行列の主対角成分は,重回帰分析の決定係数R2で

21 対称行列のスペクトル分解  の固有値をλ1>λ2 > λ3 > λ4 > λ5 とし, w1, w2, w3, w4, w5をそれぞれの固有値に対する,長さが1の固有ベクトルとすると, は以下のように書ける. (ここで,w1tはw1の転置を表す.) 仮に,λ1とλ2が他の固有値に比べて十分大きいとすれば,上式の第3項以降を無視して, と書ける.

22 因子決定行列の近似 のとき,直前の近似式を 成分で書き下すと (2)のように書ける.

23 (1)式の右辺 (1)式の右辺は,以下のよう書けることに注意しよう.

24 主因子法 (2)と(3)はともにRFに等しいから 両辺を見比べて となり,因子負荷量が計算できる

25 反復主因子法 START YES NO END 主因子法は近似法であるため誤差を小さくする必要あり SMC法で 共通性を推定 因子負荷量を
主因子法で計算 YES 共通性を因子負荷量から計算 推定値=計算値? NO END 共通性について 推定値←計算値

26 因子負荷行列 得られた因子負荷量を並べた行列 を 因子負荷行列と呼ぶ. 20人の学生の成績の例で計算すると A=
因子負荷行列を使うと(1)の右辺は以下のように書ける.

27 各因子はどれぐらい全体を表現している? 因子負荷量を図示すると
1 x 全情報量=5 y w

28 寄与率と総共通性

29 解の不定性 因子分析の基本方程式について,たとえば, を考えると, であり, と の大きさと内積の値を指定したもの. ベクトルの大きさと内積は 回転しても値に 変化がない. 回転したベクトルも基本方 程式を満たす解となる 解は 1つに決まらない 回転

30 バリマックス回転 (Varimax rotation)
解となる因子負荷量のベクトル のいずれかを,できるだけ因子軸に近づけるように回転する. たとえば, だから, を因子軸 F に近づけるとすると, Fに,観測変量 x を一致させることになる. 因子の解釈を楽にする G 国語 G 国語 学生の成績の例で因子負荷量ベクトルをF-G平面にプロット 数学をFの軸に一致 英語 社会 数学 英語 理科 社会 F 数学 理科 F 回転

31 2因子の解釈 回転後のグラフをみると F は英語,数学, 理科,社会など, 理論系の科目が集中. 国語はFとGの中間
国語は,理論と感情 の双方が必要 Fは理論的能力(左脳) Gは感情の豊かさ(右脳) と捉えると説明がつく. 数学 x 理科 y 社会 u ex ey eu 0.956 0.000 英語 v ev 国語 w ew 0.912 0.882 0.344 共通因子 F G 0.909 -0.067 0.081 0.213 0.614

32 まとめ 相関行列と資料より求める 観測量を因子負荷量×共通因子の和で表現 SMC法で共通性を計算 初期の因子決定行列をつくる
因子決定行列のスペクトル分解 因子負荷行列を求める 共通性が一致するまで反復 回転して,特定の観測変数を因子と一致させる 因子の意味を解釈


Download ppt "観測変数に共通する原因を推定 分散と共分散を最大限に表現 反復による高精度化"

Similar presentations


Ads by Google