1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ解析
データ分析入門(12) 第12章 単回帰分析 廣野元久.
平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
共分散構造分析(SEM)は パス解析,因子分析,分散分析のすべてにとって代わるのか?
コメント 「ファセット・アプローチの 魅力とパワー」
因子分析と共分散構造分析 狩野 裕 大阪大学人間科学部 日本行動計量学会 春の合宿セミナー
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
林俊克&廣野元久「多変量データの活用術」:海文堂
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
日本行動計量学会第29回大会 於:甲子園大学 (2001/9/14-16)
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
データ分析入門(13) 第13章 主成分分析 廣野元久.
主成分分析                     結城  隆   .
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
12月4日 伊藤 早紀 重回帰分析.
回帰分析/多変量分析 1月18日.
主成分分析と因子分析 による競馬の勝因の研究
ワークショップ ユーザーとメーカーの公開相談会
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
構造方程式モデリング(SEM) Structural Equation Modeling.
補章 時系列モデル入門 ー 計量経済学 ー.
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
探索的因子分析における変数の選択(2):SEFA2001デビュー 企画:原田 章氏
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
潜在変数に交互作用がある 構造方程式モデル(共分散構造モデル): 二段階最小二乗推定値
独立成分分析 (ICA:Independent Component Analysis )
主成分分析 Principal Component Analysis PCA
東京工科大学 コンピュータサイエンス学部 亀田弘之
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
分散分析、判別分析、因子分析.
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
心理学研究の自己点検(6): 心理学研究における 探索的因子分析の基本問題 企画・講演:堀 啓造氏
Presentation transcript:

1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学

2 主成分分析( PCA ) 観測変数の合成変数( PC )を作成 – 観測変数は PC の構成要素 PC は結果系変数

3 因子分析( FA ) FA は外的基準しかないモデル – 観測変数が従属変数となる同時回帰モデル – 原因系変数である潜在変数を探索・検証す る – 観測変数は潜在変数と共変

4 まとめると

5 推定についての定義 「独自性(誤差) 」を評価するかしな いか –PCA 誤差なしで分析 –FA 誤差を入れて分析 「共通性」という概念を使うならば FA

6 定義のまとめ 成分・因子(構成概念)が原因系か結果系か – 結果ならば PCA – 原因ならば FA 推定方法 誤差の扱い –PCA 観測変数は構成概念の構成要素であり誤差は無視可能 –FA 観測変数には構成概念の情報以外に誤差が含まれている

7 例: Bollen(1989, p.65) 人種・性別⇒差別 結婚・離婚・解雇・昇進⇒ストレス 自尊心⇒ “ I feel that I am as good as the next person ”

8 例:豊田 (1992) 因子分析は心理学における知能の研究にしば しば用いられるが,それは知能(構成概念) が高いことが原因でテスト得点(観測変数) が高くなると考える方が,テストの成績が高 いことが原因で知能が高くなると考えるより 自然だからである.主成分分析は経済学の各 種指標にしばしば用いられるが,それはたと えば物価 ( 観測変数 ) が高いことが原因で,そ の結果として物価指数(構成概念)を高く設 定すると考える方が,物価指数が高いことが 原因で物価が高くなると考えるより自然だか らである.

9 FA がふさわしい状況で PCA を使うと 良い点 –PCA は安定している まずい点 – 誤差を無視した分析 一般に V(Y) の半分以上は誤差 – 因子負荷が不当に大きく推定される PCA の方が魅力的な分析結果にみえる

10 PCA のバイアス

11 SMC と最終共通性の比較

12 FA がふさわしい状況だが うまく分析できないため PCA を 使う セカンドベストという意味で許容? –PCA よりも非反復主因子法を勧めたい いつも FA でうまく分析できるとは限らない – 二値変数が含まれている – 四分位相関を分析している – 分布が極度に標準分布から外れている – 標本サイズが十分大きくない – 2変数にしか関わらない因子がある – 局所独立性が崩れている – 他

13 PCA がふさわしい状況で FA を使うと あえて FA を使う意義はない 推定に問題が生じることがある – 変数間の相関が高くないことがある – 不適解 – 反復の非収束

14 テクニカルな分析 PCA の高めのバイアスは,因子負荷量 の2乗和大きければ緩和される – 因子負荷量が大きい – 項目数が多い 項目数が無限に多くなると一致 因子負荷量 主成分負荷量

15 FA は不安定である PCA よりも複雑なので不安定 – モデル探索に向かない 分析過程においては安定した 非反復主因子法を利用することができる 最終結果においては,できれば「最尤 解」,つぎに「反復主因子解」を報告し たい

16 SEM のススメ FA がふさわしい状況だがうまく分析できないと き – 二値変数が含まれている.四分位相関を分析してい る SEM は二値変数を適切に分析可 – 分布が極度に標準分布から外れている 変数変換,変数の削除 – 標本サイズが十分大きくない CFA は EFA よりも安定 – 2変数にしか関わらない因子がある CFA で分析可 – 局所独立性が崩れている 誤差相関のある CFA で分析

17 まとめ 因果の方向によってモデルを決める – たとえ分析結果が似ていても,使うべき分 析方法を使う FA は PCA に比べて不安定である – モデル探索の過程では,非反復主因子法・ PCA を用いてもよい – 最終結果は最尤解・反復主因子解を報告す る –SEM の利用も考えてみる