コメント 狩野裕 (大阪大学 人間科学研究科).

Slides:



Advertisements
Similar presentations
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Advertisements

マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
logistic regression をしたい場合の STATISTICA2000のアプリケーションの使い方について
グラフィカル多変量解析 ----目で見る共分散構造分析----
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
コメント 「ファセット・アプローチの 魅力とパワー」
重回帰分析入門 経済データ解析 2009年度.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
GD07WS マルチレベル共分散構造分析 指定討論
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
突然ですが、 金政分析へのコメント 大阪大学大学院人間科学研究科 平井 啓 2017年3月13日(月)
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
重回帰分析入門 経済データ解析 2011年度.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
日本行動計量学会第29回大会 於:甲子園大学 (2001/9/14-16)
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
SEMFAQ: 共分散構造分析に関する10の質問
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
ワークショップ ユーザーとメーカーの公開相談会
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
構造方程式モデリング(SEM) Structural Equation Modeling.
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
探索的因子分析における変数の選択(2):SEFA2001デビュー 企画:原田 章氏
相関分析.
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
analysis of survey data 堀 啓造
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
クロス表とχ2検定.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
心理学研究の自己点検(6): 心理学研究における 探索的因子分析の基本問題 企画・講演:堀 啓造氏
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

コメント 狩野裕 (大阪大学 人間科学研究科)

ここでの疑問 ①適合度、共通性、因子の負荷量、 最初にどれを指標にして項目選択を すべき?  最初にどれを指標にして項目選択を  すべき? ②適合度指標は色々あるけど、   どれを 参考にすればいいのか?

次の疑問・・・ ③適合度はどこまで上げればいいのか? ④今回は2因子解から始めて、項目選 択をしたけど他にも方法はあるか? ④今回は2因子解から始めて、項目選   択をしたけど他にも方法はあるか?  (因子の数を多いと、一項目の増減で他の項目がうろつ   く場合がある。それを避けるための方法はあるのか?) ⑤どうしても外したくない項目(因子の代表   項目と考えているもの)外せと言ってくるんで  すがどうすればいいのでしょうか?

適合度 適合度評価の考え方 一般的なコンセンサスはない どの指標においても,そこそこの適合が得られて いることが必要 データの相関行列とモデルによる相関行列の食違いの 程度を評価...S-Σ^ 多次元量を1次元に縮約するため多種多様な方法 一般的なコンセンサスはない 開発者は自分が開発した指標を薦める 回帰分析におけるR2においても百家争鳴 査読者に求められたら,素直に報告する どの指標においても,そこそこの適合が得られて いることが必要

いくつかの「側面」 ベース 相対評価 vs 絶対評価 自由度を考慮するか SとΣ^の食い違いを評価 cf. 回帰モデルの場合は,y-y^ 最小モデルを導入する 独立モデル,ゼロモデル 自由度を考慮するか けちの原理(parsimony) 自由度にくらべてどの程度の適合かをみる

好ましい性質 nに依存しないことが望ましい 自由度を考慮した方がよい? 最小モデルの導入については両論ある 自由度dが小さい(パラメータが多い)モデルは適合が良いのはあたりまえ しかし,回帰分析でもR2が活きている 最小モデルの導入については両論ある 回帰分析では「一般平均のみ」の最小モデルを導入している 指標が最小モデルの選択に依存する

比較 自由度による調整 なし 比 差 絶対評価 カイ 2乗値 RMSEA F0, mk AIC 相対評価 GFI AGFI NFI IFI NNFI RFI CFI

補足:指標の定義 自由度による調整

カイ2乗検定について 統計的検定にもとづく方法論 専門家の意見 統計的モデル評価の基本 H0: モデルが正しい H1: モデルが正しくない Do not rely only on the chi-square test Bollen & Long (1993). Testing Structural Equation Models. Sage: CA (page.8)

最後の疑問 今回SEFAをやってみて、項目を削れば 削るほど適合度は上がるという感覚が ある。 それゆえ、適合度だけを考えれば、  削るほど適合度は上がるという感覚が  ある。 それゆえ、適合度だけを考えれば、  項目をどんどん削ってしまいたくなる。 しかし、尺度の妥当性や信頼性係数な  どのことを考えるとできるだけ項目数  を減らしたくないという思いもある。

今回は、二因子から始めた項目数の多  いモデルと、一因子から始めた項目数  の少ないモデルとの間にそれほどの違  いは見られなかったが、そこら辺の  バランスをどのようにとればいいのか? 数理統計的な側面から項目数が多い  場合のモデルと少ない場合のモデル、  双方の特徴と考慮すべき点について  お聞かせください。

仮想抑うつ尺度の作成の例 (平井2001より) 以下の6つの項目からなる尺度を構成 仮想抑うつ尺度の作成の例 (平井2001より) 以下の6つの項目からなる尺度を構成 ◆食欲不振 ◆不眠 ◆うつ気分 ◆意欲減退 ◆焦燥感 ◆希死念慮 について「当てはまる」〜「当てはまらない」の 5件法で回答

抑うつ尺度の仮想データ 対象者:300人

「食欲不振」が適合度を下げている!   

Just fit! α=0.73

そこで 食欲不振をはずした5項目で「抑うつ尺度」を構成し、投稿する 仮想「抑うつ尺度」 適合度は高い 信頼性も十分 項目が少なく、利便性高い

仮想査読者のお言葉 「食欲不振は抑うつの診断において欠かすことのできない指標。よって、この項目を削除することは、この尺度の内容的な妥当性を著しく損なうことになる!」

2つのモデル α=0.86  α=0.76

どちらのモデル(尺度)を採用? 大きなモデル 小さなモデル 第三の道を探る!! 尺度項目が多く,α係数が高いが,適合度の低いモデル 1つの尺度項目を落とし,α係数がやや低いが,適合度は高いモデル 第三の道を探る!!

再分析!! 信頼性=0.77 信頼性=0.68 α=0.86     α=0.86

補遺:信頼性の公式

適合度が低いモデルは? 適合度が低いモデルを採用するのは避けたい ストラテジー 推定値(因子負荷量)が不正確 信頼性が正しく評価できない,α係数が不正確 ストラテジー モデルに合わない変数を落とす 因子モデルからのズレをモデル化する 誤差共分散の導入 解釈できることが重要

比較 信頼性=0.77 信頼性=0.68 α=0.76 α=0.86

結論 内容的妥当性のためどうしても「食欲不振」を 尺度に含めるなければならない,ということであれば,それは可能 統計的分析からわかること ただし,信頼性の低下を甘受しなければならない α係数は不正確 統計的分析からわかること 「食欲不振」と「意欲減退」には予定外の重複があり,それは,(おそらく)尺度には不必要で,信頼性を低下させる原因となっている 次スライド

補足 「食欲」は,意欲減退を除いた 他の項目との相関が低すぎる

STERA STEpwise Reliablity Analysis SEFAの類型 誤差共分散を設定して適合度を改善するモデリングを支援するプログラム