構造方程式モデリング(SEM) Structural Equation Modeling.

Slides:



Advertisements
Similar presentations
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
Advertisements

2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
多変量解析入門 基礎からSEMまで 中山和弘(聖路加国際大学).
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ分析入門(12) 第12章 単回帰分析 廣野元久.
科学技術振興機構 (現所属は統計数理研究所) 尾崎幸謙
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
コメント 狩野裕 (大阪大学 人間科学研究科).
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
共分散構造分析(SEM)は パス解析,因子分析,分散分析のすべてにとって代わるのか?
重回帰分析入門 経済データ解析 2009年度.
因子分析と共分散構造分析 狩野 裕 大阪大学人間科学部 日本行動計量学会 春の合宿セミナー
実証分析の手順 経済データ解析 2011年度.
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
コメント 狩野 裕 大阪大学人間科学部 日本心理学会ワークショップ 「探索的因子分析における変数の選択(3)」
突然ですが、 金政分析へのコメント 大阪大学大学院人間科学研究科 平井 啓 2017年3月13日(月)
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
重回帰分析入門 経済データ解析 2011年度.
日本行動計量学会第29回大会 於:甲子園大学 (2001/9/14-16)
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
SEMFAQ: 共分散構造分析に関する10の質問
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
ワークショップ ユーザーとメーカーの公開相談会
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
データ解析 静岡大学工学部 安藤和敏
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
多変量解析入門 中山和弘(聖路加国際大学).
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
東京工科大学 コンピュータサイエンス学部 亀田弘之
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
第3章 線形回帰モデル 修士1年 山田 孝太郎.
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
クロス表とχ2検定.
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
相関分析 2次元データと散布図 共分散 相関係数.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析入門 経済データ解析 2011年度.
疫学概論 時系列研究 Lesson 11. 記述疫学 §B. 時系列研究 S.Harano,MD,PhD,MPH.
中山和弘(聖路加国際大学大学院看護学研究科 看護情報学) 2019年首都大学東京
Presentation transcript:

構造方程式モデリング(SEM) Structural Equation Modeling

構造方程式モデリング(SEM) 共分散構造分析 潜在変数を測定して 関連の構造をみる 因子分析と重回帰 分析を同時に行う 適合度の明確な理 解 潜在変数(真の値)

測定方程式=因子分析 x1=a1f+e1 x2=a2f+e2 X3=a3f+e3 観測値=因子負荷量×因子の値+誤差 →観測値は真の値である共通の因子と誤差から成り立っている 誤差e1 観測変数x1 a1 a2 潜在変数f 誤差e2 観測変数x2 誤差e3 観測変数X3 a3

構造方程式 潜在変数f3 潜在変数f2 潜在変数f4 潜在変数f1 測定方程式で作り出した潜在因子間の重回帰分 析(パス解析=重回帰分析の組み合わせ) →構造方程式→名前の由来 f1=a×f2+b×f3+c×f4+e1 潜在変数f3 潜在変数f2 潜在変数f4 潜在変数f1

変数とパスの種類 →パス ↔相関 ・潜在変数と観測変数と誤差 →楕円と四角と円で書くことが多い ・内生変数と外生変数  →楕円と四角と円で書くことが多い ・内生変数と外生変数  内生変数=矢印のパスを受けている変数  =従属変数 →必ず誤差が必要  外生変数=矢印のパスを受けていない変数  =独立変数 →誤差不要 ・パスの種類  →パス ↔相関

パス、相関、誤差 観測変数 説明変数 観測変数 観測変数 目的変数 観測変数 観測変数 説明変数 観測変数 誤差 誤差 誤差 誤差 誤差

Semのメリット

関連の希薄化の修正 単項目間の相関係数 観測変数x=説明変数 観測変数y=目的変数 項目合計点=尺度間の相関係数 尺度X=説明変数 尺度Y=目的変数 潜在変数間の相関係数 観測変数C 観測変数B 説明変数 目的変数 誤差 誤差 観測変数A 観測変数D 誤差 誤差

誤差の大きさと相関係数 真の値 誤差あり 相関係数は直線に近いほど高い

誤差を取り除いていく= 尺度化:観測の繰り返しによる観測値の和(平均 でもよい)=真の値の和+誤差の和 観測値を増やせば、誤差の和は0に近づき、真の 値の和に近づく(参考 大数の法則) →尺度化は信頼性を高める  潜在変数化=さらに真の値に近づけるために、観測 変数間の相関を用いて、共通している部分を真の 値と考え、誤差を取り除いている

直接効果、間接効果、総合効果がわかる a 説明変数x1 目的変数y1 c b 説明変数x2 目的変数y2 d y2は、x1から直接効果cと間接効果a×bの影響を受け、総合効果はその和 仮にcが0に近い場合も、間接効果がある

直接効果が小さくても… 患者QOL 0.15 0.8 0.5 看護学的ケア 医学的ケア 看護学的ケアの間接効果は、0.8×0.5=0.4 総合効果は、直接効果+間接効果=0.55>0.5 直接効果 患者QOL 看護学的ケア 0.15 0.8 間接効果 0.5 医学的ケア

誤差間の相関が計算できる 誤差の間には相関がある場合もかなりある x1とx2の真の値の部分の相関はa1×a2 e1とe2の相関がある場合は、a1×a2とは無関係の相関 代表例 質問文の同一語句による回答(勘違いなど)の誤差によって生じるもの→質問紙に潜む問題を修正した上での真の値(潜在変数)を計算できる 誤差e1 観測変数x1 a1 a2 潜在変数f 誤差e2 観測変数x2 誤差e3 観測変数X3 a3

適合度がわかる =モデルの妥当性(ずれてない) どんなモデルでも作ろうと思えば作れる 潜在変数化もパスを引くことも自由 ただし、データとかけ離れてずれているモデルは問題 データとのずれ具合を一定範囲内に収める必要 出発点の確認 そもそもSEMでは、何をしようとしている・・・

飽和モデル 観測変数A 観測変数C 観測変数B 観測変数D 飽和モデル 飽和モデル=全観測変数の関連のしかたをすべての共分散(相関係数)で説明する→当たり前

潜在変数や少ない関連で説明 推定(予測)モデル それよりも、因果の方向を考えたり、より少ない変数 (潜在変数化=直接観測できない背景にあるもの へ、抽象化、概念化)間の関連で説明する推定モ デル=研究者がある意味勝手に作ったもの 観測変数A 観測変数C 観測変数B 観測変数D 説明変数 目的変数 誤差 推定(予測)モデル

飽和モデルと推定モデルのずれ 観測変数A 観測変数C 観測変数B 観測変数D 独立モデル(観測変数間の相関が0) うまく説明できている程度を見る方法(=適合度) として、飽和モデルにどれだけ近い説明力を持つか検 討する方法(飽和モデルとの差をχ2でみる) 飽和モデルとの離れ具合を、独立モデルと比較して 検討する方法( CFI 、NFI、TLI、など) 観測変数A 観測変数C 観測変数B 観測変数D 独立モデル(観測変数間の相関が0)

主な適合度指標のもと χ2 飽和モデルと推定モデルのずれ 0なら完全に適合で、これが帰無仮説 有意だと帰無仮説を棄却(=だからよくない) 200サンプル以下ほどならOKとも言われるが、これを 越えるとχ2が大きくなってすぐ有意だから適さない 他のほとんどの適合度はχ2の欠点を補正したもの

主な適合度指標 ■RMSEA sqr[(χ2/df -1)/(N - 1)] sqrは平方根square root、Nはサンプル数 自由度(観測変数が多く、パスを引かないと大きくなる)も、 サンプル数も考慮 .05よりも小さいとよい .08が許容範 囲 .1を越えると不適 ■CFI .95以上、許容範囲は.90  Null model(独立モデル)の(χ2-df )-提案したモデルの( χ2-df ) Null model(独立モデルのχ2-df)

モデル間の比較に使えるもの ■AIC(Akaike’s. information criterion)  χ2 + k(k - 1) - 2df  kは観測変数の数 k(k- 1) - 2dfは自由パラメータの数の2倍と一致  小さいほど適合度がよい。基準値はなく、値に絶対的な意味 はない。同じデータでモデルを比較するのに利用。自由度を考 慮してある。 ■CAIC(Consistant Akaike’s Information Criterion ) χ2 +(1+logn)[ k(k - 1) - 2df]/2 nはサンプル数 で、AICにさらにサンプル数の影響を考慮 どの適合度も、観測変数が変われば見直さなければならない

主な利用法

探索的因子分析(EFA, exploratory factor analysis ) 観測変数x1 観測変数x2 観測変数x3 潜在変数f1 誤差e1 誤差e2 誤差e3 観測変数x4 誤差e4 観測変数x5 誤差e5 潜在変数f2

確証的因子分析(CFA, confirmative factor analysis) 観測変数x1 観測変数x2 観測変数x3 潜在変数f1 誤差e1 誤差e2 誤差e3 観測変数x4 誤差e4 観測変数x5 誤差e5 潜在変数f2

高次因子分析 観測変数x1 誤差e1 観測変数x2 潜在変数f1 誤差e2 観測変数x3 誤差e3 潜在変数f3 観測変数x4 誤差e4 観測変数x5 誤差e5 潜在変数f2 潜在変数f3

多母集団同時分析(例.男女別)

潜在曲線(成長)モデル 1 0 2 1次 0,1,2,3… 2次 0,1,4,9… 切片1 時間1 T1 誤差e1 時間2 T2 誤差e2 傾き1 1 2 0 1次 0,1,2,3… 2次 0,1,4,9…

パネル(時系列)データによる因果の向きの決定 Xが原因かYが原因か? 結果に影響するまで時間を要するのか、同時に変動するのか? Cross-laggedモデル Synchronousモデル X:T1 X:T2 Y:T1 Y:T2 X:T1 X:T2 Y:T1 Y:T2