中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京

中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京
多変量解析中山和弘（聖路加国際大学大学院看護学研究科　　看護情報学） 2019年首都大学東京

自己紹介研究テーマ：誰もが、選択肢を知り、それぞれの長所と短所を理解し、自分の価値観に基づいて意思決定できる社会の実現
ヘルスリテラシー、健康生成論「ヘルスリテラシーとストレス対処力の形成により生涯学び成長する介入モデルの開発」科学研究費基盤研究（B)（平成28～31年度）患者中心の情報に基づく意思決定支援「医療の不確実性に翻弄される患者のライフストーリーに沿ったディシジョンエイドの開発」科学研究費挑戦的萌芽研究（平成27～29年度）

毎日新聞連載中

おすすめテキスト

本書の目的看護学で幅広く使われている多変量解析の方法を網羅して、それらをどのように使い分けるのかそこで何が行われていて
何が言えるのかをありのままわかりやすく紹介すること

論文の“生命”は図表統計が得意でなくても、SPSS、SAS、R、STATA、 JMP、Amosなどの統計ソフトがすぐに使えるテキスト
しかし、統計解析を始める以前には、研究計画があり、先行研究のレビューが不可欠文献レビューのために論文を読む時には、その“生命”とも言える図表を見て、そこで何が行われているのかを理解する必要

図表を読めないリスク研究テーマにピッタリと合った解析方法が選ばれていないと、誤った結論が導かれるリスク
解析方法が適切に選ばれていたとしても、そこで何が行われているのか、何か言えるのかが理解されていないために、誤った結論が述べられるリスク

“言いたいこと”を“見える化”する看護学や保健学の領域で統計学の授業や研究の相談や支援を続けて30年ほど
人間の生活や健康といった不確実で複雑な現象をとらえるために、生物的・心理的・社会的・文化的な側面から多様なアプローチずっと学生と共に学んで来たことは、研究テーマの中心（コア）にある人々の“姿や声”を、そのまま多変量解析の形に表して“見える化”することの大切さその作業を通して初めて、 “言いたいこと”について説得力を持って伝えることができる

本書の７つの特徴多変量解析の中心（コア）にあるものを“見える化”するために、円の重なりを使ったベン図を使っている
すべての共通点としての重回帰分析への注目、それは１つの目的変数（従属変数）を、2つ以上の説明変数（独立変数）で説明しようとするものデータを用いてSPSSの出力で説明していること説明変数の種類と役割（媒介変数、調整変数、抑制変数、制御変数）を明確にしていること

説明変数の選び方を大切にしていること（見す見す大切な変数を削除する悲劇を回避するため、ステップワイズのリスク、因子分析の注意点）
統計用語に英語を付けていること学生とのやりとりを基にしたQ&Aがあること

多変量解析とは

仮説目的変数？説明変数A？説明変数B？説明変数C？？？？

例えば、看護師の経験年数と専門的ケア専門的ケア経験年数説明変数？制御変数？？？？

有意な関連　パチパチ？専門的ケア経験年数説明変数？制御変数？関連あり？？

疑似相関を生む交絡変数専門的ケア経験年数探求心ストレス対処能力関連あり？？？？

なぜ？直接？媒介変数(Mediator)？
専門的ケア経験年数すぐれた意思決定研修受講関連あり？？？？

多変量解析の意味

ｒ2 ｒ＝０相関がある＝共分散がある共分散→片方の偏差（＝観測値－平均値）が大きい時、もう一方の偏差も大きい
→偏差のバラツキが2変数で連動している →２変数の分散（偏差の2乗）に重なり →面積＝ｒ2（各分散は１）ｒ2 ｒ＝０

多変量解析＝重回帰分析が基本経験年数 a 専門的ケア研修受講 b 専門的ケア＝a×経験年数＋b×研修受講＋c

相関がある＝分散の重なり経験年数ケア r2 経験年数ケア r＝０

研究は目的変数の分散の説明ケア専門的ケアの実施度にバラツキ＝分散がある質保障として問題なぜ？
何と“共に変動”（＝共分散）しているのかで説明するケア

単相関だけの場合経験ケア研修ケア

多変量解析で説明変数間の相関なし研修ケア経験専門的ケア＝a×経験年数＋b×研修受講＋c

多変量解析で説明変数間に相関あり研修ケア経験中山和弘（聖路加国際大学）

説明変数の直接、間接の関連研修ケア経験

直接効果と間接効果媒介変数(Mediator)
経験年数は直接効果を持たず、間接効果を持つ直接効果専門的ケア経験年数間接効果研修受講

人による＝調整変数(Moderater)＝交互作用
QOL 看護学的ケア対象者の特徴ケアの必要性関連がない？？

QOL 医師 .0 看護師 .4 .5 抑制変数(Suppressor)の存在患者のQOL と医師と看護師の接触時間の相関係数

医師による抑制看護師 QOL 医師

old adage not to ‘judge a book by its cover’
Talamas SN, Mavor KI, Perrett DI (2016) Blinded by Beauty: Attractiveness Bias and Accurate Perceptions of Academic Performance. PLoS ONE 11(2): e

誠実さは強い影響誠実さ学業成績顔の魅力

説明変数の選び方のリスク単相関で有意→多変量解析ステップワイズ理論と仮説経験年数ケア研修顔の魅力

説明変数の間接効果（媒介変数）の大事さ直接効果患者QOL 看護学的ケア 0.15 0.8 間接効果 0.5 医学的ケア

個人レベルと集団レベルの説明変数マルチレベル分析

さらになぜ構造方程式モデリング（SEM）なのか

見えないものを測る多変量解析観測変数直接は測れない心理社会的変数：感情、イメージ、性格、能力、人間関係など（潜在変数）
その概念の存在を引き出すため言葉や行動などで観察（観測変数）概念の「定義」から「妥当性」のあるものを、「信頼性」のために繰り返し測定観測変数潜在変数

観測変数の相関から潜在変数の存在を観測変数潜在変数（因子）観測変数観測変数たとえば「愛」を様々な言葉で問う
愛してる、一緒にいたい、いつも想っている…モノ？同じ返事がある場合（相関が高い観測変数）は、背景に共通した「愛」（潜在変数＝因子がある→　因子分析）観測変数潜在変数（因子）観測変数観測変数

潜在変数は真の値に近い観測値＝真の値＋誤差観測値での相関係数は誤差を含んで低め因子分析後の尺度得点も誤差を含む
観測変数から誤差を取り除いて潜在変数（真の値）で相関を計算すれば？誤差観測変数潜在変数 (真の値) 誤差観測変数誤差観測変数

誤差の少ない説明変数を真の値誤差あり相関係数は直線に近いほど高い

構造方程式モデリング（SEM）共分散構造分析潜在変数を測定して関連の構造をみる因子分析と重回帰分析を同時に行う適合度の明確な理解
潜在変数（真の値）

誤差の大きさと相関係数真の値誤差あり相関係数は直線に近いほど高い

関連の希薄化の修正単項目間の相関係数観測変数ｘ＝説明変数観測変数ｙ＝目的変数項目合計点＝尺度間の相関係数尺度X＝説明変数
尺度Y＝目的変数潜在変数間の相関係数観測変数C 観測変数B 説明変数目的変数誤差誤差観測変数Ａ観測変数D 誤差誤差

変数とパスの種類 →パス ↔相関・潜在変数と観測変数と誤差 →楕円と四角と円で書くことが多い・内生変数と外生変数
　→楕円と四角と円で書くことが多い・内生変数と外生変数　内生変数＝矢印のパスを受けている変数　＝従属変数　→必ず誤差が必要　外生変数＝矢印のパスを受けていない変数　＝独立変数　→誤差不要・パスの種類　→パス　↔相関

パス、相関、誤差観測変数説明変数観測変数観測変数目的変数観測変数観測変数説明変数観測変数誤差誤差誤差誤差誤差

統計学の仕事真の値は直接測ることができないことがほとんどとくに生命現象、意識や行動、社会指標・・
誤差を取り除きたい（コントロールしたい） →統計学の仕事

誤差を取り除いていく尺度化：観測の繰り返しによる観測値の和（平均でもよい）＝真の値の和＋誤差の和
観測値を増やせば、誤差の和は０に近づき、真の値の和に近づく（参考　大数の法則） →尺度化は信頼性を高める潜在変数化＝さらに真の値に近づけるために、観測変数間の相関を用いて、共通している部分を真の値と考え、誤差を取り除いている

測定方程式＝因子分析ｘ1＝a1ｆ＋e1 ｘ2＝a2ｆ＋e2 Ｘ3＝a3ｆ＋e3 観測値＝因子負荷量×因子の値＋誤差
→観測値は真の値である共通の因子と誤差から成り立っている誤差e1 観測変数ｘ1 a1 a2 潜在変数ｆ誤差e2 観測変数ｘ2 誤差e3 観測変数Ｘ3 a3

構造方程式潜在変数f3 潜在変数f2 潜在変数f4 潜在変数f1
測定方程式で作り出した潜在因子間の重回帰分析（パス解析＝重回帰分析の組み合わせ） →構造方程式→名前の由来 f1＝a×f2＋b×f3+c×f4+e1 潜在変数f3 潜在変数f2 潜在変数f4 潜在変数f1

直接効果、間接効果、総合効果がわかる a 説明変数ｘ1 目的変数ｙ1 c b 説明変数ｘ2 目的変数ｙ2 d
ｙ2は、ｘ1から直接効果ｃと間接効果ａ×ｂの影響を受け、総合効果はその和仮にｃが0に近い場合も、間接効果がある

直接効果が小さくても… 患者QOL 0.15 0.8 0.5 看護学的ケア医学的ケア看護学的ケアの間接効果は、0.8×0.5＝0.4
総合効果は、直接効果＋間接効果＝0.55>0.5 直接効果患者QOL 看護学的ケア 0.15 0.8 間接効果 0.5 医学的ケア

誤差間の相関が計算できる誤差の間には相関がある場合もかなりあるｘ1とｘ2の真の値の部分の相関はa1×ａ2
e1とe2の相関がある場合は、a1×ａ2とは無関係の相関代表例　質問文の同一語句による回答（勘違いなど）の誤差によって生じるもの→質問紙に潜む問題を修正した上での真の値（潜在変数）を計算できる誤差e1 観測変数ｘ1 a1 a2 潜在変数ｆ誤差e2 観測変数ｘ2 誤差e3 観測変数Ｘ3 a3

適合度の算出によるモデルの妥当性の検討

適合度＝モデルの妥当性（ずれてない）どんなモデルでも作ろうと思えば作れる潜在変数化もパスを引くことも自由
ただし、データとかけ離れてずれているモデルは問題データとのずれ具合を一定範囲内に収める必要出発点の確認そもそもSEMでは、何をしようとしている・・・

飽和モデル観測変数A 観測変数C 観測変数B 観測変数D 飽和モデル
飽和モデル＝全観測変数の関連のしかたをすべての共分散（相関係数）で説明する→当たり前

潜在変数や少ない関連で説明推定（予測）モデル
それよりも、因果の方向を考えたり、より少ない変数（潜在変数化＝直接観測できない背景にあるものへ、抽象化、概念化）間の関連で説明する推定モデル＝研究者がある意味勝手に作ったもの観測変数Ａ観測変数C 観測変数B 観測変数D 説明変数目的変数誤差推定（予測）モデル

飽和モデルと推定モデルのずれ観測変数A 観測変数C 観測変数B 観測変数D 独立モデル（観測変数間の相関が０）
うまく説明できている程度を見る方法（＝適合度）として、飽和モデルにどれだけ近い説明力を持つか検討する方法（飽和モデルとの差をχ2でみる）飽和モデルとの離れ具合を、独立モデルと比較して検討する方法（NFI、TLI、CFIなど）観測変数A 観測変数C 観測変数B 観測変数D 独立モデル（観測変数間の相関が０）

主な適合度指標のもと χ2 飽和モデルと推定モデルのずれ 0なら完全に適合で、これが帰無仮説有意だと帰無仮説を棄却（＝だからよくない）
200サンプル以下ほどならOKとも言われるが、これを越えるとχ2が大きくなってすぐ有意だから適さない他のほとんどの適合度はχ2の欠点を補正したもの

主な適合度指標 ■RMSEA sqr[(χ2／df －１)／(N － 1)] sqrは平方根square root、Nはサンプル数自由度(観測変数が多く、パスを引かないと大きくなる) も、サンプル数も考慮 .05よりも小さいとよい .08が許容範囲 .1を越えると不適 ■CFI .95以上、許容範囲は.90 　Null model（独立モデル）の（χ2－df ）－提案したモデルの（ χ2－df ） Null model（独立モデルのχ2－df）

モデル間の比較に使えるもの ■AIC（Akaike’s. information criterion）
　χ2 + k(k － 1) － 2df　　kは観測変数の数　k(k－ 1) － 2dfは自由パラメータの数の2倍と一致　小さいほど適合度がよい。基準値はなく、値に絶対的な意味はない。同じデータでモデルを比較するのに利用。自由度を考慮してある。 ■CAIC（Consistant Akaike’s Information Criterion） χ2 +(1+logn)[ k(k － 1) － 2df]／2 nはサンプル数で、AICにさらにサンプル数の影響を考慮どの適合度も、観測変数が変われば見直さなければならない

主な利用法

探索的因子分析（EFA, exploratory factor analysis ）
観測変数ｘ1 観測変数ｘ2 観測変数ｘ3 潜在変数ｆ1 誤差e1 誤差e2 誤差e3 観測変数ｘ4 誤差e4 観測変数ｘ5 誤差e5 潜在変数ｆ2

確証的因子分析（CFA, confirmative factor analysis）
観測変数ｘ1 観測変数ｘ2 観測変数ｘ3 潜在変数ｆ1 誤差e1 誤差e2 誤差e3 観測変数ｘ4 誤差e4 観測変数ｘ5 誤差e5 潜在変数ｆ2

高次因子分析観測変数ｘ1 誤差e1 観測変数ｘ2 潜在変数ｆ1 誤差e2 観測変数ｘ3 誤差e3 潜在変数ｆ3 観測変数ｘ4 誤差e4
観測変数ｘ5 誤差e5 潜在変数ｆ2 潜在変数ｆ3

多母集団同時分析(例.男女別)

パネル（時系列）データによる因果の向きの決定
Ｘが原因かＹが原因か？結果に影響するまで時間を要するのか、同時に変動するのか？ Cross-laggedモデル Synchronousモデル X：T1 X：T2 Y：T1 Y：T2 X：T1 X：T2 Y：T1 Y：T2

見えない変数の「見える化」でケアの構造の解明し、理論化を
生物学的状況 QOL 行動（ストレス対処含む）心理社会的状況環境

多変量解析：解析の５つのゴール（Tabachnick）
グループ間の平均値の差（目的=量、説明＝質メイン）　　　例. ケアの有無によるQOL得点の差変数間の相関、予測（目的=量、説明＝量メイン）　　　例. 不安とQOLの関連変数による類似性をもとにした対象のグループ分け、分類　（目的=質、説明＝量、質）　　　例. 手術を受けるか受けないかの予測できごとの経時的変化　（目的=量、時間、説明＝時間メイン）　　　例. 回復時間への年齢の影響類似した変数をいくつかにまとめてその間の構造をみる　（目的＝潜在変数メイン、説明＝潜在変数メイン）　　　例. 患者の意思決定のプロセスの構造

目的変数と説明変数説明変数（独立変数）目的変数（説明変数）予測因子基準治療、ケアアウトカムインプットアウトプット刺激反応
要因得点原因結果 X Y

グループ間の平均値の差ゴール解析方法目的変数（従属変数）説明変数（独立変数）共変量数タイプ 1 2- 質量時間 1- 平均値の差共分散分析ANCOVA ○ 多変量分散分析MANOVA 多変量共分散分析MANCOVA 反復測定の多変量解析共変量は、実験系では、目的変数に関連した量的変数、広義には目的変数と説明変数の関連をゆがめる可能性のある元々存在するケース間の差を制御する変数

変数間の相関、予測ゴール解析方法目的変数（従属変数）説明変数（独立変数）共変量数タイプ 1 2- 質量時間 1-
1 2- 質量時間 1- 相関、予測重回帰分析 ○ 階層的重回帰分析 ○　マルチレベル分析、混合モデル

対象のグループ分け、分類ゴール解析方法目的変数（従属変数）説明変数（独立変数）共変量数タイプ 1 2- 質量時間 1- グループ分け判別分析 ○ ロジスティック回帰分析階層的ロジスティック分析ロジスティック回帰分析では、目的変数が2値なら、２項ロジスティック回帰、３カテゴリー以上なら、多項ロジスティック回帰、順序尺度なら順序ロジスティック回帰

できごとの経時的変化ゴール解析方法目的変数（従属変数）説明変数（独立変数）共変量数タイプ 1 2- 質量時間 1- グループ分け生存時間分析 ○ 時系列分析生存時間分析は、何かが起こるまでの時間を分析。何ヶ月間、何日間、何時間、何分間というデータであれば変数として分析が可能。例えば、ケアや患者・看護師の行動などの開始時間、継続期間、中断期間、終了時間など。時系列分析は、過去のデータ同士がどのように似ているかを分析し、未来を予測。介入後の変化も分析可能。

構造をみる主成分分析と因子分析の違いは、新しく抽出された変数（潜在変数）が、主成分分析では目的変数で、因子分析では説明変数であること
ゴール解析方法目的変数説明変数共変量数タイプ 1 2- 質量時間 1- グループ分け主成分分析 ○ 因子分析構造方程式モデリングSEM SEM（確証的因子分析）主成分分析と因子分析の違いは、新しく抽出された変数（潜在変数）が、主成分分析では目的変数で、因子分析では説明変数であること SEMでは、1つ以上の潜在変数と量的変数が、目的変数と量的変数の両方に使われている

中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京

Similar presentations

Presentation on theme: "中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

中山和弘（聖路加国際大学大学院看護学研究科 看護情報学） 2019年首都大学東京

Similar presentations

Presentation on theme: "中山和弘（聖路加国際大学大学院看護学研究科 看護情報学） 2019年首都大学東京"— Presentation transcript:

Similar presentations

About project

フィードバック

中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京

Presentation on theme: "中山和弘（聖路加国際大学大学院看護学研究科看護情報学） 2019年首都大学東京"— Presentation transcript: