平均構造モデル・多母集団の同時分析 実験データの分析 潜在曲線モデル

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
グラフィカル多変量解析 ----目で見る共分散構造分析----
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
パネル分析について 中村さやか.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
実証分析の手順 経済データ解析 2011年度.
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
日本行動計量学会第29回大会 於:甲子園大学 (2001/9/14-16)
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
ワークショップ ユーザーとメーカーの公開相談会
構造方程式モデリング(SEM) Structural Equation Modeling.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
狩野 裕 大阪大学 大学院人間学研究科 行動データ科学研究分野
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
独立成分分析 (ICA:Independent Component Analysis )
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
尺度化について 狩野 裕 大阪大学人間科学部.
母音[i]のF1, F2平均値の分析.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
クロス表とχ2検定.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
相関分析 2次元データと散布図 共分散 相関係数.
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

平均構造モデル・多母集団の同時分析 実験データの分析 潜在曲線モデル 第3章 共分散構造分析で何ができる:応用編 平均構造モデル・多母集団の同時分析 実験データの分析 潜在曲線モデル

AMOSマニュアル 例9&例16 EQSマニュアル 第9章 狩野(1997/3) BASIC 数学 3.1節 平均構造モデルと多母集団の同時分析 トレーニング効果の分析 出展:Sorbom(1978) AMOSマニュアル 例9&例16 EQSマニュアル 第9章 狩野(1997/3) BASIC 数学

データ:Olsson(1973)     コントロール群(n=105)  一回目のテスト 二回目のテスト  類似語 反対語 類似語 反対語 分散・共分散  37.626  24.933 34.680  26.639 24.236 32.013  23.649 27.760 23.565 33.443 平均  18.381 20.229 20.400 21.343     トレーニング群(n=108)  一回目のテスト 二回目のテスト  類似語 反対語 類似語 反対語 分散・共分散  50.084 42.373 49.872 40.760 36.094 51.237 37.343 40.396 39.890 53.641 平均 20.556 21.241 25.667 25.870

データの素性 語彙(同意語と反対語)に関するテストを 一ヶ月おいて2回繰り返し実施する トレーニング群には,2回のテスト間に, 語彙に関するトレーニングを3回行う コントロール群には何もしない

解析目的と留意点 目的 留意点 トレーニング効果の有無を検討したい 1回目のテストの練習効果を消す 2つの群への被験者割付のばらつきを 調整したい 2種のテストを同時に分析したい 次元縮小をしてから分析 希薄化を修正してから分析

平均の比較

平均構造モデル コントロール群の分析 練習効果の評価

基本モデルと推定結果 Chi-square=0 (df=0)

標準解 Chi-square=0 (df=0)

通常は(潜在変数の)平均は0に固定してある 0, 0, 0, 0, 18.38 20.23 20.40 21.34 0, 0, 0,

潜在変数の平均の意味 二回目のテストで平均が上昇しているのは一回目のテストがトレーニングになっているからである これを,語彙に関する力が(やや)ついたからだと解釈しよう つまり,E(post_verbal)>0 となったとして, この平均に関する推測を行う

潜在変数に平均を導入する 18.58 20.05 18.58 20.05 0, 1.68

テスト受験効果あり

因子平均と切片     平均      切片      因子平均 データ  モデル pre_syn 18.38 18.58 = 18.58+1.00×0 pre_opp 20.23 20.05 = 20.05+0.90×0 post_syn 20.40 20.26 = 18.58+1.00×1.68 post_opp 21.34 21.48 = 20.05+0.85×1.68 切片:① データが採られた状況に依存する量      問題のレベル,採点の方法...   ② 因子からの影響を受ける前の平均

多母集団の同時分析

多母集団の同時分析 トレーニング群とコントロール群を二つの母集団とみて分析する. 37.626 24.933 34.680     コントロール群(n=105)  一回目のテスト 二回目のテスト  類似語 反対語 類似語 反対語 分散・共分散  37.626  24.933 34.680  26.639 24.236 32.013  23.649 27.760 23.565 33.443 平均  18.381 20.229 20.400 21.343     トレーニング群(n=108)  一回目のテスト 二回目のテスト  類似語 反対語 類似語 反対語 分散・共分散  50.084 42.373 49.872 40.760 36.094 51.237 37.343 40.396 39.890 53.641 平均 20.556 21.241 25.667 25.870

個別分析:コントロール群

個別分析:トレーニング群

同時分析の手順 個別分析を行う 統計的検定により,群間のパラメータが 等しい(等置制約)かどうかを検討する 等置制約の無い最も制約のゆるいモデルからスタートし,徐々に制約の数を増やし,最後に全部のパラメータが等しいという 最も制約が強いモデルを検討する

モデルの検討

最終モデル:コントロール群

最終モデル:トレーニング群

平均構造の入れ方 個別分析では,観測変数の平均(切片項)をPREとPOSTで等置することにより,潜在変数 pre_verbal と post_verbal の平均間の比較が できるようになった 同時分析では,さらに,観測変数の平均(切片項)を群間で等置する 潜在変数 verbal の4つの平均が比較可能になる. E[pre_verbal_c]=0 とおくことで, E[pre_verbal_t], E[post_verbal_t], E[post_verbal_t] が推定できる

母集団の非均一性を調整した トレーニング効果         E[post_v] E[pre_v] トレーニング群(T)6.94 = 5.31+0.90 × 1.81 コントロール群(C)1.61 = 1.61+0.90 × 0 差     5.33 3.70

平均差3.70の意味 トレーニングによって,潜在変数 post_verbal の平均が 3.70 上昇する. 被験者の割付けの偏りを修正したもの 一回目のテストの受験効果を除いた純粋な効果 (一回目のテストを受けず)3回のトレーニングだけすると, post_verbal の平均が 3.70 上昇することが期待される テスト得点に関しては,synonyms は 3.70点,opposites は 3.70×0.89=3.29点 の上昇が見込める.

分析方法についてのまとめ 潜在変数(因子)の平均 平均構造モデル 同一の内容を測っている因子の平均は比較可能である.一方の平均を0とおく 男女間の比較など,多母集団の同時分析で因子平均の比較ができる 平均構造モデル 独立変数にはその変数の平均を,従属変数には切片項を設定する

分析方法についてのまとめ:続 多母集団の同時分析 複数の母集団間で似た構造が認められることがある 因果モデルが,どの程度母集団間で等置できるか 測定モデルの同等性,構造モデルの同等性を 検討する 母集団間で潜在変数平均が比較可能

簡便法

トレーニング効果の検定 簡便法 training を表すグループ変数(X5=0,1)を 分析に組み入れる 共分散行列の等質性の仮定が必要

データ

モデルと推定結果

分析結果のまとめ 簡便法からも,多母集団の同時分析と 同様の結論が得られるようである しかし,実は,群間で共分散行列が等質であるという仮定が必要である 多母集団の同時分析で,この仮定は偽であることが分かっている. このデータに対しては,簡便法は適切な分析とは言いがたい.

二値変数を含む解析について 二値変数が独立変数であるときは,それを連続な変数とみなして分析しても罪は重くない 群間で共分散行列が等質であるという仮定のチェックが必要 二値変数が従属変数であるときは,特殊な推定 方法が要求される LISREL,EQS,Mplus などのプログラムでは分析可能 2群のデータを合併して分析するときは,群を0,1で表した変数Xを導入し,この変数がどの様に他の変数に効くかをモデル化して分析する必要あり 合併したデータを上記Xを入れずに分析するのはマズイ

実験データの分析について 共分散構造分析で実験データの分析を することができる 代表的な分析方法が,多母集団の同時 分析である. 実験条件を0,1の記号で表し分析する 簡便法もある 共分散行列の等質性 比較する群が多いときには,簡便法しか 適用できないことがある

3.2節 実験データの分析 顧客満足度データの分析 出展:Churchill and Surprenant (1982 JMR) An investigation into the determinants of customer satisfaction 「菊の花」 の満足度を測定する

CSの基礎理論 期待度 顧客満足度 (知覚された) 不一致度 (知覚された) パフォーマンス 不一致度(disconfirmation) 期待度とパフォーマンスの差 MRでの定訳は不確認

実験の手順と被験者の割付 2要因,各3水準の実験データ

期待度の操作(例) 3つの刺激文の中から一つを提示する 期待度を高める刺激: 「菊の花」はよろしいで.なんというても心が和むわ.自分で育てるのはムズイけど,売ってんのは花数も多いし立派で形もきれいや. 期待度をそこそこにする刺激: 期待度を低める刺激: 「菊の花」なんて 自分で育てるのは難しいし,売ってんのは花数が少ないしちっこい.買うんやったら,やっぱり菊よりバラやカーネーションやな.

パフォーマンスの操作

簡便法での分析 多母集団の同時分析は実行しにくい 2要因で各要因が3水準 9つの母集団の比較.......多すぎる 各母集団における標本サイズは20.... ...小さすぎる 簡便法 実験水準を1,2,3 (or -1,0,1) で表し,これを普通のデータとみなして分析 分析結果は因果の構造と平均の構造の 両方を表す

モデルと分析結果

潜在変数の平均 平均の計算例(3番目のF3) 0.98=(-1)*(-0.35+0.84*0.04+0.84*0.44*0.22)    +(+1)(0.64+0.47*0.22)

「実験データの分析」のまとめ 実験データの分析とは複数個の母集団の比較である 母集団の数が少なければ「多母集団の同時分析」を行う 普通は,母集団ごとに平均は異なるが,共分散構造は同一であるという設定で分析する(簡便法) パス図は,普通の共分散構造分析と同様に因果関係を示すが,平均構造をも表す

3.3節 潜在曲線モデル アルコールデータの分析 出展:Curran, P. J. (1999). A latent curve framework for the study of development trajectories in adolescent substance use

データ

全体平均の推移

個人のプロフィール

潜在変数モデルへ

属性による違い

属性の違いを取り込んだモデル

属性の違いを取り込んだモデル:解説 属性によって系統的にβ0やβ1が影響を受けることがある β0とβ1をその属性に回帰するのは自然 平均構造モデルで解析する α0,α1 は切片項 E[性別]は“性別” の平均 β0とβ1の相関は,この属性だけでは 完全に説明できない可能性あり D1とD2間に相関を許しておく 他にもβ0とβ1に影響する変数もあり得る

実際の分析モデル1

因果の方向を探る 因果の大きさを正確に測定する 第4章 因果分析について 因果の方向を探る 因果の大きさを正確に測定する

因果推論 因果の方向を如何に探るか 因果の大きさを如何に正確に (バイアスなく)測るか 同値モデル,操作変数法,共分散選択 第三変数の影響,共変量選択(バックドア規準)

相関係数から因果の方向は決まらない ---同値モデルの問題--- 相関構造 データから区別できないモデルを同値モデルという 「区別できない」とは適合度が同一であることをいう

同値モデル例

因果の方向を決める: 操作変数法(Instrumental variable method) 相関構造 相関構造

操作変数法とは X,Yのいずれかに影響を及ぼし,他方への直接効果をもたない変数Z(操作変数)を観測する. X,Y,Zの相関構造から,X→Y or Y←X を判断する. 操作変数の適切さが検討できる.

双方向因果モデル(非逐次モデル)

ひとつの例 出展: AMOSマニュアル

共分散構造分析による因果の決定 対立モデルが同値モデルにならないようにする. そのための一つの方法が操作変数の導入. 因果を決定したか? X→Y,X←Y,X←→Yのいずれかであるという仮定の下で,どれがデータに矛盾しないかを決定しているにすぎない.つまり,「因果関係にない」という可能性を排除していない. 「X→Y」が分かっても,「XはYの“主要な”原因であるとは言いきれない.R2の大きさに注意すべきである.R2=0.1でもモデルは適合する(モデルの適合度とR2は別概念).このような場合,XはYの原因のごく一部である.

第三変数(未分析変数)の影響 観察データ分析の最大の ウィークポイント 因果の大きさを正確に測定する 第三変数(未分析変数)の影響 観察データ分析の最大の ウィークポイント

観察研究と実験研究 実験研究 観察研究 原因系の変数に水準を設定し,水準ごとに 無作為化を行いデータを採取する 水準の恣意性に問題 第三変数(未分析変数)の影響をシャットアウト 観察研究 無作為に被験者を抽出して全変数を観測する 第三変数(未分析変数)の影響

第三変数の影響 観察研究にはバイアスが生じる Y × × × × × × X 実験研究にはバイアスが生じない Y × × × × × × X

第三変数の影響:例

因果方向決定にも影響 誤ってY→Xと結論してしまう

適合度による 第三変数の影響の検出 検出可能な例 モデル        真の状況1      真の状況2

「因果分析」のまとめ 共分散構造分析は,観察研究の弱点である第三変数の影響を受ける. 状況によっては、適合度の悪化により第三変数による影響を疑うことができよう. モデル構築の段階で,因果仮説を十分に吟味し,重要な影響を与える変数を分析から落とさないようにする. データを採る前が大事 因果の方向に興味があるときは,操作変数法などを用いて,対立モデルを識別できるようにしたモデル構成を行う.

応用編終了です お疲れさまでした 早く飲みたい!

予稿集訂正: 参考文献の出版年,巻,ページにタイプミスが ありました Bollen, K. A., & Paxton, P. (1998). 5, 267-293. Bullock, H. E., Harlow, L. L., & Mulaik, S. A. (1994). 1, 253-267 Chou, C. P., Bentler, P. M., & Pentz, M. A. (1998). 5, 247-266. McArdle, J. J., & McDonald, R. P. (1984). 37, 234-251.

以下第3章・第4章の 参考スライド

質問項目 その1 期待度1 花の色 美しい....美しくない (7項目) 花の数 多い....少ない 期待度1    花の色    美しい....美しくない (7項目)   花の数     多い....少ない 期待度2   全体的評価 すばらしい....よくない パフォ1    花の色  優れている....劣っている (7項目)   花の数     多い....少ない パフォ2   全体的評価 すばらしい....よくない 不一致度1  私が期待していた花の数は (10項目)  多すぎた...正確であった...少なすぎた 不一致度2  私の全体的評価に関する期待度は        高すぎた...正確であった...低すぎた 提示された花は私が想定していたよりも少ない 提示された花は私が想定していたとおり 提示された花は私が想定していたよりも多い 提示された花は私が想定していたよりも悪い 提示された花は私が想定していたとおり 提示された花は私が想定していたよりも良い

質問項目 その2 注: 分析には満足度1,2を用いた 満足度1 花の数は十分多い (10項目) 大いに賛成である.....まったく反対である 満足度1 花の数は十分多い  (10項目)      大いに賛成である.....まったく反対である 満足度2 これぐらいの花の数は  (10項目)      好きだ....どちらでもない....嫌いだ 満足度3 全体的評価              おおいに満足.......おおいに不満足 満足度4 全体的評価              顔から選ぶ 満足度5 購入可能性(%)              0        50         100 注: 分析には満足度1,2を用いた

コントロールがうまくいっているか

平均が異なる母集団を合併して分析するには 異なる平均をモデル化して分析する 母集団を表す(ダミー)変数を独立変数に配して,どの変数の平均に影響するかを検討する ダミー変数間には相関を設定しておく 「平均が異なる」という情報を無視して,一つの 母集団と思って分析するのは間違い 「平均が異なる」という情報を無視すると観測変数の相関係数が大きくなり,分析結果はそれらしくなることがある.しかし,それは誤りである.要注意!!

例 単一母集団からのデータと見なせる場合 平均も因果モデルも 全属性に関して共通 男女で平均は異なるが,共通の因果モデル(共分散構造)が成立

例:つづき 男女で因子平均が異なるが,共通の因果モデル(共分散構造)が成立 属性(グループ)がたくさんある場合 属性間で因子平均が異なるが,共通の因果モデル(共分散構造)が成立

実際の分析モデル2