反復測定データの分析 狩野裕@大阪大学 協力:SAS・SPSS

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
1 6章 データ数不揃いの場合の分析 アンバランス型(不釣合い型)の 計画 ss2 や ss3 って何?
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Rコマンダーで反復測定ANOVA.
GLMプロシジャを利用した 反復測定データの解析
グラフィカル多変量解析 ----目で見る共分散構造分析----
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
Rコマンダーで2要因の 反復測定ANOVA 「理学療法」Vol28(8)のデータ
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
数理統計学(第四回) 分散の性質と重要な法則
第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析1 分割法タイプのデータ
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
分散分析マスターへの道.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
共分散構造分析(SEM)は パス解析,因子分析,分散分析のすべてにとって代わるのか?
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
統計手法アラカルト Mixed Model ~混合モデル~
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
日本行動計量学会主催 第4回春の合宿セミナー
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
回帰分析.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
構造方程式モデリング(SEM) Structural Equation Modeling.
Excelによる実験計画法演習 小木哲朗.
補章 時系列モデル入門 ー 計量経済学 ー.
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
相関分析.
データ解析 静岡大学工学部 安藤和敏
4章までのまとめ ー 計量経済学 ー.
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
Rコマンダーで2元配置ANOVA 「理学療法」Vol28(8)のデータ
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
尺度化について 狩野 裕 大阪大学人間科学部.
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第4章 統計的検定 (その2) 統計学 2006年度.
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

反復測定データの分析 狩野裕@大阪大学 協力:SAS・SPSS 行動計量学会「春の合宿セミナー」 於:安田生命アカデミア 2002/3/21-22 反復測定データの分析 狩野裕@大阪大学 協力:SAS・SPSS

AGENDA はじめに 一般線型モデルによる分析 SEM (共分散構造分析) によるモデリング 混合モデル(Mixed Model) ANOVA分割法計画 MANOVA Box のε修正と球面性検定 SEM (共分散構造分析) によるモデリング (マルコフ連鎖モデル) 潜在曲線モデル 混合モデル(Mixed Model) ANOVA+共分散行列の指定, MANOVA 成長曲線モデル

1.1 反復測定データの種類 縦断的(経時)データとそうでない反復測定 測定順序がランダマイズ可能か 経時データは順序を 変更できない

1.2 成長と因果 成長は平均の変化 因果は相関の大きさ 全体的にみて増加(or 減少)しているか 潜在曲線モデル,成長曲線モデル 予測可能性が焦点 マルコフ連鎖モデル T1 T2 T3

因果と成長のパターン_1

因果と成長のパターン_2

1.3 全体的傾向と個体差 これらを区別して評価することが必要 個体差は変化の特徴に関して グルーピングする SEM...潜在曲線モデル MIXED...成長曲線モデル

反復測定データの分析は,まず 「 ANOVA分割法計画」 第2章 一般線型モデル 反復測定データの分析は,まず 「 ANOVA分割法計画」

料理の道具 2.1 ANOVA分割法計画 2.2 MANOVA(多変量分散分析) 2.3 修正ANOVA Boxのε,H-HとG-Gの推定方法がある

分散分析_1 完全無作為要因計画 乱塊法計画 Completely Randomized Factorial Design: CRF_pq 被験者間要因のみ 被験者は一つの水準の組み合わせでのみ実験を受ける 乱塊法計画 Randomized Block Factorial Design: RBF_pq) 被験者内要因のみ 被験者はすべての水準の組み合わせで実験を受ける

分散分析_2 分割法計画 Split-Plot Factorial Design: SPF_p.q 被験者内要因と被験者間要因とが混在 完全無作為と乱塊法の中間. 例.被験者はAの水準は1つだけ,Bはすべての水準で実験を受ける

完全無作為 要因計画 乱塊法計画 分割法計画 種々のデザイン

データのグラフ化

分析結果 実験デザインに合わせて分析方法を正確に選ぶ必要 データの出展:森-吉田.データ解析テクニカルブック

分散分析の手順 非有意 有意 有意 非有意 2要因A,Bの 分散分析 A×B有意? 有意な要因の 単純主効果Aの分散分析 主効果の多重比較 B1 B2 B3 A1 A2 A3 2要因A,Bの 分散分析 分散分析の手順 A×B有意? 非有意 有意 有意な要因の 主効果の多重比較 単純主効果Aの分散分析 単純主効果Bの分散分析 単純主効果 有意? A1 A A2 A A3  B B1 A B2  B B3  B B1 A B2 A B3 A A3 B1 A B2  B B3   C A1 B1 A B2 AB B3  B A2 有意 非有意 単純主効果の多重比較 分    析    終   了

データの構造式

観測変数 データの構造式(分割法)

観測変数の分散(分割法) 複合対称性(CS; Compound Symmetry)という

複合対称性 CS (Compound Symmetry)の仮定 この仮定が成立しない場合がある 分散が互いに等しい.共分散が互いに等しい 誤差間の相関係数は全て等しい この仮定が成立しない場合がある 経時データではたぶん成立しない

球面性仮定への拡張 CSから球面性(sphericity)の仮定へ この仮定でも,いつも成立するとは限らない Huynh-Feldt(1970)はF検定が正確であるための より良い条件を導いた これを球面性の仮定という この仮定でも,いつも成立するとは限らない 経時データではたぶん成立しない

方向性 球面性仮定を検定する 球面性仮説が受容された場合はANOVA (分割法計画)で分析 球面性仮説が棄却された場合は次の オプションがある MANOVA 修正ANOVA(分割法計画)

§2.1 のまとめ 反復測定データの分析方法としてANOVA(分割法計画)を紹介 ANOVAは球面性の仮定が成立しないときは不正確 その場合は,いくつかのオプションがある MANOVA 修正ANOVA(分割法計画)

2.2 MANOVA 多変量分散分析と CS・球面性の仮定

動機づけ 誤差ベクトルに関する球面性仮定が,棄却された場合は,ANOVAは不正確(分割法計画)である 正確な方法としてMANOVAがある 第一種の過誤が不正確 正確な方法としてMANOVAがある ひとつのオプション 球面性仮定の検定は次節で...

MANOVAとは ANOVA MANOVA 一つの特性値yに,影響を及ぼすであろういくつかの要因の検討 いくつかの特性値y1,…,ypに,(同時に)影響を及ぼすであろういくつかの要因の検討 反復測定データは,被験者内要因の効果を MANOVAで分析することができる

MANOVAによる 反復測定データの分析 反復測定データでは,一つの個体から 複数個データをとる => 多変量データとみなせる 反復測定データでは,一つの個体から 複数個データをとる   => 多変量データとみなせる SPSS 「一般線型モデル_反復測定」を選択 SAS 「PROC glm」において 「repeated」 ステートメントを用いる

SASプログラム パラメータ printe を 付与することで, 球面性の検定が 実行される data data323; do a=1 to 2; input x1-x4 @@; output; end; cards; 3 4 6 5 3 2 3 2 3 3 6 7 5 6 2 3 1 4 6 8 2 3 3 3 3 5 4 7 4 6 6 4 5 7 8 9 6 4 5 6 ; proc glm data=data323; class a; model x1-x4=a/ss3 nouni; repeated b 4/printe; run; quit; パラメータ printe を 付与することで, 球面性の検定が 実行される

多変量分散分析の結果(SPSS) [SASも同様]

データの構造式(MANOVA) 観測変数

MANOVAの誤差 被験者内での4つの誤差はすべて (自由に)相関していることを仮定 推定すべき母数が多く,検出力(検定力)が落ちる サンプルサイズが十分大きく検出力が確保されているときはOK

誤差のまとめ CS 分割法は正しい HF 球面性仮定 MANOVAの構造

MANOVA vs 分割法計画 MANOVAは,特別な仮定は必要なく,どんな 誤差構造に対しても使える 検出力が低くなる 分割法計画は,球面性仮定(含むCS)の下で, 正しく推測が行える 推定すべき母数が少ないので,MANOVAより検出力 (検定力)が高い この仮定が成立しないときは,第一種の過誤が 不正確になる 球面性のチェックは経時データの分析でより重要

有意確率(検出力)の比較: ANOVA vs MANOVA 被験者間要因 被験者内要因 A B A×B ANOVA:球面性仮定 .127 .007 .001 MANOVA .066 .032 下限:G-Gは保守的検定と呼んでいる

補足:4つの検定統計量 各種検定統計量について 使い分けの明確なルールはない ANOVAでの平方和は,MANOVAでは行列になる 要因効果の大きさは行列で表される スカラーへ変換する方法に種々ありベストなものはない SASは「Wilksのλが最もよく用いられる」と言っている 使い分けの明確なルールはない すべて有意・すべて非有意の場合は問題なし そうでないとき,有意性は微妙 仮説が棄却されることを強く主張しない

参考:4つの検定統計量

SPSSスクリプト GLM b1 b2 b3 b4 BY 要因a /WSFACTOR = 時間b 4 Polynomial /METHOD = SSTYPE(3) /POSTHOC = 要因a ( TUKEY ) /PLOT = PROFILE( 要因a*時間b 時間b*要因a ) /EMMEANS = TABLES(要因a) /EMMEANS = TABLES(時間b) /EMMEANS = TABLES(要因a*時間b) /PRINT = DESCRIPTIVE /CRITERIA = ALPHA(.05) /WSDESIGN = 時間b /DESIGN = 要因a .

・ 分割法には厳しい球面性仮定があり MANOVAは検出力が低い どうしよう? ・ 球面性仮定のチェックはどうするの? 2.3 Box のε修正と球面性検定 ・ 分割法には厳しい球面性仮定があり MANOVAは検出力が低い どうしよう? ・ 球面性仮定のチェックはどうするの?

では,どうするのか? ANOVAとMANOVAの中間をねらった方法に存在意義がある 第一種の過誤と検出力も共にまずまず BoxのεによるANOVAの修正:自由度をεで調整 εの推定値 Greenhouse-Geiser Huynh-Feldt(G-Gの改良版) 第一種の過誤と検出力も共にまずまず そのまえに,球面性の仮定をチェックしておく G-Gはtoo conservative G-Gはεの最尤推定値,H-Hは不偏推定値

球面性(の仮定)の検定 (test of sphericity) 反復測定分散分析を適用するきは,球面性仮定の吟味をしておく もし,球面性仮定が成り立たないのであれば,出力されたεでF値の自由度を補正する 修正されたF値・P値が出力される 球面性の検定が高度(P値<0.0001)に有意の場合はMANOVAを適用するのが無難

球面性の検定結果 SAS SPSS Applied to Orthogonal Components: Test for Sphericity: Mauchly's Criterion = 0.8428411 Chisquare Approximation = 1.1493445 with 5 df Prob > Chisquare = 0.9496 SPSS

BoxのεによるANOVAの修正結果 SAS Source: B Adj Pr > F DF Type III SS Mean Square F Value Pr > F G - G H - F 3 19.70000000 6.56666667 5.20 0.0066 0.0092 0.0066 Source: B*A 3 30.50000000 10.16666667 8.05 0.0007 0.0012 0.0007 Source: Error(B) DF Type III SS Mean Square 24 30.30000000 1.26250000 Greenhouse-Geisser Epsilon = 0.8896 Huynh-Feldt Epsilon = 1.5436 H-Fは1を超える場合がある.そのときは1にまるめる

BoxのεによるANOVAの修正結果 SPSS

有意確率(検出力)の比較: ANOVA vs MANOVA 被験者間要因 被験者内要因 A B A×B ANOVA:球面性仮定 .127 .007 .001 ANOVA:G-G .009 ANOVA:H-F ANOVA:下限 .052 .022 MANOVA .066 .032 下限:G-Gは保守的検定と呼んでいる

考察 本データでは,球面性の仮定が成り立っていると考えてよい 「ANOVA:球面性仮定」が適切な検定である 一般に,G-GやH-Fによる修正を行うとすこし検出力が落ちる MANOVAではもっと検出力が落ちる 球面性の仮定が成り立っていない場合 G-GやH-Fによる修正統計量を用いる MANOVAは検出力の点でおとる MANOVAで有意になるなら,それを報告してよい

Box’s εについて_1 カイ2乗分布の重みつきの和の分布の 近似方法

Box’s εについて_2 球面性仮定が崩れているときのF値の 分布(被験者内要因のみ)

Box’s εについて_3

§2.3 のまとめ 球面性仮説は統計的に検定できる 球面性仮説が棄却されたときのオプションとして,Box’s εによる修正ANOVAがある ANOVAとMANOVAの中間を狙った方法 第一種の過誤は近似的に保証する 検出力はかなりよい

蛇足: 反復測定データと経時測定データ 経時測定(縦断的)⊂反復測定 経時測定データは測定の順序が変更できない 測定の順序をランダマイズできれば,球面性の仮定は成り立つ可能性が大きくなる 経時測定データでは次のような共分散行列が期待される: 球面性仮定は,経時測定データの分析でより重要

第2章のまとめ 反復測定データの分散分析には3種類ある 反復測定間の相関の入り方(球面性仮定の正否)によって使い分ける ANOVA(分割法計画) Boxのεによる修正ANOVA [近似] MANOVA 反復測定間の相関の入り方(球面性仮定の正否)によって使い分ける 経時測定データでは球面性仮定の吟味は必須

フローチャート ANOVA 分割法 εによる 修正ANOVA MANOVA 球面性検定 高度に有意 (P値<0.0001) 非有意

補足 修正ANOVAとMANOVAの使い分けに 厳格な理由付けがあるわけではない SAS mentions “However, in cases where the sphericity test is dramatically rejected (p<0.0001), all these univariate tests should be interpreted cautiously.” p<0.0001のときには,サンプルサイズがかなり 大きく,検出力が確保されている場合がある => MANOVAがよい Manual page954

さいごに --- 経時測定データ分析の昨今 --- 古典的方法 反復測定ANOVAと多変量分散分析(MANOVA) G-GやH-Fによる修正ANOVA 最近の方法 Mixed model による分析 誤差分散のタイプを分析者が指定・選択 個体の変化に曲線(直線)を当てはめる SEMによってモデル化 誤差のタイプをモデリング

このあと勉強すること_1 CS, HF, UN 以外のタイプの共分散行列を指定したいMIXED モデル 因子分析モデル

このあと勉強すること_2 成長を記述したい 成長の個体差をみたい MIXED モデルやSEMによる 「成長曲線モデル」や「潜在曲線モデル」 線型 or 2次曲線 or ゴンベルツ曲線... 成長の個体差をみたい 属性で成長に違いがある.. MIXED モデルやSEMによる 「成長曲線モデル」や「潜在曲線モデル」

おわり