GLMプロシジャを利用した 反復測定データの解析 株式会社 SASインスティチュートジャパン 統計解析研究室 小玉 奈津子
GLMプロシジャについて(1) 始めによく間違われるので一応 GLMプロシジャは、一般線形モデル(General Linear Model)を解析する。 (SASシステム最古のプロシジャ) → 一般化線形モデル(Generalized Linear Model) はGENMODプロシジャを利用する。
GLMプロシジャについて(2) GLMプロシジャでできること ● 線形回帰分析 (単回帰・重回帰 など=<REGプロシジャ) ● 分散分析 (アンバランスの場合もOK) ● 多変量分散分析 ( H-F・ G-G 調整 の単変量型 Wilksのλなどの 多変量型) ● 変量効果モデル ( =<MIXEDプロシジャ) ● 反復測定分散分析 (...............….) =<MIXEDプロシジャ) 普通の多重比較などなど…
GLMプロシジャを利用した 昔ながらの指定による 分割型実験モデルの解析 経時データを被験者を1次単位、ある時点での被験者を2次単位とした分割実験モデルと考える。 基本的な指定 ● 単変量型にデータをもつ ● 被験者の入れ子(ネスト) 効果を指定 ● TESTステートメントで 要因の検定を行う GROUP RESP SUBJECT TIME 1 10 001 1 1 13 001 2 …省略… 3 23 022 1 3 36 022 2 PROC GLM DATA=data1; CLASS time group subject; MODEL resp=group subject(group) time time*group subject(time group); TEST H=group E= subject(group); TEST H=time E= subject(time group); TEST H=time*group E= subject(time group); RUN;
GLMプロシジャを利用した 反復測定分散分析 (1) 基本的な指定 ● 多変量型にデータをもつ ● REPEATEDステートメント を利用して分析の指定 GROUP SUBJECT TIME1 TIME2 TIME3 1 001 12 24 55 1 002 34 53 47 2 003 23 32 33 …省略 PROC GLM DATA=data1; CLASS group; MODEL time1 time2 time3=group; /**REPATEDステートメント**/ REPEATED time 3 ; RUN;
GLMプロシジャを利用した 反復測定分散分析 (2) REPEATEDステートメント 単変量型の検定、多変量型の検定を行うことができる 構文 REPEATED 要因名 水準 変換 / オプション 例: REPEATED time 3 POLYNOMOAL / PRINTE ( 時点が3つ 直交多項式型の対比 / 球面性の検定も)
GLMプロシジャを利用した 反復測定分散分析 (3) REPATEDステートメントで出力される 1) 各時点ごとの分散分析表 時点ごとに、通常の分散分析を行なう 必要のない場合には、次のようにMODELステートメントにNOUNIオプションを指定する。( ODSでも可能) PROC GLM; CLASS a; MODEL t1-t3=a / NOUNI; REPEATED time; RUN;
GLMプロシジャを利用した 反復測定分散分析 (4) 2) 多変量分散分析(多変量型の検定) ● Wilksのラムダ ● Phillaiのトレース ● Hotelling-lawleyのトレース ● Royの最大根 の4つが出力されます。 * 4つの手法でp値が異なる場合があります。 よくWilksのラムダが良く使われていると答えてますが 実際はどうなのでしょうか?
GLMプロシジャを利用した 反復測定分散分析 (5) 3) 球面性の検定( Sphericity Tests) ● Mauchlyの球面性検定 2つの検定結果が出力される。 *Transformed Variates REPEATEDステートメントで直交対比以外のを 指定した場合に利用 (例:PROFILE) *Orthogonal Components 対比として直交対比を選択した場合に利用 (対比を何も指定していな場合には、こちらを利用)
GLMプロシジャを利用した 反復測定分散分析 (6) 4) 単変量型の検定 (修正つき) 被験者内要因の検定に対して、球面性の仮定が成り立たない場合に利用する2つの調整を行なう。 ● G-G (Greenhouse-Geisser)調整のp値 ● H-F (Huynh-Feldt)調整のp値 (一緒に対応するεの値も出力されます)
解析例:1 宿題のデータ (データの持ち方は多変量型) ● 分割型での解析(データの持ち方は単変量型) 解析例:1 宿題のデータ ● 分割型での解析(データの持ち方は単変量型) ● PEPEATEDステートメントを利用した単変量型 (データの持ち方は多変量型) ● 〃 多変量型 ● 時点間の多重比較 ● 単純主効果の検定
参考1 *高橋行雄・大橋靖雄・芳賀敏郎 (1989)SASによる実験データの解析 東京大学出版会(ちょっと内容としては古いですが…) *Littel, Milliken, Stroup,Wolfinger (1996) ‘SAS System for Mixed Models’ (MIXEDプロシジャの入門書) *松山 裕 山口 拓洋 訳 (2001) 医学統計のための線形混合モデル サイエンティスト社 (混合モデルの入門書) *岸本淳司 (1997) 経時データの解析 第16回 日本SASユーザー会論文集(データ例を貰いました) * 愛知学院大学の千野 直仁先生のWebページ 「反復測定分散分析 基本とその応用」 (参考にさせていただきました) http://www.aichi-gakuin.ac.jp/%7Echino/anova/contents.html
質疑応答 理論についてお聞きしたい場合には、 もちろん狩野先生に 細かいSASシステムの統計的な話がきたい場合には → 明日やって来る岸本(Boss)に 使用法については、テクニカルサポートに
おまけ1 Version8の便利な機能ODSについて →SASシステムの出力結果を制御する新機能です。 ODSを利用すると、今までデータセットに出せなかった GLMプロシジャの結果(例えば、最小2乗平均)などをデータセッ トにすべて出力することができます。 ■ 出力形式 * HTML形式 *RTF形式 *SASデータセット などなど
GLMプロシジャを利用した 反復測定分散分析 おまけ2 REPEATEDステートメントの主な変換 ● CONTRAST (基準水準) 1つの水準が対象水準となる場合に利用する。 ( REPEATEDステートメントのデフォルトは、最後の水準が基準となる。) 例 REPEATED time 3 CONTRAST(1) と指定した場合、 M行列は以下のように作成されます。 t1 t2 t3 treatmnt_2 -1.000000000 1.000000000 0.000000000 treatmnt_3 -1.000000000 0.000000000 1.000000000
GLMプロシジャを利用した 反復測定分散分析 おまけ2 ● IDENTITY 変換 各時点を別々の変数として扱い検定を行う。 例: REPEATED time 3 IDENTITY と指定した場合、 対比行列は以下のように作成されます。 t1 t2 t3 treatmnt_1 1.000000000 0.000000000 0.000000000 treatmnt_2 0.000000000 1.000000000 0.000000000 treatmnt_3 0.000000000 0.000000000 1.000000000
GLMプロシジャを利用した 反復測定分散分析 おまけ2 ● PROFILE 変換 時点間の差についての対比を作成する。 例: REPEATED time 3 PROFILE と指定した場合、 対比行列は以下のように作成されます。 t1 t2 t3 treatmnt_1 1.000000000 -1.000000000 0.000000000 treatmnt_2 0.000000000 1.000000000 -1.000000000