第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析 7章 分散分析:第2部 第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
例題:表7.4 銘柄の違い 温度の違い A①冷蔵庫 A②常温 B①イカアン B②ボスビック B③ビビッテル 6 10 11 5 7 12 4 6 10 11 5 7 12 4 8 12 2 3 10 9 表7.4 ミネラルウォーターのおいしさの評定に関する実験データ
7.3.1 主効果と交互作用効果 要因: 母平均に違いをもたらす原因 要因 水準 水準: ある要因の中に含まれる個々の条件 7.3.1 主効果と交互作用効果 要因: 母平均に違いをもたらす原因 水準: ある要因の中に含まれる個々の条件 例題 では... 要因 水準 温度の違い 冷蔵、常温 銘柄の違い イカアン、ボスビック、ビビッテル
主効果と交互作用効果 二元配置分散分析では、 主効果と交互作用効果 という2種類の効果を考える 主効果: それぞれの要因ごとの効果 主効果と交互作用効果 二元配置分散分析では、 主効果と交互作用効果 という2種類の効果を考える 主効果: それぞれの要因ごとの効果 一元配置分散分析のときに考えた効果と同じ 交互作用効果: 2つ以上の要因が組み合わされたときに生じる効果。 2つの要因の効果の単純な足し算では説明できない効果
> 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3))) 表7.7 交互作用効果のある平均値のパターンの例 表7.6 交互作用効果のない平均値のパターンの例 B1 B2 B3 A1 4 3 6 A2 6 5 8 B1 B2 B3 A1 4 3 6 A2 4 6 7 > データ1 <- c(4,3,6, 6,5,8) > 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3))) > 要因B <- factor(rep(c(rep("水準B1",1),rep("水準B2",1),rep("水準B3",1)),2)) > interaction.plot(要因A,要因B,データ1) > interaction.plot(要因B,要因A,データ1) > データ2 <- c(4,3,6, 4,6,7) > interaction.plot(要因A,要因B,データ2) > interaction.plot(要因B,要因A,データ2)
表7.2 交互作用効果のない平均値のプロットの例(1) 表7.3 交互作用効果のない平均値のプロットの例(2)
表7.4 交互作用効果のある平均値のプロットの例(1) 表7.5 交互作用効果のある平均値のプロットの例(2)
7.3.2 二元配置分散分析(対応なし) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 7.3.2 二元配置分散分析(対応なし) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 分散分析では、検定統計値としてFを利用 (3)有意水準αの決定 有意水準は5%、つまりα=0.05とする。この検定は片側検定 (4)検定統計量の実現値を求める aov関数を用いて実現値を求める (5)帰無仮説の棄却or採択の決定
帰無仮説と対立仮説の設定 要因A(温度の違い)の主効果 要因B(銘柄の違い)の主効果 要因Aと要因Bの交互作用効果 帰無仮説H0:温度が違ってもおいしさ得点の母平均は等しい(要因A の主効果はない) 対立仮説H1:温度が違いによっておいしさ得点の母平均は異なる(要 因A の主効果がある) 要因B(銘柄の違い)の主効果 帰無仮説H0:銘柄が違ってもおいしさ得点の母平均は等しい(要因B の主効果はない) 対立仮説H1:銘柄が違いによっておいしさ得点の母平均は異なる(要 因B の主効果がある) 要因Aと要因Bの交互作用効果 帰無仮説H0:温度と銘柄の組み合わせに相性の良し悪しはない(要因Aと 要因Bの交互作用効果はない) 対立仮説H1:温度と銘柄の組み合わせに相性の良し悪しがある(要因Aと 要因Bの交互作用効果がある)
> summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) > 味 <- c(6,4,5,3,2,10,8,10,8,9,11,12,12,10,10,5,4,2,2,2,7,6,5,4,3,12,8,5,6,4) > 味 [1] 6 4 5 3 2 10 8 10 8 9 11 12 12 10 10 5 4 2 2 2 7 6 5 4 3 12 8 5 6 4 > 温度 <- factor(c(rep("冷蔵庫",15),rep("常温",15))) > 温度 [1] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 [11] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 常温 常温 常温 常温 常温 [21] 常温 常温 常温 常温 常温 常温 常温 常温 常温 常温 Levels: 常温 冷蔵庫 > 銘柄 <- factor(rep(c(rep("イカアン",5),rep("ボスビック",5),rep("ビビッテル",5)),2)) > 銘柄 [1] イカアン イカアン イカアン イカアン イカアン ボスビック [7] ボスビック ボスビック ボスビック ボスビック ビビッテル ビビッテル [13] ビビッテル ビビッテル ビビッテル イカアン イカアン イカアン [19] イカアン イカアン ボスビック ボスビック ボスビック ボスビック [25] ボスビック ビビッテル ビビッテル ビビッテル ビビッテル ビビッテル Levels: イカアン ビビッテル ボスビック > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > summary(aov(味~温度+銘柄+温度:銘柄)) > 67.5000+155.000+15.000+76.000 [1] 313.5 > sum((味-mean(味))^2) #全体平方和
(5)帰無仮説の棄却or採択の決定 温度の主効果:5%水準で有意な効果がある (p = 0.0011) 銘柄の主効果:5%水準で有意な効果がある (p =0.0000016) 温度と銘柄の交互作用効果:5%水準で有意な効果はない(p =0.115) interction.plot(横軸にとる要因、もう一方の要因、平均値を求める変数) > interaction.plot(温度,銘柄,味) > interaction.plot(銘柄,温度,味)
> interaction.plot(温度,銘柄,味) 直線が完全に平行ではないので 多少の交互作用はある (が有意な差はない)
> interaction.plot(銘柄,温度,味)
7.3.3 一元配置と見なして分散分析 例題に対し、二元配置分散分析に含まれる2つの要因のうち、一方を無視して一元配置分散分析を行なってみる
一元配置vs二元配置分散分析 F値がかなり小さい 一元配置 > summary(aov(味~温度)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 7.6829 0.009797 ** Residuals 28 246.0 8.786 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 F値がかなり小さい
一元配置vs二元配置分散分析 F値がかなり小さい 一元配置 > summary(aov(味~銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 銘柄 2 155.0 77.50 13.202 0.0001003 *** Residuals 27 158.5 5.87 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 F値がかなり小さい
一元配置vs二元配置分散分析 (平均平方和に注目) 二元配置分散分析の「銘柄」「温度:銘柄」「Residuals」の平方和を足すと 155.000 + 15.000 + 76.000 = 246.000 一元配置と見なしたときの残差の平方和と一致 このように、二元配置分散分析は 2つの要因について同時に検討するだけでなく、 残差のばらつき(平方和)を減らすことで、それぞれの要因について有意な結果が得られやすくする(検定力を高める) という利点がある
7.4二元配置分散分析(2要因とも対応あり) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 統計的仮説検定の一般的手順のうち (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 は、対応のない二元配置分散分析のときと同じ 対応のない場合と異なるのは 検定統計量の計算方法 ここではaov関数を使う
例題:表7.8 銘柄の違い 温度の違い 同じ評定者 A①冷蔵庫 A②常温 評定者 B①イカアン B②ボスビック B③ビビッテル 6 10 村松 6 10 11 5 7 12 川崎 4 8 12 井口 2 松中 3 10 城島 9 表7.8 ミネラルウォーターのおいしさの評定に関する実験データ 同じ評定者
7.4二元配置分散分析(2要因とも対応あり) > 人1 <- factor(rep(c("村松","川崎","井口","松中","城島"),6)) > 人1 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 [29] 松中 城島 Levels: 井口 松中 城島 川崎 村松 > 数字ID1 <- factor(rep(1:5,6)) > 数字ID1 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Levels: 1 2 3 4 5
7.4二元配置分散分析(2要因とも対応あり) summary(aov(味~温度*銘柄 +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人1 人1:温度 人1:銘柄 人1:温度:銘柄 の4つの要素に分ける
「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果
例題:表7.9 銘柄の違い 温度の違い A①冷蔵庫 A②常温 評定者 B①イカアン B②ボスビック B③ビビッテル 6 10 11 5 7 村松 6 10 11 斉藤 5 7 12 川崎 4 8 12 和田 井口 寺原 2 松中 3 10 杉内 城島 9 新垣
7.5二元配置分散分析(1要因のみ対応あり) > A1条件 <- rep(c("村松","川崎","井口","松中","城島"),3) > A2条件 <- rep(c("斉藤","和田","寺原","杉内","新垣"),3) > 人2 <- factor(c(A1条件,A2条件)) > 人2 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 [29] 杉内 新垣 Levels: 井口 寺原 松中 城島 新垣 杉内 斉藤 川崎 村松 和田 > 数字ID2 <- factor(c(rep(1:5,3),rep(6:10,3))) > 数字ID2 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 6 7 8 [24] 9 10 6 7 8 9 10 Levels: 1 2 3 4 5 6 7 8 9 10
7.5二元配置分散分析(1要因のみ対応あり) summary(aov(味~温度*銘柄 +Error(人2:温度+人2:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人2:温度+人2:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人2:温度 人2:温度:銘柄 という要因に分解 各評定者は同じ温度の条件で3種類の銘柄を飲んでいる⇒個人差の要因 だから、個人差の要因である「人2」と温度の違いの要因をあらわす「温度」が関係する組み合わせだけを指定
「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果
拡張 同様に、三元配置、四元配置、...要因を増やして分析することが可能 ただし、要因の数が多いと、分析が複雑になり、結果の解釈が困難になることがあるので注意 分散分析は:基本的に平均値の比較の検定 主効果や交互作用効果の観点からデータにおける値のばらつきの分析が可能