第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明 独立な2群の平均値差の検定 対応のある2群の平均値差の検定
6.1 2つの平均値を比較するケース 2つの平均値を比較することが必要となる場合 「指導法データ」を例に考えると... 独立な2群のt検定 6.1 2つの平均値を比較するケース 2つの平均値を比較することが必要となる場合 「指導法データ」を例に考えると... 男女で心理学テストの平均値に差があるかどうか 統計の好き嫌いで統計テストの平均値に差があるか 同じ対象者に対して指導法の違いが成績に影響するかどうか 独立な2群のt検定 対応のある2群のt検定
6.2 独立な2群のt検定 独立な2群のt検定の例(再掲) ・男女で平均値に差があるかどうか ・統計が好き・嫌いで統計テストの平均値に差があるかどうか 男と女、統計が好きな人と嫌いな人、というように2群はそれぞれ別々の標本から得られたデータ・・・2群が「独立」
6.2 独立な2群のt検定
6.2 続き t = 帰無仮説H0: μ1=μ2 のもとで、 自由度 df=n1+n2-2 のt分布に従う この検定統計量を用いて2つ群の平均値の差に関する検定を行う
6.2 独立な2群のt検定 例題 「統計テスト1」の得点の平均値に男女で有意な差があるかどうかを 有意水準5%、両側検定で検定
例題の検定
Rで動かす・・・ 検定統計量の実現値がt = -1.84と求まった。 >統計1男<-c(6,10,6,10,5,3,5,9,3,3) > 統計1女<-c(11,6,11,9,7,5,8,7,7,9) > mean(統計1男) [1] 6 > mean(統計1女) [1] 8 > var(統計1男) [1] 7.777778 > var(統計1女) [1] 4 > プール標準偏差<-sqrt(((length(統計1男)-1)*var(統計1男)+(length(統計1女)-1)*var(統計1女))/(length(統計1男)+length(統計1女)-2)) >プール標準偏差 [1] 2.426703 Rで動かす・・・ > t分母<-プール標準偏差*sqrt(1/length(統計1男)+1/length(統計1女)) > t分子<-mean(統計1男)-mean(統計1女) > t統計量<-t分子/t分母 > t統計量 [1] -1.842885 検定統計量の実現値がt = -1.84と求まった。
例題の続き (5)帰無仮説の棄却or採択の決定 帰無仮説のもとで自由度10+10-2=18のt分布にしたがい、有意水準は5%、両側検定の時の棄却域を求める。 Rで棄却域を求めると > qt(0.025,18) [1] -2.100922 > qt(0.025,18,lower.tail=FALSE) [1] 2.100922 よって棄却域は、t< -2.10、t> 2.10 となる。 今回の検定統計量の実現値はt= -1.84 であったので、 帰無仮説は棄却されない。 検定の結果は「5%水準で有意差が見られなかった」となる。
p値を直接求めることも可能 > pt(-1. 842885,18) [1] 0 p値を直接求めることも可能 > pt(-1.842885,18) [1] 0.04093903 両側検定からこれを2倍した結果から、同様の結論が得られる > 2*pt(-1.842885,18) [1] 0.08187807 5章の t.test によっても簡単に求められる: > t.test(統計1男,統計1女,var.equal=TRUE) Two Sample t-test data: 統計1男 and 統計1女 t = -1.8429, df = 18, p-value = 0.08188 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.2800355 0.2800355 sample estimates: mean of x mean of y 6 8
6.3 t検定の前提条件 t 検定を実行するには3つの条件が必要 標本が無作為に行われていること(無作為抽出) 母集団の分布が正規分布にしたがっていること(正規性) 2つの母集団の分散が等質であること(分散の等質性)
6.3.1 分散の等質性 分散の等質性の検定ーRでは var.test 6.3.1 分散の等質性 分散の等質性の検定ーRでは var.test > クラスA<-c(54,55,52,48,50,38,41,40,53,52) > クラスB<-c(67,63,50,60,61,69,43,58,36,29) > var.test(クラスA,クラスB) F test to compare two variances data: クラスA and クラスB F = 0.2157, num df = 9, denom df = 9, p-value = 0.03206 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.05356961 0.86828987 sample estimates: ratio of variances 0.2156709
6.3.2 Welchの検定 母分散が等質でないときは、t検定は使えないので Welch検定を使う > t.test(クラスA,クラスB,var.equal=FALSE) Welch Two Sample t-test data: クラスA and クラスB t = -1.1191, df = 12.71, p-value = 0.2838 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -15.554888 4.954888 sample estimates: mean of x mean of y 48.3 53.6
6.4 対応のあるt検定 独立な2群、もしくは対応のない2群 対応のあるデータ ランダムに割り振った2群 独立な2群、もしくは対応のない2群 ランダムに割り振った2群 対応のあるデータ ・あらかじめ似ている被験者2人をぺアにして、ペアの一方を第1群に、他方を第2群に割り当てるという方法で分けられた2群のデータ ・同じ被験者について複数の測定が行われている場合 例 統計の指導を受ける前と後のテスト得点である「統計テスト1」と「統計テスト2」 対応あるデータについては、独立な2群のt検定ではないべつの方法が必要
6.4 対応のあるt検定 対応のあるデータでは「変化量(あるいは差得点)」を考える。 統計テスト1の得点をX1、統計テスト2の得点をX2、変化量(差得点)をDとすれば D = X2 - X1 さらに、これらの標本平均 の間には という関係がなりたつ。
続き
例題 「指導法データ」の統計テスト1と統計テスト2の得点について、指導の前後で統計テストの得点が変化したかどうかを、有意水準5%、両側検定で検定
対応のあるt検定
Rで動かすと・・・ >統計テスト1<- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) > 統計テスト2<- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) > 変化量<- 統計テスト2-統計テスト1 > sd(変化量) [1] 2.772041 > 分母t <-sd(変化量)/sqrt(length(変化量)) > 分子t <- mean(変化量) > t統計量<- 分子t/分母t > t統計量 [1] 4.839903 検定統計量の実現値は t= 4.84
続き(帰無仮説の棄却or採択の決定) > qt(0.025,19) #自由度df=n-1=19、有意水準5%/2 = 0.025 [1] -2.093024 > qt(0.025,19,lower.tail=FALSE) [1] 2.093024 棄却域は t< -2.093 , t> 2.093となる。 検定統計量の実現値であるt= 4.84は棄却域に入る ⇒ 帰無仮説は棄却 結果: 「指導の前後で、統計テスト1と統計テスト2の得点の平均値に5%水準で有意差が見られた」と報告
t.test関数を用いた場合 > t.test(変化量) One Sample t-test data: 変化量 t = 4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 1.702645 4.297355 sample estimates: mean of x 3
t.test関数を用いた場合2 > t.test(統計テスト1,統計テスト2,paired=TRUE) Paired t-test data: 統計テスト1 and 統計テスト2 t = -4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.297355 -1.702645 sample estimates: mean of the differences -3 上記の方法は対応のあるt検定の場合に使える。 差得点を定義しない分、少ない手順でできる。
続き なお、同じデータを対応なしとみなして、独立な2群のt検定を実行した場合。 まず、分散の等質性の検定 > var.test(統計テスト1,統計テスト2) F test to compare two variances data: 統計テスト1 and 統計テスト2 F = 0.3913, num df = 19, denom df = 19, p-value = 0.04733 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1548830 0.9886112 sample estimates: ratio of variances 0.3913043 P値が 0.047 となり、有意水準5%より小さいので、Weichの検定を実行する。
Welchの検定 対応ありと分析した方が小さなp値が得られることが確認できる。 > t.test(統計テスト1,統計テスト2,var.equal=FALSE) Welch Two Sample t-test data: 統計テスト1 and 統計テスト2 t = -2.763, df = 31.895, p-value = 0.00943 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.2119742 -0.7880258 sample estimates: mean of x mean of y 7 10 このデータでは、独立な2群とみなして検定を行っても5%水準で有意差ありという結果は変わらない。 しかし、p値を比較すると、対応ありは0.0001、対応なしは0.0094となる 対応ありと分析した方が小さなp値が得られることが確認できる。