第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相関係数 植物生態学研究室木村 一也.
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計処理2  t検定・分散分析.
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定

6.1 2つの平均値を比較するケース 2つの平均値を比較することが必要となる場合 「指導法データ」を例に考えると... 独立な2群のt検定 6.1 2つの平均値を比較するケース 2つの平均値を比較することが必要となる場合 「指導法データ」を例に考えると... 男女で心理学テストの平均値に差があるかどうか 統計の好き嫌いで統計テストの平均値に差があるか 同じ対象者に対して指導法の違いが成績に影響するかどうか 独立な2群のt検定 対応のある2群のt検定

6.2 独立な2群のt検定 独立な2群のt検定の例(再掲) ・男女で平均値に差があるかどうか ・統計が好き・嫌いで統計テストの平均値に差があるかどうか 男と女、統計が好きな人と嫌いな人、というように2群はそれぞれ別々の標本から得られたデータ・・・2群が「独立」

6.2 独立な2群のt検定    

6.2 続き t = 帰無仮説H0: μ1=μ2 のもとで、 自由度 df=n1+n2-2 のt分布に従う この検定統計量を用いて2つ群の平均値の差に関する検定を行う

6.2 独立な2群のt検定 例題 「統計テスト1」の得点の平均値に男女で有意な差があるかどうかを 有意水準5%、両側検定で検定

例題の検定  

Rで動かす・・・ 検定統計量の実現値がt = -1.84と求まった。 >統計1男<-c(6,10,6,10,5,3,5,9,3,3) > 統計1女<-c(11,6,11,9,7,5,8,7,7,9) > mean(統計1男) [1] 6 > mean(統計1女) [1] 8 > var(統計1男) [1] 7.777778 > var(統計1女) [1] 4 > プール標準偏差<-sqrt(((length(統計1男)-1)*var(統計1男)+(length(統計1女)-1)*var(統計1女))/(length(統計1男)+length(統計1女)-2)) >プール標準偏差 [1] 2.426703  Rで動かす・・・ > t分母<-プール標準偏差*sqrt(1/length(統計1男)+1/length(統計1女)) > t分子<-mean(統計1男)-mean(統計1女) > t統計量<-t分子/t分母 > t統計量 [1] -1.842885 検定統計量の実現値がt = -1.84と求まった。

例題の続き (5)帰無仮説の棄却or採択の決定 帰無仮説のもとで自由度10+10-2=18のt分布にしたがい、有意水準は5%、両側検定の時の棄却域を求める。 Rで棄却域を求めると > qt(0.025,18) [1] -2.100922 > qt(0.025,18,lower.tail=FALSE) [1] 2.100922 よって棄却域は、t< -2.10、t> 2.10 となる。 今回の検定統計量の実現値はt= -1.84 であったので、 帰無仮説は棄却されない。 検定の結果は「5%水準で有意差が見られなかった」となる。

p値を直接求めることも可能 > pt(-1. 842885,18) [1] 0 p値を直接求めることも可能 > pt(-1.842885,18) [1] 0.04093903 両側検定からこれを2倍した結果から、同様の結論が得られる > 2*pt(-1.842885,18) [1] 0.08187807 5章の t.test によっても簡単に求められる: > t.test(統計1男,統計1女,var.equal=TRUE) Two Sample t-test data: 統計1男 and 統計1女 t = -1.8429, df = 18, p-value = 0.08188 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.2800355 0.2800355 sample estimates: mean of x mean of y 6 8

6.3 t検定の前提条件 t 検定を実行するには3つの条件が必要 標本が無作為に行われていること(無作為抽出) 母集団の分布が正規分布にしたがっていること(正規性) 2つの母集団の分散が等質であること(分散の等質性)

6.3.1 分散の等質性 分散の等質性の検定ーRでは var.test 6.3.1 分散の等質性 分散の等質性の検定ーRでは var.test > クラスA<-c(54,55,52,48,50,38,41,40,53,52) > クラスB<-c(67,63,50,60,61,69,43,58,36,29) > var.test(クラスA,クラスB) F test to compare two variances data: クラスA and クラスB F = 0.2157, num df = 9, denom df = 9, p-value = 0.03206 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.05356961 0.86828987 sample estimates: ratio of variances 0.2156709

6.3.2 Welchの検定 母分散が等質でないときは、t検定は使えないので Welch検定を使う > t.test(クラスA,クラスB,var.equal=FALSE) Welch Two Sample t-test data: クラスA and クラスB t = -1.1191, df = 12.71, p-value = 0.2838 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -15.554888 4.954888 sample estimates: mean of x mean of y 48.3 53.6

6.4 対応のあるt検定 独立な2群、もしくは対応のない2群 対応のあるデータ ランダムに割り振った2群 独立な2群、もしくは対応のない2群   ランダムに割り振った2群 対応のあるデータ  ・あらかじめ似ている被験者2人をぺアにして、ペアの一方を第1群に、他方を第2群に割り当てるという方法で分けられた2群のデータ  ・同じ被験者について複数の測定が行われている場合   例 統計の指導を受ける前と後のテスト得点である「統計テスト1」と「統計テスト2」 対応あるデータについては、独立な2群のt検定ではないべつの方法が必要

6.4 対応のあるt検定 対応のあるデータでは「変化量(あるいは差得点)」を考える。 統計テスト1の得点をX1、統計テスト2の得点をX2、変化量(差得点)をDとすれば D = X2 - X1 さらに、これらの標本平均 の間には という関係がなりたつ。

続き  

例題  「指導法データ」の統計テスト1と統計テスト2の得点について、指導の前後で統計テストの得点が変化したかどうかを、有意水準5%、両側検定で検定

対応のあるt検定  

Rで動かすと・・・ >統計テスト1<- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) > 統計テスト2<- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) > 変化量<- 統計テスト2-統計テスト1 > sd(変化量) [1] 2.772041 > 分母t <-sd(変化量)/sqrt(length(変化量)) > 分子t <- mean(変化量) > t統計量<- 分子t/分母t > t統計量 [1] 4.839903 検定統計量の実現値は t= 4.84

続き(帰無仮説の棄却or採択の決定) > qt(0.025,19) #自由度df=n-1=19、有意水準5%/2 = 0.025 [1] -2.093024 > qt(0.025,19,lower.tail=FALSE) [1] 2.093024   棄却域は t< -2.093 , t> 2.093となる。   検定統計量の実現値であるt= 4.84は棄却域に入る ⇒ 帰無仮説は棄却 結果: 「指導の前後で、統計テスト1と統計テスト2の得点の平均値に5%水準で有意差が見られた」と報告

t.test関数を用いた場合 > t.test(変化量) One Sample t-test data: 変化量 t = 4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 1.702645 4.297355 sample estimates: mean of x 3

t.test関数を用いた場合2 > t.test(統計テスト1,統計テスト2,paired=TRUE) Paired t-test data: 統計テスト1 and 統計テスト2 t = -4.8399, df = 19, p-value = 0.0001138 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4.297355 -1.702645 sample estimates: mean of the differences -3 上記の方法は対応のあるt検定の場合に使える。 差得点を定義しない分、少ない手順でできる。

続き なお、同じデータを対応なしとみなして、独立な2群のt検定を実行した場合。 まず、分散の等質性の検定 > var.test(統計テスト1,統計テスト2) F test to compare two variances data: 統計テスト1 and 統計テスト2 F = 0.3913, num df = 19, denom df = 19, p-value = 0.04733 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.1548830 0.9886112 sample estimates: ratio of variances 0.3913043 P値が 0.047 となり、有意水準5%より小さいので、Weichの検定を実行する。

Welchの検定 対応ありと分析した方が小さなp値が得られることが確認できる。 > t.test(統計テスト1,統計テスト2,var.equal=FALSE) Welch Two Sample t-test data: 統計テスト1 and 統計テスト2 t = -2.763, df = 31.895, p-value = 0.00943 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.2119742 -0.7880258 sample estimates: mean of x mean of y 7 10 このデータでは、独立な2群とみなして検定を行っても5%水準で有意差ありという結果は変わらない。 しかし、p値を比較すると、対応ありは0.0001、対応なしは0.0094となる 対応ありと分析した方が小さなp値が得られることが確認できる。