<minato@ypu.jp> 統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港 http://phi.ypu.jp/stat.html <minato@ypu.jp>

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
保健統計学第5回 「3群以上のデータ解析」 と、その他色々
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
多重比較 東邦大学 地理生態学研究室              柊 雅実.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
確率・統計Ⅱ 第7回.
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
リサーチカンファ 29 Aug, 2017.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
二硫化ジフェニル(Cas No ) 高用量群の雌RBC(-11%)になぜ有意差が付かないか/前回勉強会
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

<minato@ypu.jp> 統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港 http://phi.ypu.jp/stat.html <minato@ypu.jp>

(Q&Aから)5%水準で有意でないとは? 前回の例題:東京の集合住宅群と一戸建て群の間で水道水の遊離 残留塩素濃度に差があるか? どちらが高いとか低いとかいった事前情報はないので,帰無仮説「集 合住宅群と一戸建て群の間で水道水の遊離残留塩素濃度に差はな い」の両側検定。 「有意水準を5%にする」とは,「帰無仮説が偶然に成り立つ確率が5% 未満であれば,統計的に意味があるほど稀な現象なので帰無仮説は 成り立たないとみなす」ということ。 「5%水準で有意でない」とは,「帰無仮説が偶然に成り立つ確率が5% 未満であれば,統計的に意味があるほど稀な現象なので帰無仮説は 成り立たないとみなすとした(=有意水準を5%にした)のに,データか ら計算するとその確率が5%より大きくなってしまったので,統計的に意 味があるほど稀ではなく,帰無仮説が成り立たないとはみなせない」 この例でいえば,有意水準を5%にしたのに,「集合住宅群と一戸建て 群の間で水道水の遊離残留塩素濃度に差がない」条件下で,実際に 得られているデータが偶然得られる確率は5%より大きいので,「差が ない」という帰無仮説が棄却されなかったということ。

3群以上の差を比べるには? 単純にt検定や順位和検定を繰り返してはいけ ない。個々の検定についての有意水準を例えば 5%にすると,何度も検定する中で1つくらい間違 って帰無仮説を棄却してしまう確率(第1種の過 誤)が5%よりずっと大きくなってしまうから。 2つの解決法 一元配置分散分析またはクラスカル=ウォリ スの検定(群分け変数が量的変数に与える効 果という捉え方にする) 第1種の過誤を調整する多重比較

一元配置分散分析 総変動を群間変動と誤差変動に分解し,群間変動が誤差変動 の何倍かという値がF分布に従うことを利用して検定する(群間 変動が誤差変動に比して大きいことは,データのばらつきの多く が群間のばらつきによって説明されることを意味する)。 群数a。第i群の第j番目のデータをxijと書くと,総変動STは, 群間変動SAと誤差変動SEは, 自由度は,PA=a-1,PE=N-aであり,VA=SA/PA,VE=SE/PE より,F0=VA/VEが第1自由度PA,第2自由度PEのF分布に従うと して検定。 Rでは,summary(aov(量的変数 ~ 群分け変数))で実行

クラスカル=ウォリスの検定 「少なくともどれか1組の群間で大小の差がある」という対 立仮説に対する「すべての群の間で大小の差がない」と いう帰無仮説を検定。 まず2群の比較の場合の順位和検定と同じく,すべての データを込みにして小さい方から順に順位をつける(同順 位がある場合は平均順位を与える)。 次に,各群ごとに順位を足し合わせて,順位和Ri(i = 1,2,...,k; k は群の数) を求める 各群のオブザーベーションの数をそれぞれni,全オブザ ーベーション数をN としたとき,各群について統計量Bi を Bi=ni{Ri/ni-(N+1)/2}2 として計算し,Biの総和Bを求め, H=12B/{N(N+1)}とし(同順位があるときはさらに補正), 表から,または自由度k-1のカイ二乗検定で検定。 Rではkruskal.test(量的変数 ~ 群分け変数)で実行。

多重比較の概要 3つ以上の群があるときに,群間に差があるか どうかを調べるには,単純に2群間の比較を繰 り返すのでは第1種の過誤が大きくなるのでそこ を調整しなくてはならない。 「帰無仮説族」という考え方をする たくさんの方法が提案されているが,現在では 使わない方が無難な方法もある。例えば,無制 約LSD法とか,ダンカンの方法は第1種の過誤 を正しく調整できないので使ってはいけない。 対照群がなければ,ボンフェローニかホルムま たはTuekyのHSDを用いる。対照群があればダ ネットかウィリアムズの方法を用いる。

ボンフェローニの方法 ボンフェローニの不等式「正しい帰無仮説のうちの 少なくとも1つが誤って棄却されてしまう確率は,個 々の正しい帰無仮説が誤って棄却されてしまう確率 の和以下になる」を利用する。 k個の帰無仮説からなる帰無仮説族全体の有意水 準をαにするために,個々の帰無仮説の有意水準 をα/kにして棄却か保留かを判断する。 Rではpairwise.t.test(量的変数, 群分け変数, p.adjust.method=”bonferroni”)か pairwise.wilcox.test(量的変数, 群分け変数, p.adjust.method=”bonferroni”)で,個々の帰無仮説 の有意確率をk倍した値が表示される。

ホルムの方法 ボンフェローニの方法は明らかに第1種の過誤 を小さくしすぎなので,もうちょっと工夫が必要。 帰無仮説族全体の有意水準をαにするため,k 個の帰無仮説の個々の有意確率を計算して小 さい順に,i番目を有意水準α/(k-i+1) で棄却か 保留か判断する。1つでも保留になったら,それ 以後は全部保留。 Rではpairwise.t.test(量的変数, 群分け変数)か pairwise.wilcox.test(量的変数, 群分け変数) で, 個々の帰無仮説についての確率を(k-i+1) 倍し た値が表示される。

テューキーのHSD 母集団の分布の正規性と各群の等分散性を仮定。 すべての群間の比較について,誤差分散を使った t0=|ti-tj|/√VE(1/ni+1/nj) を計算し,ステューデント 化された範囲の分布(Studentized range distribution) と呼ばれる分布の(1-α)×100%点を√2で割った値 との大小で有意水準αの検定をする方法である。 Rでは,TukeyHSD(aov(量的変数~群分け変数))です べての2群間の比較について,差の95%信頼区間が 表示される。