数理統計学(第八回) 統計的仮説検定とは? 浜田知久馬 数理統計学第8回
統計学(statistics)は star(*)tistics(天文学)か? 多くの実験者は 統計解析を望遠鏡だと思っている. 彼らは,星を見つけることに,まるで天文学者のように夢中になり,星が付いた,付かないで一喜一憂する. 数理統計学第8回
統計学(statistics)は star(*)tistics(天文学)か? 数理統計学第8回
検定(statistical test)とは? 多くの研究者は 統計解析=検定 と考えている. 薬物の薬効の有無などの二者択一の判定を行う方法 e.g. t、F、U、カイ2乗、Z、H検定 Fisher、Wilcoxon、Welch、Bartlett 全ての検定の結果はp値で表される. 数理統計学第8回
知っている検定の名前を 教えてください 英語検定 簿記検定 それに車検ね 数理統計学第8回
統計的検定:有り難い方法 白黒はっきりする. 希なこと→有り難い→意味ある(有意) 有り難さ:確率p値によって評価 p値が小さい→有り難い(有意) p値が大きい→珍しくない(意味なし) 数理統計学第8回
ある点からある直線に垂線は1つしか引けないことを証明せよ 背理法による証明 1)証明したいこととは反対の仮説を立てる. (ある直線に2本以上の垂線が引ける) 2)1)の仮説の下で矛盾を探す. 3)矛盾が見つかれば,1)の仮説を捨てる. (ある直線に1つしか垂線は引けない) 数理統計学第8回
三角形の内角の和が180度を越える 数理統計学第8回
検定の手順 1)差がないという仮説(帰無仮説)を立てる 2) 検定統計量を計算し、仮説の下でデータ の差が偶然で生じる確率(p値)を計算 3)p値があらかじめ決めた値(有意水準)以下であれば、データの差に意味がある(有意)とみなす 数理統計学第8回
帰無仮説と対立仮説 帰無仮説(null hypothesis) 差がないとする仮説,記号H0で表す. H0:μ1= μ2 対立仮説(alternative hypothesis) 差があるとする仮説,記号H1で表す H1:μ1≠ μ2 μ1 :対照群の母平均 μ2 :薬剤群の母平均 数理統計学第8回
検定の手順 イカサマコインの例 コインの表と裏が出る確率が等しいという仮説を立てる. 実験を行う(表が5回連続して出る). 1)の仮説の下で2)の事象が生じる確率(p値)を計算する(0.5の5乗=0.03125) 5%水準でコインは表の方が出やすいと結論を出す. 数理統計学第8回
数理統計学第8回
2種類の過誤 真実 検定結果 差なし 差なし ○ 差なし 差あり αエラー 第1種の過誤 差あり 差なし βエラー 第2種の過誤 真実 検定結果 差なし 差なし ○ 差なし 差あり αエラー 第1種の過誤 差あり 差なし βエラー 第2種の過誤 差あり 差あり ○ ・αとβの双方が小さいのがよい判定方式 ・αとβを両方一辺に小さくはできない 数理統計学第8回
数理統計学第8回
結婚は人生の墓場か天国か? 数理統計学第8回
p値と有意水準 p値(probability) 偶然によって差が生じる確率 p値大:偶然でも起こりそうな差 p値(probability) 偶然によって差が生じる確率 p値大:偶然でも起こりそうな差 p値小:偶然では起こりそうにない差 偶然を越えた意味ある(有意)差 有意水準(significant level) p値が小さいかどうかを判断する基準 (通常は5%に設定されることが多い) 数理統計学第8回
p値と第1種の過誤α p値:本当は差がないときに,偶然で 差が生じる確率 検定:p値<0.05のとき有意と判定 αエラー:誤って差があるといってしまう確率は,検定を行なえば,0.05以下に抑えることができる. βエラー:Nと検出したい差の大きさに 依存する 数理統計学第8回
検定に共通の注意 1)検定結果の表記 2)統計的有意性と生物学的有意性 3)有意水準はなぜ5%か? 4)片側検定と両側検定 数理統計学第8回
1)検定結果の表記 習慣 *:p<0.05 **: p<0.01 1.p値の値そのものを示す方がよい. ・p=0.009とp=0.0001では解釈が異なる. ・p値が示されていれば,事後的に有意水準 を変更することが可能 2.p値の有効桁は少数第3位または第4位 3.検定の種類と仮説の方向は明記 数理統計学第8回
検定統計量による有意性の判定 コンピュータが発達する前はp値の計算は困難だった. 検定統計量 大 ⇒ p値 小 検定統計量が棄却限界値を比較 検定統計量 大 ⇒ p値 小 検定統計量が棄却限界値を比較 検定統計量が5%棄却限界値を越える ⇒p値<0.05 現在では,Excel等の関数を利用してp値が 直接計算可能 数理統計学第8回
2)統計学的 vs.生物学的有意性 標準薬を対照とした降圧薬の試験 Δ p値 N -20 <0.05 100 適切な症例数 Δ p値 N -20 <0.05 100 適切な症例数 -5 >0.05 100 適切な症例数 -20 >0.05 30 Nが小さすぎた -5 <0.05 10000 Nが大きすぎた 数理統計学第8回
3)有意水準はなぜ5%か? ・検定は農事試験から生まれた. 実験は年1回,1生のうち20回程度, 1回位(1/20)は過ちを許そう. ・人間が偶然を判断する基準にあう. 表が続けて出る確率:3.125% ・ときには5%以外のことも 背景因子の偏り,予備検定,モデル選択 数理統計学第8回
R.A.Fisher 数理統計学第8回
4)片側検定と両側検定 帰無仮説は1つだが対立仮説はたくさんある ・イカサマコインの場合 帰無仮説 H0:π表= π裏=0.5 数理統計学第8回
4)片側検定と両側検定 対立仮説の方向 表の方がでやすい: π表> π裏 裏の方がでやすい: π表< π裏 両側検定 H1:π表> π裏 or π表< π裏 上側検定 H1:π表> π裏 下側検定 H1:π表< π裏 数理統計学第8回
4)片側検定と両側検定 イカサマコインの例 (表が5回) 上側p値:確率(表5回)=0.03125 下側p値:1 イカサマコインの例 (表が5回) 上側p値:確率(表5回)=0.03125 下側p値:1 両側p値:確率(表5回)+確率(裏5回)=0.0625 両側検定の方が方向を欲張るので,有意になりにくい. (多くの場合,p値は片側の2倍) 数理統計学第8回
ダーウィンの植物の丈の データ(単位インチ) ─────────────────────────────── No.自家受精 他家受精 No.自家受精 他家受精 1 17.375 23.5 9 16.5 18.25 2 20.375 12 10 18 21.625 3 20 21 11 18.25 23.25 4 20 22 12 18 21 5 18.375 19.125 13 12.75 22.125 6 18.625 21.5 14 15.5 23 7 18.625 22.125 15 18 12 8 15.25 20.375 平均 17.708 20.192 標準偏差 2.024 3.617 数理統計学第8回
散布図 25 + | | C | B 20 + C A | A | G A y | A | A 15 + A 10 + ---+---------------------------------------+-- 1 2 数理統計学第8回
層別箱髭図 数理統計学第8回
仮説 研究仮説:他家受精は自家受精と比べて,成長がよいか? 自家受精群と他家受精群の母集団の平均を, μA, μBとする. 帰無仮説H0 : μA=μB ⇒ μA-μB=0 対立仮説H1 : μA≠μB ⇒ μA-μB≠ 0 数理統計学第8回
仮説検定という方式 仮説H0に対し,ある統計量と限界値を予め用意しておく. 検定統計量,棄却限界値 統計量が限界値より大きかったら,H0を 検定統計量,棄却限界値 統計量が限界値より大きかったら,H0を 否定(棄却)する ⇒p値がα水準以下 そうでなければH0を受容する. 数理統計学第8回
仮説検定という方式 ・第1種の過誤をα以下にする.(必要条件) 第1種の過誤={H0が真なのにそれを 棄却する誤り(の確率)} 第1種の過誤={H0が真なのにそれを 棄却する誤り(の確率)} ・第2種の過誤がなるべく小さい手法を選ぶ. 第2種の過誤={H1が真なのにH0を 受容する誤り(の確率)}=1-検出力 数理統計学第8回
検定の構成法 帰無仮説と対立仮説が単純な場合 ネイマン・ピアソンの基本定理の利用 (応用可能な場合はかなり限定) 原理的な構成法 尤度比検定 ネイマン・ピアソンの基本定理の利用 (応用可能な場合はかなり限定) 原理的な構成法 尤度比検定 推定量の方法 直感的な方法(ノンパラ法) 数理統計学第8回
Neyman-Pearson’s fundamental lemma 帰無仮説と対立仮説の下での確率の比(尤度比)に基づいて検定を構成すれば,最も性能がよくなる. 確率密度関数f(y,θ) ・帰無仮説H0:θ=θ0 ・対立仮説H1:θ=θ1 検定統計量t(Y)として, ・ 数理統計学第8回
例えていうと シルエットクイズ 数理統計学第8回
松嶋菜々子 v.s. 山田花子 シルエットを見て,デートするかしないかを判断 松嶋菜々子(H1)であればデートしたい. 判定(decision) シルエットの主 デートする デートしない 松嶋菜々子 ○ βエラー 山田花子 αエラー ○ 数理統計学第8回
このとき,最もよい判定方式は? ネイマン・ピアソンの基本定理によれば, シルエットから P(M)=松嶋菜々子である確率 P(Y)=山田花子である確率 を見積もり, この比P(M)/ P(Y)がある値を越えるか,否かで判定する. 数理統計学第8回
ネイマン・ピアソンの基本定理 有意水準αの最強力検定(βエラーが最小), ≦c : H0を保留 >c : H0を棄却 cは Pr(t(Y)>c|θ=θ0)=α を満たす値 数理統計学第8回
y=910, θ0=925, θ1=900 数理統計学第8回
検定関数δ (Y) H0を保留する場合:δ (Y) =0 H0を棄却する場合:δ (Y) =1 ①をαに抑えつつ, ②を最大にするのが 最強力検定 E[δ (Y)]=0・Pr[δ (Y) =0]+1・Pr[δ (Y) =1] ①E[δ (Y)|θ0]=∫δ (Y)f(Y,θ0)dY =αエラーの確率 ②E[δ (Y)|θ1]=∫δ (Y)f(Y,θ1)dY =検出力 (1-βエラーの確率) 数理統計学第8回
ネイマン・ピアソンの基本定理 検定関数δnp(Y) δnp(Y)=0: ≦c: H0を保留 δnp(Y)=1: >c: H0を棄却 最強力検定 必要条件:E[δnp (Y)|θ0] = E[δ (Y)|θ0]=α 十分条件:E[δnp (Y)|θ1]-E[δ (Y)|θ1] ≧0 数理統計学第8回
ネイマン・ピアソンの基本定理 ∫(δnp(Y)-δ(Y))(f(Y,θ1)-cf(Y,θ0)dY≧0 が成り立つ. f(Y,θ1)>cf(Y,θ0)のときδnp(Y)=1 またδ(Y)=0 or 1なので,被積分関数は非負 f(Y,θ1)≦cf(Y,θ0)のときδnp(Y)=0 数理統計学第8回
ネイマン・ピアソンの基本定理 ところで∫δ (Y)f(Y,θ1)dY=検出力Pwなので Pwnp-Pw=∫ (δnp(Y)-δ(Y))f(Y,θ1)dY ≧c∫ (δnp(Y)-δ(Y))f(Y,θ0)dY = cE[δnp (Y)|θ0]-cE[δ (Y)|θ0] =c(α-E[δ (Y)|θ0]) =0 任意の検定関数より, δnp(Y)の検出力が高いので, δnp(Y)は最強力検定 数理統計学第8回
ネイマン・ピアソンの基本定理の適用 ダーウィンのデータ H0:μ=μ0 H1:μ=μ1の検定 (σ2既知, μ0< μ1) 数理統計学第8回
f(μ)=f(Y1) ・f(Y2) ・・・f(Yn) =Πf(Yi) 正規分布の確率密度関数 f(μ)=f(Y1) ・f(Y2) ・・・f(Yn) =Πf(Yi) 数理統計学第8回
尤度比の計算 数理統計学第8回
尤度比の計算 数理統計学第8回
尤度比の計算 ネイマン・ピアソンの基本定理 ⇒ 平均値がある値cを超えればH0を棄却する. C’’は を満たす値 数理統計学第8回
C‘‘の計算 有意水準αの最強力検定 この検定方式はμ1の値によらない. したがって,任意のμ1に関する一様最強力検定になる. 数理統計学第8回
最強力検定の適用例 H0:μ0=17の検定(σ=3) 平均:17.7 平均:20.1 H0を保留 H0を棄却 自家受精群 他家受精群 自家受精群 他家受精群 平均:17.7 平均:20.1 H0を保留 H0を棄却 数理統計学第8回
演習 Yが二項分布B(N,π)にしたがう確率変数とする. f(π)=NCY・πY(1-π)N-Y H0:π=π0 H1:π=π1の検定の最強力検定を考える. (π1>π0) 1)尤度の比(f(π1)/f(π0))を計算すること 2)Y=6,N=10として, π0=0.5,, π1 =0.9のときの尤度の比を計算すること 3)最強力検定はどのような検定に帰着するか 述べること 数理統計学第8回