数理統計学(第八回) 統計的仮説検定とは?

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回.
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
      仮説と検定.
数理統計学(第四回) 分散の性質と重要な法則
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
数理統計学(第五回) 統計的推測とは? 浜田知久馬 数理統計学第5回.
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
検定 P.137.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
確率・統計Ⅱ 第7回.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経営学研究科 M1年 学籍番号 speedster
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

数理統計学(第八回) 統計的仮説検定とは? 浜田知久馬 数理統計学第8回

統計学(statistics)は star(*)tistics(天文学)か? 多くの実験者は  統計解析を望遠鏡だと思っている. 彼らは,星を見つけることに,まるで天文学者のように夢中になり,星が付いた,付かないで一喜一憂する. 数理統計学第8回

統計学(statistics)は star(*)tistics(天文学)か? 数理統計学第8回

検定(statistical test)とは? 多くの研究者は   統計解析=検定 と考えている. 薬物の薬効の有無などの二者択一の判定を行う方法 e.g. t、F、U、カイ2乗、Z、H検定  Fisher、Wilcoxon、Welch、Bartlett 全ての検定の結果はp値で表される. 数理統計学第8回

知っている検定の名前を 教えてください 英語検定 簿記検定 それに車検ね 数理統計学第8回

統計的検定:有り難い方法 白黒はっきりする. 希なこと→有り難い→意味ある(有意) 有り難さ:確率p値によって評価 p値が小さい→有り難い(有意) p値が大きい→珍しくない(意味なし) 数理統計学第8回

ある点からある直線に垂線は1つしか引けないことを証明せよ 背理法による証明 1)証明したいこととは反対の仮説を立てる.  (ある直線に2本以上の垂線が引ける) 2)1)の仮説の下で矛盾を探す. 3)矛盾が見つかれば,1)の仮説を捨てる.  (ある直線に1つしか垂線は引けない) 数理統計学第8回

三角形の内角の和が180度を越える 数理統計学第8回

検定の手順 1)差がないという仮説(帰無仮説)を立てる 2) 検定統計量を計算し、仮説の下でデータ の差が偶然で生じる確率(p値)を計算 3)p値があらかじめ決めた値(有意水準)以下であれば、データの差に意味がある(有意)とみなす 数理統計学第8回

帰無仮説と対立仮説 帰無仮説(null hypothesis) 差がないとする仮説,記号H0で表す. H0:μ1= μ2 対立仮説(alternative hypothesis) 差があるとする仮説,記号H1で表す    H1:μ1≠ μ2 μ1 :対照群の母平均 μ2 :薬剤群の母平均 数理統計学第8回

検定の手順 イカサマコインの例 コインの表と裏が出る確率が等しいという仮説を立てる. 実験を行う(表が5回連続して出る). 1)の仮説の下で2)の事象が生じる確率(p値)を計算する(0.5の5乗=0.03125) 5%水準でコインは表の方が出やすいと結論を出す. 数理統計学第8回

数理統計学第8回

2種類の過誤 真実 検定結果 差なし 差なし ○ 差なし 差あり αエラー 第1種の過誤 差あり 差なし βエラー 第2種の過誤 真実  検定結果 差なし 差なし   ○     差なし 差あり   αエラー 第1種の過誤 差あり 差なし   βエラー 第2種の過誤 差あり 差あり   ○ ・αとβの双方が小さいのがよい判定方式 ・αとβを両方一辺に小さくはできない 数理統計学第8回

数理統計学第8回

結婚は人生の墓場か天国か? 数理統計学第8回

p値と有意水準 p値(probability) 偶然によって差が生じる確率 p値大:偶然でも起こりそうな差 p値(probability) 偶然によって差が生じる確率 p値大:偶然でも起こりそうな差 p値小:偶然では起こりそうにない差 偶然を越えた意味ある(有意)差 有意水準(significant level) p値が小さいかどうかを判断する基準 (通常は5%に設定されることが多い) 数理統計学第8回

p値と第1種の過誤α p値:本当は差がないときに,偶然で 差が生じる確率 検定:p値<0.05のとき有意と判定 αエラー:誤って差があるといってしまう確率は,検定を行なえば,0.05以下に抑えることができる. βエラー:Nと検出したい差の大きさに 依存する 数理統計学第8回

検定に共通の注意 1)検定結果の表記 2)統計的有意性と生物学的有意性 3)有意水準はなぜ5%か? 4)片側検定と両側検定 数理統計学第8回

1)検定結果の表記 習慣 *:p<0.05 **: p<0.01 1.p値の値そのものを示す方がよい. ・p=0.009とp=0.0001では解釈が異なる. ・p値が示されていれば,事後的に有意水準  を変更することが可能 2.p値の有効桁は少数第3位または第4位 3.検定の種類と仮説の方向は明記 数理統計学第8回

検定統計量による有意性の判定 コンピュータが発達する前はp値の計算は困難だった. 検定統計量 大 ⇒ p値 小 検定統計量が棄却限界値を比較 検定統計量 大 ⇒ p値 小 検定統計量が棄却限界値を比較   検定統計量が5%棄却限界値を越える   ⇒p値<0.05 現在では,Excel等の関数を利用してp値が 直接計算可能 数理統計学第8回

2)統計学的 vs.生物学的有意性 標準薬を対照とした降圧薬の試験 Δ p値 N -20 <0.05 100 適切な症例数 Δ p値 N -20 <0.05 100 適切な症例数 -5 >0.05 100 適切な症例数 -20 >0.05 30 Nが小さすぎた -5 <0.05 10000 Nが大きすぎた 数理統計学第8回

3)有意水準はなぜ5%か? ・検定は農事試験から生まれた. 実験は年1回,1生のうち20回程度, 1回位(1/20)は過ちを許そう. ・人間が偶然を判断する基準にあう.  表が続けて出る確率:3.125% ・ときには5%以外のことも 背景因子の偏り,予備検定,モデル選択 数理統計学第8回

R.A.Fisher 数理統計学第8回

4)片側検定と両側検定 帰無仮説は1つだが対立仮説はたくさんある ・イカサマコインの場合 帰無仮説 H0:π表= π裏=0.5 数理統計学第8回

4)片側検定と両側検定 対立仮説の方向 表の方がでやすい: π表> π裏 裏の方がでやすい: π表< π裏 両側検定 H1:π表> π裏 or  π表< π裏 上側検定 H1:π表> π裏  下側検定 H1:π表< π裏  数理統計学第8回

4)片側検定と両側検定 イカサマコインの例 (表が5回) 上側p値:確率(表5回)=0.03125 下側p値:1 イカサマコインの例 (表が5回) 上側p値:確率(表5回)=0.03125 下側p値:1 両側p値:確率(表5回)+確率(裏5回)=0.0625 両側検定の方が方向を欲張るので,有意になりにくい. (多くの場合,p値は片側の2倍) 数理統計学第8回

ダーウィンの植物の丈の データ(単位インチ) ───────────────────────────────  No.自家受精  他家受精 No.自家受精  他家受精   1   17.375    23.5    9  16.5   18.25   2   20.375    12     10  18    21.625   3   20      21 11  18.25    23.25   4   20      22 12  18    21   5   18.375    19.125 13  12.75    22.125   6   18.625    21.5 14  15.5    23   7   18.625    22.125 15  18    12   8   15.25     20.375  平均  17.708    20.192 標準偏差  2.024    3.617 数理統計学第8回

散布図 25 + | | C | B 20 + C A | A | G A y | A | A 15 + A 10 + ---+---------------------------------------+-- 1 2 数理統計学第8回

層別箱髭図 数理統計学第8回

仮説 研究仮説:他家受精は自家受精と比べて,成長がよいか? 自家受精群と他家受精群の母集団の平均を, μA, μBとする. 帰無仮説H0 : μA=μB ⇒  μA-μB=0 対立仮説H1 : μA≠μB ⇒  μA-μB≠ 0 数理統計学第8回

仮説検定という方式 仮説H0に対し,ある統計量と限界値を予め用意しておく. 検定統計量,棄却限界値 統計量が限界値より大きかったら,H0を  検定統計量,棄却限界値 統計量が限界値より大きかったら,H0を  否定(棄却)する ⇒p値がα水準以下  そうでなければH0を受容する. 数理統計学第8回

仮説検定という方式 ・第1種の過誤をα以下にする.(必要条件) 第1種の過誤={H0が真なのにそれを 棄却する誤り(の確率)}   第1種の過誤={H0が真なのにそれを   棄却する誤り(の確率)}  ・第2種の過誤がなるべく小さい手法を選ぶ.   第2種の過誤={H1が真なのにH0を   受容する誤り(の確率)}=1-検出力  数理統計学第8回

検定の構成法 帰無仮説と対立仮説が単純な場合 ネイマン・ピアソンの基本定理の利用 (応用可能な場合はかなり限定) 原理的な構成法 尤度比検定  ネイマン・ピアソンの基本定理の利用  (応用可能な場合はかなり限定) 原理的な構成法  尤度比検定   推定量の方法  直感的な方法(ノンパラ法) 数理統計学第8回

Neyman-Pearson’s fundamental lemma 帰無仮説と対立仮説の下での確率の比(尤度比)に基づいて検定を構成すれば,最も性能がよくなる. 確率密度関数f(y,θ) ・帰無仮説H0:θ=θ0 ・対立仮説H1:θ=θ1 検定統計量t(Y)として, ・ 数理統計学第8回

例えていうと シルエットクイズ 数理統計学第8回

松嶋菜々子 v.s. 山田花子 シルエットを見て,デートするかしないかを判断 松嶋菜々子(H1)であればデートしたい.               判定(decision) シルエットの主  デートする  デートしない 松嶋菜々子     ○       βエラー 山田花子       αエラー   ○  数理統計学第8回

このとき,最もよい判定方式は? ネイマン・ピアソンの基本定理によれば, シルエットから P(M)=松嶋菜々子である確率 P(Y)=山田花子である確率 を見積もり, この比P(M)/ P(Y)がある値を越えるか,否かで判定する. 数理統計学第8回

ネイマン・ピアソンの基本定理 有意水準αの最強力検定(βエラーが最小), ≦c : H0を保留 >c : H0を棄却 cは Pr(t(Y)>c|θ=θ0)=α を満たす値 数理統計学第8回

y=910, θ0=925, θ1=900 数理統計学第8回

検定関数δ (Y) H0を保留する場合:δ (Y) =0 H0を棄却する場合:δ (Y) =1 ①をαに抑えつつ, ②を最大にするのが 最強力検定 E[δ (Y)]=0・Pr[δ (Y) =0]+1・Pr[δ (Y) =1] ①E[δ (Y)|θ0]=∫δ (Y)f(Y,θ0)dY =αエラーの確率 ②E[δ (Y)|θ1]=∫δ (Y)f(Y,θ1)dY =検出力 (1-βエラーの確率) 数理統計学第8回

ネイマン・ピアソンの基本定理 検定関数δnp(Y) δnp(Y)=0: ≦c: H0を保留 δnp(Y)=1: >c: H0を棄却 最強力検定 必要条件:E[δnp (Y)|θ0] = E[δ (Y)|θ0]=α  十分条件:E[δnp (Y)|θ1]-E[δ (Y)|θ1] ≧0 数理統計学第8回

ネイマン・ピアソンの基本定理 ∫(δnp(Y)-δ(Y))(f(Y,θ1)-cf(Y,θ0)dY≧0 が成り立つ. f(Y,θ1)>cf(Y,θ0)のときδnp(Y)=1 またδ(Y)=0 or 1なので,被積分関数は非負 f(Y,θ1)≦cf(Y,θ0)のときδnp(Y)=0 数理統計学第8回

ネイマン・ピアソンの基本定理 ところで∫δ (Y)f(Y,θ1)dY=検出力Pwなので Pwnp-Pw=∫ (δnp(Y)-δ(Y))f(Y,θ1)dY ≧c∫ (δnp(Y)-δ(Y))f(Y,θ0)dY = cE[δnp (Y)|θ0]-cE[δ (Y)|θ0] =c(α-E[δ (Y)|θ0]) =0 任意の検定関数より, δnp(Y)の検出力が高いので, δnp(Y)は最強力検定 数理統計学第8回

ネイマン・ピアソンの基本定理の適用 ダーウィンのデータ H0:μ=μ0 H1:μ=μ1の検定   (σ2既知,  μ0< μ1)  数理統計学第8回

f(μ)=f(Y1) ・f(Y2) ・・・f(Yn) =Πf(Yi) 正規分布の確率密度関数 f(μ)=f(Y1) ・f(Y2) ・・・f(Yn) =Πf(Yi) 数理統計学第8回

尤度比の計算 数理統計学第8回

尤度比の計算 数理統計学第8回

尤度比の計算 ネイマン・ピアソンの基本定理 ⇒ 平均値がある値cを超えればH0を棄却する. C’’は を満たす値 数理統計学第8回

C‘‘の計算 有意水準αの最強力検定 この検定方式はμ1の値によらない. したがって,任意のμ1に関する一様最強力検定になる. 数理統計学第8回

最強力検定の適用例 H0:μ0=17の検定(σ=3) 平均:17.7 平均:20.1 H0を保留 H0を棄却 自家受精群 他家受精群 自家受精群      他家受精群 平均:17.7    平均:20.1 H0を保留    H0を棄却      数理統計学第8回

演習 Yが二項分布B(N,π)にしたがう確率変数とする. f(π)=NCY・πY(1-π)N-Y H0:π=π0 H1:π=π1の検定の最強力検定を考える. (π1>π0) 1)尤度の比(f(π1)/f(π0))を計算すること 2)Y=6,N=10として, π0=0.5,, π1 =0.9のときの尤度の比を計算すること 3)最強力検定はどのような検定に帰着するか  述べること 数理統計学第8回