ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
母集団平均値の区間推定 大標本の区間推定 小標本の区間推定.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1) 青山学院大学社会情報学部 「統計入門」第13回 ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao

「確率的背理法」としての 統計的仮説検定(1/2) 第5章の章末問題8(p.117) 2匹1組で12組の実験動物. 2匹のうち一方に餌A,もう一方に餌B. 研究者は,餌Aの方が体重増加の効果が大きいと考えているとする. 各組において,餌Aの個体の体重増加から,餌B の個体の体重増加を引く. プラスになったペアが9組,マイナスになったペアが3組.

「確率的背理法」としての 統計的仮説検定(2/2) 第5章の章末問題8(p.117) 餌の効果に差がないとすれば,プラスになる組の数は,試行数 n = 12,確率 p = 1/2 の2項分布に従う. 餌の効果に差がないという仮定の下で,9組以上がプラスになる確率は,0.073 この確率を「小さい」と考えるなら,この仮定の下でまれな事象が生じたと考えるよりも,仮定が誤っていると考える方が妥当. 結論:餌Aの方が体重増加の効果が大きい.

統計的仮説 対立仮説(alternative hypothesis):仮説検定の実行者が主張したい仮説.H1 で表す. 例:餌 A の方が体重増加の効果が大きい (p > 1/2) 帰無仮説(null hypothesis):この仮説を棄却(reject)することで,対立仮説を採択するための仮説. H0 で表す. 例:餌の効果に差がない(p = 1/2) 一般に,「母数=特定の値」という式

検定統計量 検定統計量(test static):帰無仮説を棄却するかどうかの判断のために,標本から計算される統計量. 帰無仮説が正しい場合の,検定統計量の分布は求められる.(例:試行数 n = 12,確率 p = 1/2 の2項分布) この講義で用いる検定統計量は,標本平均,標本割合,t 統計量.

有意水準と棄却域 有意水準(significance level):帰無仮説を棄却する基準となる確率.α で表す.危険率と呼ばれることもある.確率でなく百分率で表現されることも多い(例:有意水準5%) 例: 9組以上がプラスになる確率 0.073 は,有意水準 0.10 ならば有意(significant)である.有意水準 0.05 ならば有意ではない.(これは「片側検定」の場合→後述) 棄却域(rejection region):帰無仮説を棄却することになる検定統計量の値の集合.

有意水準と棄却域 検定統計量の 確率分布 (確率密度関数) 有意水準 α 棄却限界値 (critical value) 棄却域

統計的仮説検定の手順 帰無仮説と対立仮説を設定する. 帰無仮説が正しいという仮定の下で,検定に用いる検定統計量の分布を導く. 帰無仮説を棄却する有意水準を設定する. 標本から検定統計量を計算し,その値よりも極端な値が出現する確率が有意水準よりも小さければ(計算された統計量が棄却域に落ちれば),帰無仮説を棄却し,対立仮説を採択する.

有意水準の設定 よく用いられる有意水準は,α = 0.05(5%) 5%水準では有意ではないが,10%水準では有意な検定統計量が得られたとき,「有意傾向」(marginally significant)という表現をすることがある.

片側検定と両側検定(1/5) 餌の比較の例では,棄却域を標本分布(検定統計量の分布)の右側にのみ設定した. これは,餌AとBに違いがあるとすれば,餌Aの方が体重増の効果が大きいと考えたため.

片側検定と両側検定(2/5) 餌の比較の例での帰無仮説と対立仮説 対立仮説が正しい場合には,確率分布の右側にある値が出現しやすいはず. 帰無仮説: p = 1/2 対立仮説: p > 1/2 対立仮説が正しい場合には,確率分布の右側にある値が出現しやすいはず. 検定統計量の値が大きくなるにつれて,対立仮説のもっともらしさが上昇する. したがって,棄却域を確率分布の右側にのみ設定する.

片側検定と両側検定(3/5) 片側検定(one-sided test):検定統計量の標本分布において,右側あるいは左側の一方だけに棄却域を設定する検定. 対立仮説が不等号で与えられる(例:p > 1/2) 両側検定(two-sided test):検定統計量の標本分布において,右側および左側の両方に棄却域を設定する検定. 対立仮説は帰無仮説の否定 例:餌AとBの効果は同じではない(p ≠ 1/2)

片側検定と両側検定(4/5) 対立仮説が帰無仮説の単なる否定(例:p ≠ 1/2)であるならば,標本分布の右側でも左側でも,外側に外れるにしたがって,対立仮説のもっともらしさが上昇する. したがって,棄却域を分布の両側に設定する. 有意水準 α のとき,片側では α/2 の棄却域を設定する.(信頼区間の構成と似ている) 例:有意水準 5 %ならば,片側 2.5 % ずつ.

片側検定と両側検定(5/5) 両側あわせての有意水準:

2種類の過誤(1/4) 真実 採択する仮説 H0 を採択 H1 を採択 H0 が真 正しい判定 第1種の誤り (type I error) 第2種の誤り (type II error)

2種類の過誤(2/4) H0 が正しい 場合の分布 H1 が正しい 場合の分布 第2種の誤りを 犯す確率:β 第1種の誤りを 犯す確率:α (保持) H1 を採択

2種類の過誤(3/4) 標本分布を固定したとき,α と β の両方を同時に小さくすることはできない. 分析者が決められるのは α だけ. 標本の大きさ n を大きくすれば,共に小さくなる. α を固定したとき,2つの標本分布が「近い」ほど,第2種の誤りを犯す確率 β は高くなる.

2種類の過誤(4/4) 検定力(power):分析者の仮説(対立仮説)が正しいとき,それが支持される確率.「第2種の誤りを犯さない確率」である.「検出力」とも呼ばれる. 対立仮説が正しい場合の検定統計量の分布は,実際にはわからない.しかし,それを想定した上で,どれくらいの大きさの標本が必要かを考えることがなされる(検定力分析).

帰無仮説の採択 帰無仮説が棄却されなかった場合,帰無仮説を積極的に主張することは危険. ぎりぎりで有意にならなかった場合を考えてみる.帰無仮説が正しいと考えるには少し不自然な検定統計量が得られている. 「・・・だとは言えない」というように,対立仮説が支持されなかったということを述べる. 「証拠不足」に似ている. 例:2つの餌 A と B には,体重増加の効果に差があるとは言えない.

正規母集団の母平均の検定 (両側検定の場合) 帰無仮説:母集団平均 μ は,特定の値 μ0 である.対立仮説:・・・ μ0 ではない. H0: μ = μ0 H1: μ ≠ μ0 標本平均を標準化する. 有意水準5%の場合,検定統計量 Z の値が +1.96 以上,あるいは -1.96 以下であれば,帰無仮説を棄却.

P=0.025 P=0.025 z=-1.96 z=+1.96

正規母集団の母平均の検定 (片側検定の場合) 帰無仮説:母集団平均 μ は,特定の値 μ0 である.対立仮説:・・・ μ0 より大きい(小さい). H0: μ = μ0 H1: μ > μ0 (あるいは, μ < μ0 ). 標本平均を標準化する. 有意水準5%の場合,検定統計量 Z の値が +1.64 以上(対立仮説が μ < μ0 の場合, -1.64 以下)であれば,帰無仮説を棄却.

P=0.05 z=+1.64

例題 テキストp.163例1 問題意識:銘柄Bの電球の平均寿命は,銘柄Aの電球の平均寿命(1180h)より短いのでは? 銘柄B100個をテスト. 帰無仮説が正しいならば,標本平均は,平均 1180,分散 σ2/n の正規分布に従う.

得られた標本平均 1140 を標準化 帰無仮説が正しい場合に このような標本平均が得られる確率は 非常に小さい(片側 0.05 以下). よって,有意水準5%で帰無仮説を棄却. 結論:電球Bの平均寿命は電球Aの平均寿命よりも短い.

例題についての補足 テキストでのこの例題の解説では,標本平均を標準化する代わりに,標本平均の棄却限界値(1165)および棄却域を決定している.検定統計量として標本平均の値を用いるか(テキスト),標準化された値 Z を用いるかの違いである.(テキストp.168参照) 片側検定を行うか両側検定を行うかは,前もって決めておかなければならない. (テキストp.168参照)

母平均の区間推定と検定(1/2) 母平均の区間推定では,母平均の値は未知. 母平均の仮説検定では,帰無仮説において母平均の値を仮定する. 標本から得られた平均値を,具体的な値としては標準化できない.(標準化の式に未知数 μ が入っている) 未知の母平均を高い確率で含む区間を構成. 母平均の仮説検定では,帰無仮説において母平均の値を仮定する. 仮定した値を使って標準化が可能

母平均の区間推定と検定(2/2) 母平均の区間推定と検定は表裏の関係. 帰無仮説が棄却されるかどうか =仮定される平均値が信頼区間に含まれるかどうか 1140 という標本平均から母平均の90%信頼区間(片側で5%)を求めると, 電球Aの平均寿命 1180 が含まれていない. 棄却限界値 1165.24 からの区間推定ではちょうど含む.

母集団分散が未知の場合の 母平均の検定 母集団の標準偏差 σ が未知の場合,標本の大きさが十分に大きければ(目安として,30以上),標本標準偏差 s で置き換える.σ≒s と考えられる.(大標本法) 標本の大きさが小さいとき,母集団分布が正規分布であると考えられるなら,t 分布を用いた t 検定を行う.→次回の授業

中心極限定理を利用した検定 母集団の分布が正規分布でなくても,標本の大きさが十分に大きければ,標本平均の分布は,平均 μ,分散 σ2/n の正規分布に従う(中心極限定理).標準化と検定が可能. 例:成功確率 p の,n 回のベルヌーイ試行での,成功割合 X/n の分布(X:成功回数)

例題 テキストp.170例1 問題意識:ある農業実験の結果はメンデルの法則(黄色:緑色=3:1)に矛盾しているのでは? H0: p = 3/4 H1: p ≠ 3/4 (両側検定) 224個のエンドウ豆で,176個が黄色. 帰無仮説が正しいならば,標本割合は,平均 3/4,標準偏差 0.029 (テキストでの計算)の正規分布に従う.

得られた標本割合 176/224 を標準化 有意水準5%の両側検定では 得られた標本割合は棄却域 (Z > +1.96)に落ちない. よって,帰無仮説を保持. 結論:メンデルの法則に矛盾しているとは言えない

統計的仮説検定の結果の報告 統計的仮説検定の結果を適切に報告するために,知っておかなければならないことはいろいろある. American Psychological Association(APA)の Publication Manual が定めているスタイルは,多くの分野で標準となっている.統計入門のレベルからもう少し学習を重ねたら,ぜひ読んでほしい.(卒論で統計を使う人は必読!)