統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2009年 2009年11月26日(木).
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。  母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。 例)サイコロを10回続けて振ったら、偶数が1回しか出現しなかった。この結果(標本)から考えて、このサイコロは正しく出来ていない(イカサマである)と予想されるが(偶数の出現確率が0.5ではなく、もっと小さな値である)、その予想は正しいのか? 帰無仮説 :母数に関する仮説 → 偶数の母比率は0.5である 対立仮説 :母数に関する分析者の予測 → 偶数の母比率は0.5より小さい 帰無仮説を否定することによって、対立仮説を主張する 帰無仮説が正しいとしたら、無作為標本に基づく結果(「偶数が1回しか出ない」)は、どの程度の確率で生じるのか? *確率が小さい:帰無仮説が正しいとしたら、極めて起こりにくいことが起こった    帰無仮説から生じた結果とは考えにくい → 帰無仮説を棄却し対立仮説を採択 *確率が小さくない:帰無仮説の元でも、十分に起こり得る結果である    帰無仮説から生じた結果であることを否定できない→ 帰無仮説を棄却しない

極めて起こりにくい事が起こった → どの程度の確率を考えたら良いか? 極めて起こりにくい事が起こった → どの程度の確率を考えたら良いか? 区間推定を行うための大前提(母平均の推定) 我々が手にした標本平均は、母平均を中心して、その前後±a の範囲の値、つまり     μ-a ~μ+a   の値である。 前提の範囲内 → 帰無仮説の元でも、十分に起こり得る結果 前提の範囲外 → 極めて起こりにくい事が起こった 前提範囲の確率(水色部分の、面積)としては  ① 95% → 範囲外5% → 起こりにくい事=「20回の内、1回以下しか起こらない」      有意水準5%での仮説検定  ② 99% → 範囲外1% → 起こりにくい事=「100回の内、1回以下しか起こらない」      有意水準1%での仮説検定

サイコロの例 帰無仮説 :母数に関する仮説 → 偶数の母比率は0.5である 帰無仮説 :母数に関する仮説 → 偶数の母比率は0.5である 対立仮説 :母数に関する分析者の予測 → 偶数の母比率は0.5より小さい 帰無仮説が正しい場合の偶数の回数の分布(10回の試行) 回数 *「5」の確率が最も高く、それから離れるに従って確率は小さくなる *「2」~「8」の確率は0.979     →「1」以下、又は「9」以上となる確率は5%を下回る(2.1%=1-0.979)      ↓ 結果は「1」であった 5%の有意水準で、仮説「偶数確率は0.5」は正しくないといえる(仮説棄却)   但し、1%の有意水準では仮説は棄却できない

統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える (3)得られた標本値(実現値)がその標本統計量の分布の中でどこに位置する  かを調べる 標本統計量として出現しにくい値    出現確率(有意水準)5%又は1%以下 → 帰無仮説を棄却                        対立仮説を採択 <判定> 標本統計量として出現しやすい値    区間推定での前提範囲(95%又は99%) → 帰無仮説を棄却しない 帰無仮説 別の仮説

簡単な具体例 無作為に抽出した静大生100名に対する調査から、「パソコン保有率は60%」と得られた。この結果から、「静大生の半分以上がパソコンを持っている」と結論して良いか? (1)帰無仮説の設定 静大生のパソコン保有率は50%である 否定 静大生の半分以上がパソコンを持っている (2)帰無仮説のもとでの標本統計量(パソコン保有率:標本比率)の分布を考える 標本比率に関する中心極限定理 母比率πの母集団からの n個の無作為標本に基づく標本比率の分布は? 平均π、分散π(1-π)/n の正規分布(近似) 平均0.5、分散0.5(1-0.5)/100=0.0025(標準偏差0.05) の正規分布(近似) 有意水準5%で帰無仮説を棄却 2.5% 静大生の半分以上はパソコンを持っている

両側検定と片側検定 両側検定 帰無仮説に対して、その棄却域を分布の両側に設定する検定。帰無仮説π= π0に対して、対立仮説をπ≠π0とする場合がこれに相当する。 帰無仮説が棄却されるのは、標本統計量の実現値が帰無仮説π0と比較して異常に大きい場合と小さい場合である。 片側検定 帰無仮説に対して、その棄却域を分布の片側に設定する検定。帰無仮説π= π0に対して、対立仮説をπ>π0( 又はπ<π0)とする場合。 実現値が分布の片側だけに現れる確かな根拠があれば、棄却域は実現値の現れる側のみに設定すれば良い。 両側検定と比較し、仮説を棄却できる可能性は高くなる。そのため、片側検定を用いるためには、実現値が分布の片側のみに出現する極めて強い根拠が必要。 → 普通は両側検定を用いる

仮説検定における誤り 第1種の誤り(過誤) 帰無仮説が正しいにも関わらず、それを棄却してしまう場合 *有意水準α%で帰無仮説を検定する   → 帰無仮説が真であったとしても、確   率αで棄却域の実現値が生じる   → 第1種の誤りを犯す確率はα 採択域

帰無仮説が誤っているにも関わらず、それを棄却できない場合 誤りの確率 第2種の誤り(過誤) 帰無仮説が誤っているにも関わらず、それを棄却できない場合 真の分布が、仮説採択域に含まれる確率

統計的仮説検定で主張できること ●帰無仮説が棄却できた場合 ・標本値と帰無仮説には「十分な」差がある  ・標本値と帰無仮説には「十分な」差がある  ・「十分な」とは、帰無仮説が正しいとした場合に、標本値が得られる確率が高々α%で   あること → 起こりにくい事が起こった → 帰無仮説を否定  ・但し、確率は小さくても(α%)起こること → 第1種の誤りの確率α% ●帰無仮説が棄却できなかった場合  ・標本値と帰無仮説には「十分な」差がない  ・但し、「帰無仮説を否定するに足る十分な証拠(差)が無かった」ことを意味するので   あって、「帰無仮説が正しい」事は意味しない。 標本数を増やせば、必ず帰無仮説は棄却できる 標本数が少ないために、十分な証拠とならない

様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定 ① 1標本の検定 1つの母集団における母数についての仮説を検定する  例:静大生のパソコン保有率は50%を越えているのだろうか?    浜松市の1世帯当たりの年間収入の平均値は300万を越えているのだろうか? ② 2標本の検定 2つの母集団における2つの母数間の関係についての仮説を検定する  例:静大生と浜医大生のパソコン保有率には差があるのだろうか?    浜松市と静岡市在住者の通勤時間には差があるのだろうか? ③ 3標本以上の検定 3つの以上の母集団における母数間の関係についての仮説を検定する  例:静大生では学年(1~4年)によってアルバイト収入に差があるのだろうか?    静大では、プロ野球セントラルリーグの各チームを好む比率に差があるのだろうか? ④ 2変数間の関連の強さに関する検定 得られた標本相関係数の値から考えて、母相関係数は0でないといえるのだろうか? 得られたクロス表から判断して、2変数間に関連があると言えるのだろうか?

1標本の平均値の検定 (母分散が既知の場合) 1標本の平均値の検定 (母分散が既知の場合) 検定の場面 1つの母集団(母分散σ2が既知)の母平均に対する仮説を、その母集団からのn個の無作為標本から求めた標本平均値に基づいて検定する。 仮説の設定 帰無仮説 : 母平均μは、μ0である → μ= μ0 対立仮説 : 母平均は、μ0でない → μ≠ μ0 (両側検定)  帰無仮説が正しい場合の標本平均の分布 平均μ0 分散σ2/n の正規分布で近似できる 帰無仮説を棄却 帰無仮説を棄却できない 標本分布における実現値の位置による判定

1標本の平均値の検定 (母分散が既知の場合) : 具体的な手順 1標本の平均値の検定 (母分散が既知の場合) : 具体的な手順 標準化

1標本の平均値の検定 (母分散が既知の場合) : 具体例 1標本の平均値の検定 (母分散が既知の場合) : 具体例 全国の大学生の1ヶ月アルバイト収入の平均は5万円、標準偏差は5千円である。今、無作為に抽出した100人の静大生のアルバイト収入の平均が4万9千円であったとすれば、静大生は全国と比較してアルバイト収入が少ないと言えるだろうか?   有意水準5% 帰無仮説:静大生のアルバイト収入の平均(μ0)は5万円である 対立仮説:静大生のアルバイト収入の平均(μ0)は5万円ではない 帰無仮説が正しい場合の標本平均の分布    平均5万、分散50002/100=25000 (標準偏差500) の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却される

1標本の平均値の検定 (母分散が未知の場合) 1標本の平均値の検定 (母分散が未知の場合) 検定の場面 1つの母集団(母分散が未知であるため、データに基づく不偏分散を用いる)の母平均に対する仮説を、その母集団からのn個の無作為標本から求めた標本平均値に基づいて検定する。 仮説の設定 帰無仮説 : 母平均μは、μ0である → μ= μ0 対立仮説 : 母平均は、μ0でない → μ≠ μ0 (両側検定)  帰無仮説が正しい場合の標本平均の分布 平均μ0 分散σ2/n の正規分布で近似できる 帰無仮説を棄却 帰無仮説を棄却できない 標本分布における実現値の位置による判定

1標本の平均値の検定 (母分散が未知の場合) : 具体的な手順 不偏分散 1標本の平均値の検定 (母分散が未知の場合) : 具体的な手順 不偏分散 標準化

1標本の平均値の検定 (母分散が未知の場合) : 具体例 1標本の平均値の検定 (母分散が未知の場合) : 具体例 全国の大学生の1ヶ月アルバイト収入の平均は5万円(標準偏差は未知)である。今、無作為に抽出した静大生100のアルバイト収入の平均が4万9千円、不偏標準偏差が5千円であったとすれば、静大生は全国と比較してアルバイト収入が少ないと言えるだろうか ?  ・・・ 有意水準5% 帰無仮説:静大生のアルバイト収入の平均(μ0)は5万円である 対立仮説:静大生のアルバイト収入の平均(μ0)は5万円ではない 帰無仮説が正しい場合の標本平均の分布    平均5万、分散σ2/100 の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却される