第4章 統計的検定 統計学 2007年度.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
第3章 統計的推定 統計学 2008年度.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

第4章 統計的検定 統計学 2007年度

Ⅰ 仮説検定の考え方 Ⅱ 1つの標本にもとづく検定 Ⅲ 2つの標本にもとづく検定 a) 仮説の設定 b) 2種類の誤り c) 仮説検定の手順 Ⅰ 仮説検定の考え方 a) 仮説の設定 1) 検定仮説、対立仮説 2) 片側検定、両側検定 b) 2種類の誤り c) 仮説検定の手順 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 2) 母分散が未知の場合 b) 母比率の検定 Ⅲ 2つの標本にもとづく検定 a) 母平均の差の検定 b) 母比率の差の検定

Ⅰ 仮説検定の考え方 次のような問題を考える。 2007年のセンター試験、英語の平均点は131点であった。 Ⅰ 仮説検定の考え方 次のような問題を考える。 2007年のセンター試験、英語の平均点は131点であった。 T高校では3年生全員がセンター試験を受験したが、受験生の中から25人を選んで調査したところ、その平均点は145点であった。 T高校の生徒の英語の試験の成績は、全受験者平均より良いといえるだろうか。  ⇒ この疑問に対し、統計的に答える方法が統計的検定

a) 仮説の設定 1) 検定仮説、対立仮説 この問題において、「T高校の生徒の英語の成績は全受験者平均と変わらない」のか、 「T高校の生徒の英語の成績は全受験者平均より高い」のかが知りたいことである。 T高校の受験生全体の英語の平均点をμとあらわすと、 H0: μ=131 H1: μ>131   という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。

検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。 検定仮説(H0) 検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。(この場合、T高校としては「全受験者平均より良い」という結論を出したいので、この仮説は否定してほしい) 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。   検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。

⇒ このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 2) 片側検定、両側検定 この例では、T高校の受験生の平均点は「変わらない」か「高い」の場合のみを考えた。(T高校の受験生の平均点が全受験者平均より「低い」場合は考えなかった)   ⇒ このように、対立仮説のとりうる範囲が検定仮説の片側にくる検定を片側検定という。 ※ この例の場合、検定仮説をH0: μ≦131として、 「 T高校の生徒の英語の成績は全受験者平均より高くない」のか 「 T高校の生徒の英語の成績は全受験者平均より高い」のかを検定することも可能である。しかしこの場合も検定仮説は対立仮説に近い値であるH0: μ=131を用いる。理由は後述する。 H0: μ=131 H1: μ>131

⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。 一方、ネジを作る工場において作られたネジが規格どおりかどうかを判断する場合には、「規格どおり」か「大きいか、小さいか」という判断が必要となる。   ⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。このような検定を両側検定という。  たとえば、ネジがの直径が5mmかどうかを検定するには、 H0: μ=5 H1: μ≠5  という両側検定をおこなうことになる。 H1: μ<5 H0: μ=5 H1: μ>5 あわせてH1: μ≠5

理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。 b) 2種類の誤り 仮説検定には2種類の誤りがある。 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらを同時に成り立たせることは難しい。 通常は第1種の誤りを0.05などの一定の小さな値(有意水準という)以下におさえた検定をおこなう。これはH0を否定(棄却)する強い証拠がない限り、H0を採択するということである。 H0を採択 (逮捕) H1を採択 (不逮捕) H0が真 (真犯人) H1が真 (無実) 取り逃がし (第1種の誤り) 正 誤逮捕 (第2種の誤り) 正

仮説検定は次のような手順をとる。 c) 仮説検定の手順 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ   仮説検定は次のような手順をとる。 <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ 検定仮説の採択域と棄却域を設定する <ステップ3> 統計量が採択域 統計量が棄却域 <ステップ4> H0を採択 H1を採択

<ステップ2>仮説検定に適当な統計量 T高校の例では、25人の標本平均  の分布は中心極限定理により、平均μ、分散  の正規分布にしたがう。 これを標準化した  は標準正規分布にしたがうので、これが仮説検定に適当な統計量である。  (母分散が未知の場合は      が自由度n-1のt分布にしたがうことを使う)

仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、 は平均131、分散82の正規分布にしたがう。 <ステップ3>採択域と棄却域の設定 仮説検定では、まず検定仮説が正しいと思ってみる。T高校の例で、σ=40であったなら、  は平均131、分散82の正規分布にしたがう。   となる。これは標本分布の95%の範囲内(両側検定の場合)である。⇒ 検定仮説を採択 の分布 zの分布 標準化  →

もし、z=2.4という結果が出たなら、どのように考えれば良いのであろうか。 この例の場合対立仮説を採択し、他の母集団(たとえばμ=160)から得られた標本と考える。 片側検定の場合は、 zが0よりだいぶ大きい場合、検定仮説を棄却して対立仮説を採択することになるが、このようなzの値は、μ<131を仮定した分布(たとえばμ=120)のすべてにおいて、検定仮説が棄却される。 zがここだったら検定仮説を棄却し、対立仮説を採択する。 zがここだったら検定仮説を棄却し、対立仮説を採択する。

片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、 採択域と棄却域は次のように設定される。 判定の境界値はそれぞれの統計量の分布による。(統計量の分布が標準正規分布で両側検定の場合は、-1.96と1.96の間に入れば採択域、それ以外が棄却域となる) 片側検定において有意水準5%の検定をおこなう場合、標準正規分布にしたがう変数であれば、         のとき検定仮説を採択し、      のとき対立仮説を採択する。 t分布にしたがう変数であれば、α=.05の列から求める自由度のものを探す。(ここでは、t0.90と表記する。) 両側検定 棄却域 採択域 棄却域 片側検定 採択域 棄却域

Ⅱ 1つの標本にもとづく検定 次のような問題を考える。 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 次のような問題を考える。 (例) ある工場では直径5mmのねじを標準偏差0.04mmにおさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、9本を標本として選んだところ、その平均が4.97mmであった。これは品質管理上異常なしと考えて良いだろうか。

この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。 1.仮説の設定   この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。   検定仮説としては「品質管理上異常がない」という仮説を用いる。このとき対立仮説は「品質管理上異常がある」という仮説となり、 H0: μ=5 vs. H1: μ≠5   と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異常がある」には、大きすぎると小さすぎるの両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる)。   ※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられる。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であることの方が望ましい。   ※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5 vs. H1: μ > 5 とすることである。

この例では母分散が分かっているので、標本平均 を用いて、 2.検定統計量   この例では母分散が分かっているので、標本平均 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域   検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0から大きく離れていたならばこの仮定は誤りだったと考える。 zがここだったら検定仮説が正しいが zがここだったら検定仮説は誤りで、 このような分布が正しいと考える。

この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定をおこなうなら、 のとき検定仮説を採択し、                 のとき検定仮説を採択し、            または       のとき対立仮説を採択する。 † 検定仮説が正しいなら、z>1.96またはz<-1.96となるような  が選ばれる確率は5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味している。 4.統計量の計算   検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると   となる。よって        なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。 棄却域 -1.96 採択域 1.96 棄却域

母分散が未知の場合は、zの代わりに を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 2) 母分散が未知の場合   母分散が未知の場合は、zの代わりに       を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 次のような問題を考える。 (例) ある科目の試験を、平均点70点となるように作成したい。そこで、26人をサンプルとして選び、問題をといてもらったところ、26人の平均点は60点、分散が625であった。試験の問題作りは成功したといえるだろうか。

(解) 1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でない」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮説を設定する。 2.検定統計量 標本平均 を用いて、 を考えると、これは自由度n-1のt分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意水準5%の仮説検定をおこなうなら、             のとき検定仮説を採択し、       または       のとき対立仮説を採択する。 4.統計量の計算   となる。              なので検定仮説を採択する。よって問題作りは成功したといえる。

母比率の検定では、 が標準正規分布にしたがうことを利用する。 b) 母比率の検定 母比率の検定では、        が標準正規分布にしたがうことを利用する。 (例) 2007年5月30日(水)に放送された「藤原紀香・陣内智則結婚披露宴」では、視聴率が24.7%(関東地区 600世帯を対象)†であった。この結果から、20%を超えたといえるであろうか。 † ちなみに関西地区では40.0%であった。

(解) 1.仮説の設定 H0: p=0.2 vs. H1: p>0.2 という仮説を設定する。「20%を超えない」という検定仮説に対し、「20%を超えた」という対立仮説を検定するので、 H0: p≦0.2 vs. H1: p>0.2 であるが、検定仮説は対立仮説に最も近い1点を考えれば良い。(0.2で成り立てば、それより小さな値では必ず成り立つ) 2.検定統計量 標本比率 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説検定を片側検定でおこなうなら、      のとき検定仮説を採択し、             のとき対立仮説を採択する。 4.統計量の計算   となる。      なので対立仮説を採択する。よってこの番組の視聴率は20%を超えたといえる。

Ⅱ 2つの標本にもとづく検定 a) 母平均の差の検定 Ⅱ 2つの標本にもとづく検定 a) 母平均の差の検定 2つの母平均の差の検定は、2社のメーカーが作った電球の寿命の差があるかどうかとか、試験の成績について男女間で差があるかどうかなどを検定するときに用いられる。 母平均の差の検定は、母分散についての情報がどの程度あるかによって、次のように分類できる。 母分散がともに分かっている場合 母分散は分からないが、等しいとみなしてよい場合 母分散について全く分からない場合

この3通りについて、それぞれ用いる検定統計量は異なる。ここでは、母分散は分からないが、等しいとみなしてよい場合を考えてみる。 2つの標本から求められた分散を      とあらわすと、母分散の不偏推定量は   となり、これを用いて   を考えると、これは自由度 n1+ n2-2 のt分布にしたがう。

(例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘柄Aのタバコ10本は平均 27. 0mg、標準偏差 1 (例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘柄Aのタバコ10本は平均 27.0mg、標準偏差 1.7mg、 銘柄Bのタバコ7本は平均 29.3mg、標準偏差 1.9mgであった。この2つの銘柄の間にニコチン含有量の差はあるであろうか。 (解) 1.仮説の設定 銘柄Aのニコチン含有量をμ1、銘柄Bのニコチン含有量をμ2とし、M=μ1 ー μ2とすると、 H0: M=0 vs. H1: M≠0 となる。 2.検定統計量 標本平均   を用いて、 を考えると、これは自由度n1+n2-2のt分布にしたがう。

3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度10+7-2=15のt分布にしたがうので、t0.95=2.131である。有意水準5%の仮説検定をおこなうなら、             のとき検定仮説を採択し、       または       のとき対立仮説を採択する。 4.統計量の計算 σ2について不偏推定量   を用いると、   よって        なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。   2銘柄のニコチン含有量には差があるといえる。

2つの母比率p1およびp2に差があるかどうかを検定する場合は、 b) 母比率の差の検定 2つの母比率p1およびp2に差があるかどうかを検定する場合は、   が標準正規分布にしたがうことを利用する。 (例) 6月10日(日)に放送された「サンデーモーニング」の視聴率は13.9%(関東地区 600世帯を対象)であった。この結果は、同じ日に放送された「THEサンデー」の視聴率11.7%を上回ったといえるかどうか。

(解) 1.仮説の設定 「サンデーモーニング」の視聴率をp1、「THEサンデー」の視聴率をp2とし、M= p1-p2とすると、H0: M=0 vs. H1: M>0$ となる。 2.検定統計量 標本比率    を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説検定をおこなうなら、       のとき検定仮説を採択し、      のとき対立仮説を採択する。 4.統計量の計算 pの値が不明なので、プールした推定値   をもちいる。   より、      なので検定仮説を棄却しない。