ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
母集団平均値の区間推定 大標本の区間推定 小標本の区間推定.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
対応のあるデータの時のt検定 重さの測定値(g) 例:
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2) 青山学院大学社会情報学部 「統計入門」第14回 ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp Twitter: @aterao

4.2つの平均値の差の検定 2つの群があるとき,その母集団平均に差があるかどうかの検定.適用例は多い. 例:参加者を2群に分け,異なった処置をし(異なった薬剤,異なった教育方法など),興味ある変数(医学的指標,テスト成績など)に関して,2群に差があるかどうかを検定する. 標本平均を計算することのできる連続型変数を測定する.「成功」と「失敗」のように計数を行う変数の場合には,割合の差の検定(後述)あるいは分割表の検定(第10章)を行う.

平均値の差の検定での母集団 2群の背後に,それぞれ母集団を想定する. 例:2つの教育方法の効果を比較するとき,第1の方法で教育された無限に多くの人と,第2の方法で教育された無限に多くの人を考える.研究への参加者はこれら母集団から抽出された標本である. 研究者は,「今回の研究に参加した人に関しては,2つの教育方法で成績に差が生じました」と言いたいのではない.もっと一般化した結論を述べたい.想定する母集団は結論を一般化する範囲と一致する(例:日本人の成人英語学習者)

平均値の差の検定での帰無仮説 2群の標本平均を利用して,母集団での平均に関する検定を行う. 帰無仮説H0: μ1= μ2 対立仮説H1: μ1 ≠ μ2 (両側検定の場合) 2群の母集団平均( μ1 および μ2 )が同一であるとしても,標本平均では2群間に差が生じることが一般的.その差が小さければ帰無仮説は棄却できない.

2つの標本 第1群の標本は,第1群の母集団から無作為抽出されたと考える. 第2群の標本は,第2群の母集団から無作為抽出されたと考える. 大きさ n1 の標本: 標本平均: 第2群の標本は,第2群の母集団から無作為抽出されたと考える. 大きさ n2 の標本:

2つの標本平均の分布 標本を抽出し,2群それぞれの平均を計算することを何度も繰り返したとする. 第1群と第2群の標本平均の差の分布は? 第1群の標本平均の分布: σ12 は第1群の母集団分散 第2群の標本平均の分布: σ22 は第2群の母集団分散 第1群と第2群の標本平均の差の分布は? 2つの独立な確率変数の,差の分布を考える.

独立な確率変数の差の分布 正規分布に従う2つの独立な確率変数 差 X1 – X2 の分布 確率変数 X1 の分布: 確率変数 X2 の分布: 平均は「差」だが,分散は「和」になっていることに注意!

独立な確率変数の和の分布 和 X1 + X2 の分布 平均も分散も「和」 和および差の分布の平均は,期待値の性質から明らか.分散については次のスライド.

確率変数の和・差の分散 2つの独立な確率変数 X1 , X2 の,和および差の分散.

標本平均の差の分布 標本平均は確率変数なので,確率変数の差の分布に関する性質を適用できる. 第1群の標本平均の分布: 第2群の標本平均の分布: 標本平均の差の分布:

標準化と検定 標本平均の差の分布: 得られた標本平均の差を標準化すれば,標準正規分布を用いた検定を行うことができる.

帰無仮説が正しいと仮定すると,μ1 – μ2 = 0 より, 母集団分散が未知の場合 大標本(目安として n1 > 25, n2 > 25)では,標本分散で代用する. 小標本でも標本分散で代用するが,正規分布のかわりに t 分布を用いた検定を行う.(後述)

検定での注意 大標本では,2群の母集団分布が正規分布でなくてもよい. 中心極限定理により,平均値に関しては正規分布が利用できる. 2群のスコアは,2つの母集団から,それぞれ独立に抽出したものでなくてはならない. 例:同一人物の右足の長さと左足の長さは関連があるから(右足が短い人は左足も短い),これら2変数は独立ではない.(テキストp.173)

例題(テキスト p.172-175) 2種類の電球A,Bの寿命を,それぞれ100個ずつテストする. 問題意識:2つの銘柄の間で,平均寿命に差はあるのか? 帰無仮説H0: μ1= μ2 対立仮説H1: μ1 ≠ μ2

標本平均と標準偏差 銘柄A 銘柄B 検定統計量(帰無仮説が正しいと仮定) 有意ではない

5.2つの割合の差の検定 2つの群があるとき,その母集団割合に差があるかどうかの検定. 参加者を2群に分け,異なった処置をし(異なった薬剤,異なった教育方法など),興味ある変数(医学的指標,テスト成績など)に関して,2群に差があるかどうかを検定する(平均の差の検定と同じ興味!). 平均の差の検定とは異なり,「成功」と「失敗」のように計数を行う変数を測定する(例:投薬効果の「あり」「なし」).

割合の差の検定での帰無仮説 2群の標本割合を利用して,母集団での割合に関する検定を行う. 帰無仮説H0: p1= p2 対立仮説H1: p1 ≠ p2 (両側検定の場合) 2群の母集団割合( p1 および p2 )が同一であるとしても,標本割合では2群間に差が生じることが一般的.その差が小さければ帰無仮説は棄却できない.

2つの標本 第1群の標本は,第1群の母集団から無作為抽出されたと考える. 大きさ n1 の標本: 「成功」を1,「失敗」を0.各 x1i (i = 1, 2, n1)は,いずれかの値をとる. 成功回数: 標本割合: 2項分布で学習したこと!

第2群の標本は,第2群の母集団から無作為抽出されたと考える. 大きさ n2 の標本: 「成功」を1,「失敗」を0.各 x2j (j = 1, 2, n2)は,いずれかの値をとる. 成功回数: 標本割合:

2つの標本割合の分布 (大)標本を抽出し,2群それぞれの標本割合を計算することを何度も繰り返したとする. 第1群の標本割合の分布: 第2群の標本割合の分布: 第1群と第2群の標本割合の差の分布は? 2つの独立な確率変数の,差の分布を考える. 中心極限定理による

標本割合の差の分布 標本割合は確率変数なので,確率変数の差の分布に関する性質を適用できる. 第1群の標本割合の分布: 第2群の標本割合の分布: 標本割合の差の分布:

標準化と検定 標本割合の差の分布: 得られた標本割合の差を標準化すれば,標準正規分布を用いた検定を行うことができる.

帰無仮説( p1 = p2 )が正しいと仮定すると, p1 = p2 = p, q = 1 - p として,

母集団割合が未知の場合 大標本(目安として n1 > 25, n2 > 25)では,標本割合で代用する.ただし,2群を合併して母集団割合を推定する(下の式). 小標本の場合は分割表の検定(第10章) にする.

例題(テキスト p.176-177) 2種類の薬A,Bの効果を,それぞれ200人ずつに投与してテストする. 効果は「あり」か「なし」のいずれかで測定. 問題意識:2つの薬の間で,効果に差はあるのか? 帰無仮説H0: p1= p2 (母集団では,効果「あり」の割合は等しい) 対立仮説H1: p1 ≠ p2

標本割合と母集団割合(推定値) 薬A: 薬B: 検定統計量(帰無仮説が正しいと仮定) 母集団割合の推定値 有意である

6.小標本法 小標本での,特定の母平均に関する検定 標本平均の標準化 H0: μ = μ0 H1: μ ≠ μ0 (両側検定の場合) 標本平均の標準化 母集団分散 σ2 が未知の場合には,標本分散で置き換える.この検定統計量の分布は自由度 n-1 の t 分布である.

例題(テキスト p.178-179) ミサイルの新しい推進燃料を,10個の実験用ミサイルでテストする. 平均飛行距離を測定 問題意識:新しい推進燃料での平均飛行距離は,これまでの燃料での平均飛行距離(340マイル)よりも長いのか? 帰無仮説H0: μ= 340 対立仮説H1: μ > 340(片側検定)

標本平均と標本(不偏)分散 検定統計量 標本平均: 標本分散: 帰無仮説が正しいとき,自由度 9 の t 分布に従う. したがって,有意である.

小標本での平均値の差の検定 平均値の差の検定での検定統計量 z 小標本で母集団分散が未知の場合,標本分散を使う.ただし,単なる置き換えでは t 分布にならないため(ベーレンス-フィッシャー[Behrens-Fisher]問題),2つの母分散が等しいと仮定してその推定を行う. ベーレンス-フィッシャー問題については,数学セミナー増刊『入門 現代の数学11 統計的推測―2標本問題』の第2章などに,より詳しい解説がある.

母集団平均が等しいと仮定したときの, 標準化された2つの平均の差 において,2つの母集団分散が等しい(σ12 = σ22 = σ2)とさらに仮定すると, この σ2 を,標本から計算された2つの分散 s12 および s22 を用いて推定する.

2群それぞれにおける平均からの偏差平方和の, 和の期待値を計算する. σ12 = σ22 = σ2 のとき, したがって, は,母集団分散 σ2 の不偏推定量である.

仮定0:2群の母平均が等しい(検定の帰無仮説) 仮定1:2群の母分散が等しい 仮定2:母集団の分布は正規分布 (t 分布を利用するために必要な仮定) テキストp.179 公式(6) は,自由度 n1 + n2 – 2 の t 分布に従う.

検定での注意 小標本での,2つの平均値の差についての, t 分布を利用した検定( t 検定 と呼ぶ)では,2つの前提条件が満たされている必要がある. 母集団分布は正規分布 母集団分散が等しい 前提条件1は確認しないことが多いが,前提条件2は確認する(次のスライド).

等分散の検定:小標本での平均値の差の検定では,t 検定を実行する前に,2つの母集団分散が等しいかどうかの検定を行う. 標本分散の比をとって F 検定(F 分布を使用). テキストでは省略されている. 2つの母集団分散が等しいという検定において,帰無仮説( σ12 = σ22 )が棄却されてしまったときには,ウェルチ(Welch)の検定と呼ばれる検定を行うことが多い.

例題(テキスト p.179-180) パイプまたは葉巻喫煙者11人と,紙巻きタバコの喫煙者39人で,肺に吸い込む煙の量を比較する. 血液中のCOHb濃度を測定 問題意識:パイプまたは葉巻喫煙者と,紙巻きタバコの喫煙者で,肺に吸い込む煙の量に違いはあるのか? 帰無仮説H0: μ1= μ2 対立仮説H1: μ1 ≠ μ2 (両側検定)

標本平均と標本(不偏)分散 検定統計量 パイプまたは葉巻: 紙巻きたばこ: 帰無仮説が正しいとき,自由度 48 の t 分布に従う. したがって,有意である.

対応のあるデータ 測定値間に対応をとることができるデータ.(独立な2群は対応なし) 例1:各参加者が2つの実験条件に参加 例2:同一対象の時間的変化 例3:類似の個体を選んで対を構成し,一方を条件1,もう一方を条件2にランダムに割り当てる. 参考:これらの例は,「乱塊法」(randomized block design)と呼ばれる実験方法.テキスト第11章「分散分析」の発展的事項.

対応のある t 検定 i 番目のペア xi ,yi の差を zi とする. zi は,平均 μz ,分散 σz2 の正規分布から,無作為に抽出されたと考える. ペア数が n のとき,変数 z を n 回測定したと考えれば,1標本での平均値の検定に帰着できる. 帰無仮説:

例題(章末問題36) データを入力したエクセルファイル(prob8_36.xlsx)をダウンロードし,「問題」シートで検定を実行. 解答は「解答」シートにある.