統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
統計学  西 山.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える (3)得られた標本値(実現値)がその標本統計量の分布の中でどこに位置する  かを調べる 標本統計量として出現しにくい値    出現確率(有意水準)5%又は1%以下 → 帰無仮説を棄却                        対立仮説を採択 <判定> 標本統計量として出現しやすい値    区間推定での前提範囲(95%又は99%) → 帰無仮説を棄却しない

様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定 ① 1標本の検定 1つの母集団における母数についての仮説を検定する  例:静大生のパソコン保有率は50%を越えているのだろうか?    浜松市の1世帯当たりの年間収入の平均値は300万を越えているのだろうか? ② 2標本の検定 2つの母集団における2つの母数間の関係についての仮説を検定する  例:静大生と浜医大生のパソコン保有率には差があるのだろうか?    浜松市と静岡市在住者の通勤時間には差があるのだろうか? ③ 3標本以上の検定 3つの以上の母集団における母数間の関係についての仮説を検定する  例:静大生では学年(1~4年)によってアルバイト収入に差があるのだろうか?    静大では、プロ野球セントラルリーグの各チームを好む比率に差があるのだろうか? ④ 2変数間の関連の強さに関する検定 得られた標本相関係数の値から考えて、母相関係数は0でないといえるのだろうか? 得られたクロス表から判断して、2変数間に関連があると言えるのだろうか?

1標本の平均値の検定 (母分散が既知の場合) 1標本の平均値の検定 (母分散が既知の場合) 検定の場面 1つの母集団(母分散σ2が既知)の母平均に対する仮説を、その母集団からのn個の無作為標本から求めた標本平均値に基づいて検定する。 仮説の設定 帰無仮説 : 母平均μは、μ0である → μ= μ0 対立仮説 : 母平均は、μ0でない → μ≠ μ0 (両側検定)  帰無仮説が正しい場合の標本平均の分布 平均μ0 分散σ2/n の正規分布で近似できる 帰無仮説を棄却 帰無仮説を棄却できない 標本分布における実現値の位置による判定

1標本の平均値の検定 (母分散が既知の場合) : 具体的な手順 1標本の平均値の検定 (母分散が既知の場合) : 具体的な手順 標準化

1標本の平均値の検定 (母分散が既知の場合) : 具体例 1標本の平均値の検定 (母分散が既知の場合) : 具体例 全国の大学生の1ヶ月アルバイト収入の平均は5万円、標準偏差は5千円である。今、無作為に抽出した100人の静大生のアルバイト収入の平均が4万9千円であったとすれば、静大生は全国と比較してアルバイト収入が少ないと言えるだろうか?   有意水準5% 帰無仮説:静大生のアルバイト収入の平均(μ0)は5万円である 対立仮説:静大生のアルバイト収入の平均(μ0)は5万円ではない 帰無仮説が正しい場合の標本平均の分布    平均5万、分散50002/100=25000 (標準偏差500) の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却される

1標本の平均値の検定 (母分散が未知の場合) 1標本の平均値の検定 (母分散が未知の場合) 検定の場面 1つの母集団(母分散が未知であるため、データに基づく不偏分散を用いる)の母平均に対する仮説を、その母集団からのn個の無作為標本から求めた標本平均値に基づいて検定する。 仮説の設定 帰無仮説 : 母平均μは、μ0である → μ= μ0 対立仮説 : 母平均は、μ0でない → μ≠ μ0 (両側検定)  帰無仮説が正しい場合の標本平均の分布 平均μ0 分散σ2/n の正規分布で近似できる 帰無仮説を棄却 帰無仮説を棄却できない 標本分布における実現値の位置による判定

1標本の平均値の検定 (母分散が未知の場合) : 具体的な手順 不偏分散 1標本の平均値の検定 (母分散が未知の場合) : 具体的な手順 不偏分散 標準化

1標本の平均値の検定 (母分散が未知の場合) : 具体例 1標本の平均値の検定 (母分散が未知の場合) : 具体例 全国の大学生の1ヶ月アルバイト収入の平均は5万円(標準偏差は未知)である。今、無作為に抽出した静大生100のアルバイト収入の平均が4万9千円、不偏標準偏差が5千円であったとすれば、静大生は全国と比較してアルバイト収入が少ないと言えるだろうか ?  ・・・ 有意水準5% 帰無仮説:静大生のアルバイト収入の平均(μ0)は5万円である 対立仮説:静大生のアルバイト収入の平均(μ0)は5万円ではない 帰無仮説が正しい場合の標本平均の分布    平均5万、分散σ2/100 の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却される

2標本の平均値の差の検定 2つの母分散 、 に対する仮説の違いによる4つの検定場面 ●ケース1:母分散は既知で、かつ の場合 2つの母集団における2つの母数間の関係についての仮説を検定する  例:静大生と浜医大生の自宅学習時間(1日)には差があるのだろうか?    浜松市と静岡市在住者の通勤時間には差があるのだろうか? 2つの母分散   、   に対する仮説の違いによる4つの検定場面 ●ケース1:母分散は既知で、かつ          の場合 ●ケース2:母分散は既知ではあるが、         の場合 ●ケース3:母分散は未知であるが、         を仮定できる場合 ●ケース4:母分散は未知でありかつ、         を仮定できない場合

2標本の平均値の差の検定 (母分散は既知でかつ、 の場合) 2標本の平均値の差の検定 (母分散は既知でかつ、         の場合) 検定の場面 2つの母集団の母平均の差に対する仮説を、それぞれの母集団からのn1、n2個の無作為標本から求めた標本平均値の差に基づいて検定する。 仮説の設定 帰無仮説 : 母平均の差はμ0である → μ0=μ1ーμ2  → 一般的には、μ0=0 対立仮説 : 母平均の差は、μ0ではない →  μ1ーμ2 ≠ 0 (両側検定)  帰無仮説が正しい場合の標本平均の差の分布 平均μ1-μ2、分散          の正規分布で近似できる 平均0、分散            の正規分布で近似できる 0 帰無仮説を棄却できない 標本分布における実現値の位置による判定 帰無仮説を棄却

2標本の平均値の差の検定 (母分散は既知でかつ、 の場合) 2標本の平均値の差の検定 (母分散は既知でかつ、         の場合) 標準化

2標本の平均値の差の検定 (母分散は既知でかつ、 の場合) 具体例 情報学部生の無作為標本50名の1ヶ月アルバイト収入の標本平均値は5万円、工学部生の無作為標本100名の1ヶ月アルバイト収入の標本平均値は4万9千円であった。この2つの母集団の標準偏差は3千円であるとすれば、情報学部生と工学部生ではアルバイト収入に差がないと言えるだろうか?  有意水準5% 2標本の平均値の差の検定 (母分散は既知でかつ、         の場合) 具体例 帰無仮説:情報学部生と工学部生のアルバイト収入に差はない 対立仮説:情報学部生と工学部生ではアルバイト収入が異なる 帰無仮説が正しい場合の標本平均の差の分布    平均0万、分散30002(1/100+1/50)=270000 の正規分布に近似 採択域の上限値 採択域の下限値 仮説は棄却されない

2標本の平均値の差の検定 (母分散は既知でかつ、 の場合) 2標本の平均値の差の検定 (母分散は既知でかつ、         の場合) 検定の場面 2つの母集団の母平均の差に対する仮説を、それぞれの母集団からのn1、n2個の無作為標本から求めた標本平均値の差に基づいて検定する。 仮説の設定 帰無仮説 : 母平均の差はμ0である → μ0=μ1ーμ2  → 一般的には、μ0=0 対立仮説 : 母平均の差は、μ0ではない →  μ1ーμ2 ≠ 0 (両側検定)  帰無仮説が正しい場合の標本平均の差の分布 平均μ1-μ2、分散          の正規分布で近似できる 平均0、分散            の正規分布で近似できる 0 帰無仮説を棄却できない 標本分布における実現値の位置による判定 帰無仮説を棄却

採択域の上限値と下限値 母分散は既知で等しい 母分散は既知であるが等しくない 上限値 下限値

2標本の平均値の差の検定 (母分散は未知であるが、 を仮定できる場合) 2標本の平均値の差の検定 (母分散は未知であるが、          を仮定できる場合) 検定の場面 2つの母集団の母平均の差に対する仮説を、それぞれの母集団からのn1、n2個の無作為標本から求めた標本平均値の差に基づいて検定する。 仮説の設定 帰無仮説 : 母平均の差はμ0である → μ0=μ1ーμ2  → 一般的には、μ0=0 対立仮説 : 母平均の差は、μ0ではない →  μ1ーμ2 ≠ 0 (両側検定)  帰無仮説が正しい場合の標本平均の差の分布 平均μ1-μ2、分散          の正規分布で近似できる 平均0、分散            の正規分布で近似できる しかしσ2は未知 どのようにして母分散σ2を推定するか? 2つの標本を込みにして不偏分散を求める 第1標本: 第2標本:

2標本の平均値の差の検定 (母分散は未知であるが、 を仮定できる場合) 2標本の平均値の差の検定 (母分散は未知であるが、         を仮定できる場合) 標準化

2標本の平均値の差の検定 (母分散は未知であるが、 を仮定できる場合) 2標本の平均値の差の検定 (母分散は未知であるが、         を仮定できる場合) 情報学部男子学生の無作為標本30名の自宅学習時間/1日は平均30分、不偏分散100、女子学生40名の自宅学習時間は35分、不偏分散95であった。この結果から考えて、自宅学習の時間は男女で差がないと言えるだろうか?  有意水準5% 帰無仮説:情報学部男子学生と女子学生で自宅学習時間に差はない 対立仮説:情報学部男子学生と女子学生では自宅学習時間が異なる 帰無仮説が正しい場合の標本平均の差の分布    平均0万、分散σ2(1/30+1/40) の正規分布に近似。しかし分散は未知 不偏分散の推定 採択域の上限値 採択域の下限値 仮説は棄却される

2標本の平均値の差の検定 (母分散は未知であり、 を仮定できない場合) 2標本の平均値の差の検定 (母分散は未知であり、       を仮定できない場合) 検定の場面 2つの母集団の母平均の差に対する仮説を、それぞれの母集団からのn1、n2個の無作為標本から求めた標本平均値の差に基づいて検定する。 仮説の設定 帰無仮説 : 母平均の差はμ0である → μ0=μ1ーμ2  → 一般的には、μ0=0 対立仮説 : 母平均の差は、μ0ではない →  μ1ーμ2 ≠ 0 (両側検定)  帰無仮説が正しい場合の標本平均の差の分布 平均μ1-μ2、分散          の正規分布で近似できる 平均0、分散            の正規分布で近似できる しかし      は未知 母分散が等しくない場合、未知の2つの分散の値に無関係に利用できる統計量がないので、近似的な方法が工夫されている。

2標本の平均値の差の検定 (母分散は未知であり、 を仮定できない場合) 2標本の平均値の差の検定 (母分散は未知であり、       を仮定できない場合) 近似的な検定方法 母集団1:標本数n1、標本平均    、不偏分散     母集団2:標本数n2、標本平均    、不偏分散     帰無仮説が正しいとすれば 平均値の差の絶対値がT0.05以上の値をとる確率は5%以下である。 α=5%とすれば 帰無仮説が正しいとすれば、平均値の差がT0.05より大きな値をとることはめったにない もしそのような値が得られたとしたら 帰無仮説が誤っていたと判断する → 帰無仮説を棄却する

2標本の平均値の差の検定 (母分散は未知であり、 を仮定できない場合) 2標本の平均値の差の検定 (母分散は未知であり、       を仮定できない場合) 近似的な検定方法 情報学部男子学生の無作為標本30名の自宅学習時間/1日は平均30分、不偏分散140、女子学生40名の自宅学習時間は35分、不偏分散70であった。この結果から考えて、自宅学習の時間は男女で差がないと言えるだろうか?  有意水準5% 帰無仮説:情報学部男子学生と女子学生で自宅学習時間に差はない 対立仮説:情報学部男子学生と女子学生では自宅学習時間が異なる 帰無仮説は棄却できない

2標本の平均値の差の検定 : 2つの標本が対応している(独立でない)場合 2標本の平均値の差の検定 : 2つの標本が対応している(独立でない)場合 2つの標本が対応しているとは? 同一の調査対象(サンプル)に対する2つの測定値が、2つの標本を構成している場合  例) やせ薬の効果を、薬使用前後の体重を比較することによって調べる

差が意味を持たなければどのような検定となるか? 独立標本として扱うと ・・・ 使用後と使用前は、それぞれの平均値で比較する以外方法はない 帰無仮説「差がない」が正しいとすれば標本平均の差の分布は 平均:0 分散: の正規分布で近似できる。そのとき、得られた標本平均値の差-1.75(=73.374-75.125)はどの位置にあるか

差が意味を持てば(対応のある2標本として扱う)どのような検定ができるか? 差の分布を調べる やせ薬に効果が無いとすれば、差の分布の母平均は0となる 差の分布の母平均は0と言えるだろうか → 帰無仮説 :差の分布の母平均=0        → 「差」を1つの標本とする検定 帰無仮説「差がない」が正しいとすれば差の平均値の分布は 平均:0 分散: の正規分布で近似できる。そのとき、得られた差の標本平均値-1.75はどの位置にあるか