仮説と検定.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

      仮説と検定

検定とは 推定とは 抽出した標本に基づき、未知の母数を予想する 検定とは 母平均に関する仮定を最初におき、母集団の性質を考える   抽出した標本に基づき、未知の母数を予想する 検定とは   母平均に関する仮定を最初におき、母集団の性質を考える 仮説に対し、確率という観点から数学的に正しいか否かを判断する

統計的仮説 統計的仮説  母集団の分布について何らかの仮定  H(hypothesis)で表す ※母集団の分布に対しての仮説を立てる必要がある 

仮説に対する真偽の判断基準 標本をもとに仮説が正しいか否かを判断する基準を危険率または有意水準という 仮説が正しいと判断 -> 採択 通常はαで表し、1%ないしは5%が用いられる ここでいうαとは仮定してる母集団内にある事象を  考え、その事象が起こる確率を意味している   仮説が正しいと判断   -> 採択   仮説が正しくないと判断 -> 棄却

例1 α=5%ではA村の畑で取れた大根ではないだろうという結論に至ったが、5%の確率でその判断が誤っていることも考えられる。 A村の畑でとれる大根の長さはほぼ図のような分布をしており、長さが70cm以上のものは5%、80cm以上のものは1%であるtことが知られている。いま、ある八百屋で大根を1本買ったら75cmであった。この大根がA村の畑で取れた大根であるかどうか? ここでの仮説 → 「この大根はA村の畑でとれた大根である」 α=5%ではA村の畑で取れた大根ではないだろうという結論に至ったが、5%の確率でその判断が誤っていることも考えられる。   逆を言えば、 95%の確率で結論が正しいということでもある

仮説の誤った判断 仮説から検定を行っても、誤って判断される可能性が考えられる 第1種・第2種の誤り ※H0は仮説 第1種の誤り  第1種の誤りを起こす確率は誤って棄却してしまった確率そのものである 第2種の誤り  第1種の起こる確率を危険率α以下としたとき、第2種の誤りが最小となるように最良棄却率Dを定める H0採択 H0棄却 H0正しい 正しい 第1種の誤り H0正しくない 第2種の誤り

仮説の真偽 推定も検定もともに母数集団予測に過ぎず、仮定が100%正しいとは言えない 仮説が採択されても、それだからといって仮説が正しいこととは一致しない

帰無仮説と対立仮説 仮説の立て方にも工夫を・・・ 帰無仮説 正しくないことを証明するほうははるかに楽 → 背理法に近い考え方 (反証) 正しいことを証明するのは難しいが、      正しくないことを証明するほうははるかに楽      → 背理法に近い考え方 (反証) 棄却されなければ意味がないという意味で帰無仮説と呼ぶ あえて自分が導き出したいことと逆のことを仮説とする 対立仮説   ある仮説に対しての別の仮説のこと  ※特に指定されない場合、帰無仮説で棄却されたものを採択する    ような形で対立仮説を立てている

仮説と検定 仮説の立て方に依存しているため、その点を考慮して検定を行う必要がある 例) 帰無仮説H0が「母平均μ=2.0」であったとき  対立仮説として「μ>2.0」とか「μ<2.0」とかおいた場合  → 片側検定 対立仮説として「μ≠2.0」( 「μ>2.0」かつ「μ<2.0」 )と置いた場合  → 両側検定

例題6.6 サイコロを400回振ったとき、224回偶数目がでた (1)このサイコロはまともなサイコロといえるか  (1)このサイコロはまともなサイコロといえるか  (2)このサイコロは偶数目がでやすいサイコロであるといえるか   を危険率5%および1%で検定せよ (1)、(2)ともに帰無仮説として、    H0:「サイコロはまともである(偶数の目の出る確率P=1/2)」として立てられる (1)帰無仮説に対する対立仮説としてH1:「P≠1/2」が立てられる (両側検定) (2)対立仮説としてH1:「P>1/2」が立てられる (片側検定) μ=np=200 σ=np(1-p)=400×1/2×(1-(1/2))=100=10   標準化変換Z=(X-μ)/σによって標準正規形として表す   X=224のときZ=(224-200)/10=2.4となる

例題6.6(2) 解法 両側検定 片側検定 棄却すべき範囲を両側から考慮する場合 棄却すべき範囲を片側から考慮する場合

母数の検定 母平均に関する検定 母分散に関する検定 2つの母集団の分散の比に関する検定 母分散が既知のとき 母分散が未知のとき 母分散が既知のときの2つの母集団の平均の差に関する検定 同じ未知の母分散をもつ2つの母集団の平均の差に関する検定

母平均に関する検定(母分散が既知のとき) 母集団から抽出した大きさnの標本からつくった標本平均Xをもとにして、   仮説H0:「母平均μ=○○」を検定する 命題5.1より母集団が正規分布に従うことが判っていたとき、そこから無作為抽出された標本はN(μ,σ /n)に従うため、(4.31)より標本標準化変換によって標準正規分布に従うことになる 標本平均から導き出された値をもとに、仮定した母平均に対する仮説の妥当性を求める 2

例題6.7 ある大学のバスケットボール部の男子部員25名の身長を調べたところ、平均172.7cmであった。同年代の全国の成年男子の身長の平均は170.8cm、標準偏差は5.7cmの正規分布に従っているとして、バスケットボール部員の身長の平均が全国平均とくらべてかけはなれているかどうか、危険率5%で検定せよ 式 Z=√(X-μ)/αに代入  Z=√ (172.7-170.8)/5.7=1.67 附表2を参考にZ=1.67<1.96であるので、採択域にあるため  H0は棄却できない n 25

母平均に関する検定(母分散が未知のとき) 2 標本平均X、標本分散S をもとにして、仮説H0:「母平均=○○」を検定する 母集団のばらつきが分からないため、標本平均だけでなく、標本分散の値を参考に考える  定理5-7を使うとF分布による検定 → F検定  定理5-9を使うとt分布による検定  → t検定

t分布 一般にN(μ,σ ) における標本平均において、√n(X-μ)/σは N(0,1) に従うため、母分散が分かっている場合、母平均の推定が可能 しかし、母分散が未知のとき、標本分散Sを利用して考えると√n(X-μ)/Sは正規分布に従ってくれない そこで色々とごちゃごちゃ計算(?)する仮定で母分散σの値が消され、標本分散Sで正規分布とはいえないまでもそれらしい分布(=t分布)として表すことができる 標準正規分布とt分布の違いは、その定義の中で母数を使うか不偏推定値をつかうかというだけのこと 正規分布が平均値と分散によって関数が変わるのと似た感じでt分布では自由度によって形が違ってくる 自由度が大きくなるにつれ標準正規分布に近づく 分布としては正規分布と比べすそが広くなっている

t検定 2群の平均の値に差があるかどうかの検定 3つ以上の平均の相違を考える場合は分散分析を利用 大きさnの標本から計算したT=√ (X-μ)/Sは自由度n-1のt分布に従う ここからは今まで通り、Tの値がt分布において棄却域にあるのか否かを判断し、母平均に対する仮説の真偽を考える n-1

例題6.8 ラグビーのスパイクシューズにつけるポイントの高さはT社の規格では、17.00mmとなっている。T社製の15個のポイントの高さを測ったところ、平均16.94mm、標準偏差0.10mmであった。この標本平均は規格からずれているかどうか、危険率5%で検定せよ 帰無仮説を H0:「μ=17.00」 とおく   ※対立仮説は特に示されていないので帰無仮説の否定形 ( 両側検定 ) X=16.94 μ=17.00 S=0.10 n=15を  式 T=√ (X-μ)/S に代入 T=√ (16.94-17.00)/0.10=-2.24 ポイントは規格にあっているとはいえない n-1 14

母分散に関する検定 標本分散S をもとにして、 仮説H0:「母分散=○○」を検定する 2 標本分散S をもとにして、 仮説H0:「母分散=○○」を検定する 命題5-4より、正規母集団から無作為抽出された標本の標本分散の値と母分散との関係は Z=nS /σで表され、自由度n-1のχ 分布に従う χ 分布において母分散の検定を行うには   χ 検定を用いる 2 2 2 2 2

χ2分布 理想値と実際の観測値のズレを計算 普通に計算したのでは±でチャラになることも・・ 大雑把な説明だけど、(理想値-観測値) の分布図 大雑把な説明だけど、(理想値-観測値) の分布図 χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」 母分散が既知の時に正規分布する母集団について,そこから抽出した標本の分散がどのような分布を示すかを表す 2

χ2検定 標本で見られた相違が母集団においても同様の相違として見られるかについて推測する検定

例題6.9 例題6.8のポイントについて、T社の規格では、標準偏差0.08mmより小さいとしている。標本のポイントの標準偏差はこの規格からずれているかどうか、危険率1%で検定せよ 帰無仮説を H0:「σ =(0.08) 」 とおく  この問題では対立仮説を「σ >(0.08) 」とおく (片側検定)  S=0.1 σ=0.08 n=15 を代入すると  Z=15×(0.1) /(0.08) =23.4 となる よって、このポイントは規格から ずれているとは言えない 2 2 2 2 2 2

2つの分散の比に関する検定 2つの正規母集団から抽出した標本分散をもとに 仮説H0:「2つの母集団の母分散は等しい」 (σx=σy)  定理5-6   大きさm 標本分散Sx   大きさn  標本分散Sy のとき  命題5-6より、母分散の等しい2つの正規母集団から、大きさが  それぞれm,nの標本を無作為抽出すると は自由度(m-1,n-1)のF分布に従う  F分布であるのでF検定を行う 2 2

F分布 正規分布する母集団から無作為抽出された2つの標本の分散の比に関する分布を示す

F検定 等分散検定 F検定では必ず両側検定をおこなう。なぜなら、どちらの分散が大きいかは決めようがないから

例題6.10 仮説H0:「2つの母分散は等しい」とおく m=31 Sx=29 n=11 Sy=24 のとき

母分散が既知のとき2つの母集団の平均の差に関する検定 2つの母集団の平均の差に関する検定を行う   大きさmの標本での標本平均をX   大きさnの標本での標本平均をY とおいたとき   それぞれの母集団の母平均をμx,μyとして   正規分布の重ね合わせの性質を使い、標準化平均を施した後、   検定を行う   帰無仮説 H0:「μx-μy=○○」 とおく  ※大抵の場合○○は0として考え対立仮説にはμx≠μyが立てられる

例題6.11 帰無仮説として H0:「μx=μy」とおく  X=2001 Y=1987 μx-μy=0 σx=20 σy=15 m=n=50 を代入  Z=(2001-1987)/√(20)2/50+(15)2/50=3.96   2つの機械で詰められた薬の内容量の   平均は等しいとは言えない

同じ未知の母分散をもつ2つの母集団の平均の差に関する検定 未知ではあるが、母分散の値は同じであることは分かっている 母分散は分からないので、分布の状態が分からない この母集団の平均を求めるために、命題5-10を利用する 命題5-10   母分散の等しい2つの正規分布N(μx、σ)、N(μy、σ)に従う母集団から、それぞれ大きさm、nの標本を無作為抽出し標本平均X、Y、標本分散Sx、Syをつくると   は自由度m+n-2のt分布に従う t分布に従う分布の検定はt検定によって行う

例題6.12 例題6.12で2つ母集団の母分散が等しいか否かについて検定を行った 例題の結果より、2つの母集団の母分散が等しいと仮定して検定   例題の結果より、2つの母集団の母分散が等しいと仮定して検定 違反前と違反後の母平均をμx、μyとする 帰無仮説 H0:「μx=μy」 対立仮説 H1:「μx<μy」 X=263 Y =286 μx-μy=0 m=31 n=11 Sx=29 Sy=24 を代入 自由度31+11-2=40   所要時間は長くなったといえる

まとめっぽい 検定の種別は元になる値の「分布」により選択する 検定する値が「平均値」などの代表値か「残差」などの外れ値かにより選択する つまり適当に検定してはいけませんよということ

N(μ,σ2)にしたがうものを無作為抽出する 統計的に有意な差があるか否かを調べる t検定   → 2群の平均の差を考える際、相違    があるか否かを検定 χ2検定 →  データのばらつき具合が適切で あるかどうかを判定する F検定   → 分散に差があるのかどうかを判        定