統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
頻度の分析 頻度データ 着果率,発芽率,生存率 離散量と離散量の比率である 頻度データに相当しないパーセント表記 のデータ 糖度,含水率 連続量と連続量の比率である.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
第4章 統計的検定 統計学 2007年度.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2009年 2009年11月26日(木).
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定: 例: 視聴率調査を200人に対して行い,番組Aの視聴率を推定した 検定: 統計的に標本の統計量から母集団の母数に関する予測の真偽を検証することを統計的検定という 例: 視聴率調査を200人に対して行い,番組Aの視聴率が20%以上あるかを検定した 教材「生物統計学_統計的検定とは?2013」を予習しながら空所を埋めていきましょう.前回の授業で統計的推定と統計的検定の2つの違いを学びました. 統計的推定とは統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定といいます. 例えば,視聴率調査を200人に対して行い,番組Aの視聴率を推定しました.このように標本の視聴率から,母集団の視聴率を推定します. 統計的検定とは統計的に標本の統計量から母集団の母数に関する予測の真偽を検証することを統計的検定といいます. 例えば,視聴率調査を200人に対して行い,番組Aの視聴率が20%以上あるかを検定しました 別の例として,A社とB社の車の排気ガスに含まれる窒素酸化物はA社の方が多いのかを検定しました このように検定は標本から得られた統計量から判断を下す場合によく利用されます.研究では仮説を立てて,得られたデータから仮説が正しいかを証明することが多いので,統計的推定もよく使いますし,統計的検定もよく使います. 例: A社とB社の車の排気ガスに含まれる窒素酸化物はA社の方が多いのかを検定した

統計的検定 例1 あるメーカーではさいころを作っており,5回振って出た目をチェックして正確なさいころであるかをチェックしている.あるさいころを5回振ったところ,5回とも奇数だった.二項分布から5回とも奇数になる確率は1/32(=0.03125)である.このような低い確率が出ることから,さいころは奇数と偶数が同じ確率で出ると考えるよりも,奇数が出やすいと結論し,そのさいころは不良品と判断した. さいころの目について,奇数と偶数が出る確率が同じであるかないかを推測している 今回は統計的検定の実際のやり方について学びます.検定はちょっとわかりにくいところがあります.ちょっとひねくれた発想が使われるので,これからの説明をじっくり聞いて,考えていきましょう. 例として,あるメーカーではさいころを作っており,5回振って出た目をチェックして正確なさいころであるかをチェックしています.あるさいころを5回振ったところ,5回とも奇数でした.二項分布から5回とも奇数になる確率は1/32(=0.03125)です.このような低い確率が出ることから,さいころは奇数と偶数が同じ確率で出ると考えるよりも,奇数が出やすいと結論し,そのさいころは不良品と判断しました. この例では,このさいころの目について,奇数と偶数が出る確率が同じであるかないかを推測しています.つまりyesかnoかという判定なので,これは検定です.ここでは,統計的に標本の統計量(つまりさいころを振ると5回とも奇数だった)から母集団の母数(さいころは奇数と偶数は同じ確率で出現する)に関する予測の真偽を検証しています.これを統計的検定といいます. 統計的に標本の統計量から母集団の母数に関する予測の真偽を検証することを統計的検定という

統計的検定 例2 同じM寸の卵でありながら,スーパーSはスーパーKよりも軽い卵を売っていると考え,両店の10個の卵についてそれぞれ調査したところ,スーパーSの卵は平均20g,標準偏差0.5g,スーパーKの卵は平均22g,標準偏差0.5gだった.したがって,スーパーSの卵の重さは信頼率95%で20±0.31gであり,スーパーKの卵の重さは22±0.31gである.2つの信頼区間は重ならないから両店の卵の重さの母平均は違うと結論づけた 2つめの例です. 同じM寸の卵でありながら,スーパーSはスーパーKよりも軽い卵を売っていると考え,両店の10個の卵についてそれぞれ調査したところ,スーパーSの卵は平均20g,標準偏差0.5g,スーパーKの卵は平均22g,標準偏差0.5gでした.したがって,スーパーSの卵の重さは信頼率95%で20±0.31gであり,スーパーKの卵の重さは22±0.31gである.2つの信頼区間は重ならないから両店の卵の重さの母平均は違うと結論づけました.これも実際の卵を調べたデータを使って両店の卵の重さの母平均が同じであるかが正しいか間違っているかを調べるので,統計的検定です.

検定の手順 1.帰無仮説の設定 統計的検定によって否定したい仮説を立てる.これを帰無仮説という. 例1 このさいころは奇数と偶数が同じ確率0.5で出る 例2 スーパー2店の卵の重さ(の母平均)が同じである では実際の検定の手順を説明します.まず帰無仮説というものを設定します.統計的検定によって否定したい仮説を立てます.これを帰無仮説といいます.例1では「さいころは奇数と偶数が同じ確率(0.5)で出る」,例2では「スーパー2店の卵の重さが同じである」というのが帰無仮説に相当します.そして,帰無仮説に従えば,実際に得られたデータの出現する確率はいくらかを求め,その確率がきわめて低い(必要に応じて,基準となる確率は検定前に設定します)ならば,帰無仮説が間違っているとし,対立仮説が正しいとするのが統計的検定です.なんだかわけがわかりませんが,統計的検定を最初の説明で理解できる人はまずいないので,とりあえず先へ進んでいきましょう.

検定の手順 2.対立仮説の設定 帰無仮説が間違っていると判断した場合に採用する仮説 例1 このさいころは奇数と偶数が同じ確率で出ない 例1 このさいころは奇数と偶数が同じ確率で出ない このさいころは奇数の方が偶数より出やすい 例2 スーパー2店の卵の重さは異なる 次に帰無仮説が間違っていると判断した場合に採用する仮説である対立仮説を立てます. では,対立仮説は例1,2ではどうなるでしょうか?例1では,帰無仮説は「さいころは奇数と偶数が同じ確率(0.5)で出る」ですから,それを否定して,この場合の対立仮説は「さいころは奇数と偶数が同じ確率(0.5)で出ない」が対立仮説です.この対立仮説が成り立てば,実質的にはこのさいころは奇数の方が偶数より出やすいということになります.なぜなら対立仮説が成り立てば,さいころは奇数と偶数のどちらかが出やすいということになります.5回とも奇数が出たさいころですから,偶数が出やすいことはまず考えられないからです. 同じように例2の場合,対立仮説は「スーパー2店の卵の重さは異なる」となります.この対立仮説が成り立てば,実質的には「スーパーSの卵の方がスーパーKの卵より軽い」といえます. スーパーSの卵の方がスーパーKの卵より軽い.

検定の手順 3.帰無仮説が成り立つとしたら,今回得たデータが出現する 確率を求める この確率のことを有意確率あるいはp-値と呼ぶ   これを帰無仮説を棄却するという 次に帰無仮説が成り立つとしたら,今回の調査で得られたデータが出現する確率を計算します.この確率のことを有意確率あるいはp値(ぴーち)といいます.p値の計算は難しいのでほとんどの場合,コンピューターで計算するしかありません.所定の形式でデータを入力し,必要な手続きをとればp値が計算できる統計ソフトが最近はたくさんありますので,それを利用することがほとんどです. 次にp値が得られたら,判定を行います.p-値があまりに小さいと,帰無仮説が正しいと考えるより間違いであると判断します.このときの判定基準を有意水準といいます.つまりp値が意味するのは,帰無仮説が成り立つとすると今回のデータが得られる確率ですから,この確率が小さすぎれば,むしろ帰無仮説が成り立つと考えるのは不自然だと考えるのです.ここが統計的検定のもっとも重要なところです.ちょっとわかりにくいですが,じっくり考えてください.わからなくてもとりあえず前に進みましょう.帰無仮説を間違いであると判断することを「帰無仮説を棄却する」といいます.判定基準となる有意水準としては,0.05(5%),0.01(1%),0.001(0.1%)がよく選ばれます. p-値<0.05(5%),0.01(1%),0.001(0.1%)

検定の手順 5.帰無仮説が成り立たないと判断したときは対立仮説を採用する. 有意差がある: 帰無仮説を棄却できるだけの反証がえられた 有意差がある: 帰無仮説を棄却できるだけの反証がえられた 5(あるいは1 or 0.1)%の有意水準で有意差がある 帰無仮説を棄却したとき,すなわち帰無仮説が成り立たないと判断したときは対立仮説を採用します.その場合の結論は対立仮説をそのまま使えばよいです. よく論文などで,有意差がある(英語ではsignificantといいます,ときどき学生が論文を訳すと,重大だとか意味があると訳しますが,論文のデータに関して,significantという場合はほぼ間違いなく,統計的に有意である,統計的に有意差があるという意味です) 有意差があるとは,今回のデータで,帰無仮説を棄却できるだけの反証がえられたという意味です. 有意差があると記述する場合,いかなる基準でp値から判定したかを示す必要がありますので,5(あるいは1 or 0.1)%の有意水準で有意差があるというのがふつうです.有意水準を示さないで,単に「有意差がある」というのはほんとうはよくはありません.

検定の手順 6.帰無仮説を棄却できないときは,有意差がないことになり,対立仮説を採用するだけの証拠がないことになる 5, 1, 0.1%の有意水準で差があるとはいえないと結論する 帰無仮説を棄却できないときは,帰無仮説を採用するのではなく,帰無仮説を棄却できるだけの証拠が不十分と考え,対立仮説の否定を採用する それでは帰無仮説を棄却できなかったときはどうなるでしょうか?帰無仮説を棄却できないときは,有意差がないことになり,対立仮説を採用するだけの証拠がないことになります.このように帰無仮説が棄却できないときは,帰無仮説を採用するのではなく,帰無仮説を棄却できるだけの証拠が不十分と考えます.この場合,採用するのは対立仮説の否定です.ここもちょっとわかりにくいとおもいます.わからなければとりあえずは先へ進んで,次の予習課題の実例をみてからもういちど,ここを勉強するのもよいでしょう. さて,対立仮説を証明したいのに,帰無仮説のようなものを持ち出すのはまどろっこしく感じるかもしれません.この統計的検定は,数学で学んだ「背理法」に似ています.実は統計的にできるのは帰無仮説の否定だけなのです.その理由は以下の2つです. ★ 「甲は乙より早い」といっても,どのくらい速いのか,甲が乙に勝つ確率はいくらなのか,がはっきりしません.すなわち計算できません.これを明確に規定し,計算できなければ,数量的に取り扱えません. ★ 仮に,仮説を数量的に規定できても,それが真実であることを統計的には証明できません.つまり確率的に非常に小さいことが起きた,だからむしろ仮説が誤りであるという,背理法にに似た方法を使うしか証明しようがないのです.統計的にできることは,仮説に対する「反証」を提示することだけなのです. なにもわからなかったということになる(だから帰無仮説という)