確率と統計2010 2010年12月16日(木) Version 3.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
確率と統計 2007 平成 20 年 1 月 10 日 ( 木 ) 東京工科大学 亀田弘之. 復習.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学  第9回 西山.
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
統計解析 第10回 12章 標本抽出、13章 標本分布.
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計2008 平成20年12月4日(木) 東京工科大学 亀田弘之.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2009年 2009年11月26日(木).
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
数理統計学  第12回 西 山.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

確率と統計2010 2010年12月16日(木) Version 3

今日も検定、検定また検定

PROBLEM 全国10歳の女子の身長は、平均μ=140cm、標準偏差 σ=5cmの正規分布に従うことが知られている。いま、あ る地域に住む10歳の女子25名の身長を調べたところ、 平均m=137cmであった。この地域の女子の身長は全 国水準と比べてどうか?

平均μ = 140cm 標準偏差σ = 5cm 平均μ = 137cm 標準偏差

平均μ = 140cm 標準偏差σ = 5cm 平均m = 137cm 標準偏差 標本平均 m = 140cm 標準偏差σX = σ/√n

仮説H0:その地域に関するデータは、全国データの標本で        ある。 定理:N(μ=140, σ2=25)から得られる標本に関して、     標本平均の平均はN( μ, σ2 / n ) に従う。 事実(調査結果): 標本の平均m=137cm。 分析: N( μ, σ2 / n ) = N( 140, 52/ 25 ) = N( 140, 1 ) に     おいて、平均値mが137cm以下か143以上になる     確率Pを計算する(両側検定)。 判断基準:有意水準を5%とする。 計算(標準化):     Z = ( m - μ) / (σ / √n) = -3 および正規分布表より、     P = 0.0027 < 0.05 仮説H0を棄却する。 結論:有意水準5%でその地域の女子の身長は 全国平均よりも低い。

データ分析の練習をしてみよう!

PROBLEM あるガン性疾患Xの疑いのある患者60名のうち、最終的 にガンXの診断が確定した者は20名であった。いま、全 症例についてその血液型を調べ、A型の人数を数えた ところ以下のようになった。ガンXの患者ではA型の人が 多いと言えるか?考察せよ。 ガン陽性(+) ガン陰性(-)  合 計 A   + 型   - 15  5 25 30  合 計 20 40 60

考察 2行2列の表になっているので、2×2分割表の検定法 を適用する。

PROBLEM 前立腺ガンの患者150名をランダムに2群に分け、A,B 2種類の方法で治療を試みた。一定期間後、両群の生 存・死亡数を比較したところ以下のようになった。治療法 により生存率が異なると言えるか? 治療法A 治療法B 合計 生存者数 死亡者数 55 20 35 40 90 60 75 150

PROBLEM  シャープペンシル用の芯を作っている工場において、 製造した芯の太さの平均値μ(母平均)が0.90mmにな るようにしないと、シャープペンシルに合わない芯が出 て顧客から苦情が来るため、母平均が0.90mmではな くなったときは機械を止めて調整することにしている。  母平均が0.90mmかどうかは、毎日製造される芯の中 から、無作為に100本を取り出して、その太さを測りその 平均値mを計算することで調べている。いまmを求めた ら0.91mmであり、また、標準偏差s=0.03mmであった。 この場合あなたはどういう判断を下しますか? (機械を止めて調整する? まだしない?)

考察 条件設定: 分かっているもの: 母平均μ 標本平均m 標本の大きさn 分かっていないもの: 母標準偏差σ

数学的事実 標本平均Xは、標本の大きさが十分大きければ、 N( μ, σ2/n ) に従う。 従って、Z=(X-μ) / ( σ /√n ) は、N(0, 1) に従う。 【疑問】 この定理が利用できるためには、母平均と母標準偏差 がともに分かっていなければならない。 しかしながら、今の場合には分かっていない! どうすればいいのか?

新たな事実 標本の大きさnが十分大きければ、s≒σ とおける。

考察(続き) 有意水準1%とすると、 |Z0| > 2.576 だから、母平均は0.90mmではない。 機械を止めて調整しよう!

PROBLEM (平均値の差の検定) A社とB社の食料品を、それぞれ無作為に100個ずつ 取り出して、その濃度を測定したところ、ma=45.36%, sa=0.35%, mb=45.24%, sb=0.40% であった。 両社の製品に関する濃度の母平均には差があるだろう か? 統計的に検討しなさい。

仮説H:2つの母平均には差がない。μa = μb。 ma=45.36, mb=45.24, sa=0.35=σa, sb=0.40=σb, na=nb |z0|>1.96だから、有意水準5%でHは棄却。 (A社の方がB社のものより濃度が高い。)

根拠 2つの標本の元の分布が正規分布ならば、 ma-mbの分布もまた正規分布で、 N(μa-μb, σa2/na + σb2 /nb) になる。 また、nが十分大きければ元の分布が正規分布でなくて も、中心極限定理により正規分布とみなしてよい。

(重要) 統計学で重要な定理の紹介 これ以外にもチェビシェフの不等式なども重要な事実 (定理)です。

定理1 x が正規分布 N(μ,σ2) に従うとき、大きさ n の無作為 標本に基づく標本平均 mは、正規分布 N(μ、σ2/n) に従う。 (xの標本分布に関する定理)

定理2(重要) xが任意の分布(平均=μ,分散=σ2)に従うとき、大きさ n の無作為標本に基づく標本平均 m は、 n が無限に 大きくなるとき、正規分布 N(μ、σ2/n) に従う。 (中心極限定理)

問題1 ある学力テストの得点Xは、正規分布N(160,202) に従うとする。いま、大きさ16の標本をとり、その標本 の平均値mの値を求めるとき、 mが165を超える確率は? mが150未満となる確率は?

中心極限定理の利用法 問題1.      ある大学の受験生の母集団から無作為に 選んだ1人の受験生の成績を x とする。 いま、過去の経験から、 x は平均 μ= 2.5, 標準偏差 σ = 0.4 であることがわかっているも のする。 このとき、この母集団から 36人の受験生の 標本を採り、標本平均 m を求めるとき、 mが2.4未満となる確率は? mが2.4~2.7となる確率は?

落ち着いて考えよう。 問題1のヒント 中心極限定理より s=σ/√n =0.4/√36 z=(x-m)/s =(2.4-25)・0.067= s=σ/√n =0.4/√36 z=(x-m)/s =(2.4-25)・0.067= P{m<2.4} =P{z<-1.50}= (標準正規分布表を利用) 落ち着いて考えよう。

レポートとアンケート 「レポートNo.3」の提出日は、 平成23年1月14日(木)17時です。 提出先は研A6階レポートボックスです。 授業評価アンケートを1月6日に実施します。   それではよいお歳を!  Happy New Year!