数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学  第9回 西山.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
行動計量分析 Behavioral Analysis
数理統計学  第8回 西山.
母集団平均値の区間推定 大標本の区間推定 小標本の区間推定.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
数理統計学  第6回 西山.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

数理統計学 西 山

推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ

区間推定のまとめ: 95%信頼 区間 母集団の分散が分らない場合は、不偏分散を使う サンプル数が 10 個未満なら、必ず T 分布の数値表を見て、 1.96 を修正しないといけない 標準誤差 1.96 を四捨五入して2としても、推定結果はほぼ同じ

練習問題 ある弁当屋で売っている幕の内弁当を 5 個買っ て、重量を測ったところ、以下のデータが得 られた。 718, 717, 722, 703, 714 (グラム) この幕の内弁当全体では、平均何グラムにし ているのだろうか?

【解答】 サンプル( 5 個)の結果をまとめると 全体の平均重量は、 ▲▲ グラムか ら〇〇グラムの範囲にある確率 が 95% である。 結論

【例題】 ○○ 率の推定 ある人気ドラマをみたかどうかを、 300 人のサンプルに対して質問したところ、 90 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。

知りたいのは社会全体の視聴率で す 視聴率は30%だと、 いまわかった 社会全体のことは調べてませんか ら、 分かりません

▲▲ 率調査のデータはゼロイチ・データ 300 人のデータ [1] [35] [69] [103] [137] [171] [205] [239] [273] 0:みない、1:みた

▲▲ 率調査の標準誤差 母集団(=日本国内)で 30% で実験 1 万回のサンプリング実験 [1] > sd(jikken) [1] 不偏で標準誤差 0.026

母集団分布 ➡ 標準誤差が基本のロジック 定理8 値割合 母集団 サンプル 300 人の平均のサンプリング分布

ゼロイチ・データから分かること 問題への解答 点推定 誤差 標準誤差は 2.6 %位である 最大誤差 標準誤差の 2 倍まで考慮する(信頼係数 95% )

区間推定のまとめ: 95%信頼 区間 母集団の分散が分らない場合は 推定値を作って、代わりに使う サンプル数が 10 個未満なら、必ず T 分布の数値表を見て、 2 倍より大きな誤差を考える 標準誤差 正規分布で当てはめるなら 1.96 倍が厳密

練習問題 札幌地区在住者を対象に、ある人気ドラ マをみたかどうかを、 300 人のサンプル に対して質問したところ、 60 人の人が 「みた」と答えた。札幌圏では、何%程 度の人がこのドラマを見ただろうか。区 間推定をしなさい。 信頼係数は95%で答えてください。

解答のポイント サンプルの結果 標準誤差 母平均( μ )= 0.20±2× %信頼区間

(統計的)仮説検定 ある弁当屋で売っている幕の内弁当は、重さ が 720 グラム、標準偏差が 3 グラムであるよう に作られている。いま無作為に 5 個の弁当の重 さを測ると下のデータが得られた。 718, 717, 722, 703, 714 (グラム) おかしなところ、問題(ミス、手抜きなど)はないか?

実験が最近主流の方法 要するに『こんなサンプルは出るのか』を問う > mean(jikken2); sd(jikken2) [1] [1] > min(jikken2) [1] 万回サンプリン グをしても、平均 グラムとい う結果は出ない。 どこかおかしい! 誤差 前提: 母平均 µ = 720 、(母)標準偏差 σ = 3

R : 実験の手順 > rnorm(5,720,3) [1] > mean(rnorm(5,720,3)) [1] > jikken2 <- replicate(10000,mean(rnorm(5,720,3))) > hist(jikken2,main="",xlab="",ylab="",breaks="FD") > mean(jikken2); sd(jikken2) [1] [1] > min(jikken2) [1]

『仮説検定』のキーワード

今回の結論 正常な状態(平均 720 グラム、標準偏差 3 グラム) 帰無仮説 5 個のサンプルの平均 グラムは有意である 有意性( Significance ) 結論 サンプルによれば、製造には問題が発生している