数理統計学 西 山
推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか 95 %信頼区間なら、概ね ±2 以内 68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ
区間推定のまとめ: 95%信頼 区間 母集団の分散が分らない場合は、不偏分散を使う サンプル数が 10 個未満なら、必ず T 分布の数値表を見て、 1.96 を修正しないといけない 標準誤差 1.96 を四捨五入して2としても、推定結果はほぼ同じ
練習問題 ある弁当屋で売っている幕の内弁当を 5 個買っ て、重量を測ったところ、以下のデータが得 られた。 718, 717, 722, 703, 714 (グラム) この幕の内弁当全体では、平均何グラムにし ているのだろうか?
【解答】 サンプル( 5 個)の結果をまとめると 全体の平均重量は、 ▲▲ グラムか ら〇〇グラムの範囲にある確率 が 95% である。 結論
【例題】 ○○ 率の推定 ある人気ドラマをみたかどうかを、 300 人のサンプルに対して質問したところ、 90 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
知りたいのは社会全体の視聴率で す 視聴率は30%だと、 いまわかった 社会全体のことは調べてませんか ら、 分かりません
▲▲ 率調査のデータはゼロイチ・データ 300 人のデータ [1] [35] [69] [103] [137] [171] [205] [239] [273] 0:みない、1:みた
▲▲ 率調査の標準誤差 母集団(=日本国内)で 30% で実験 1 万回のサンプリング実験 [1] > sd(jikken) [1] 不偏で標準誤差 0.026
母集団分布 ➡ 標準誤差が基本のロジック 定理8 値割合 母集団 サンプル 300 人の平均のサンプリング分布
ゼロイチ・データから分かること 問題への解答 点推定 誤差 標準誤差は 2.6 %位である 最大誤差 標準誤差の 2 倍まで考慮する(信頼係数 95% )
区間推定のまとめ: 95%信頼 区間 母集団の分散が分らない場合は 推定値を作って、代わりに使う サンプル数が 10 個未満なら、必ず T 分布の数値表を見て、 2 倍より大きな誤差を考える 標準誤差 正規分布で当てはめるなら 1.96 倍が厳密
練習問題 札幌地区在住者を対象に、ある人気ドラ マをみたかどうかを、 300 人のサンプル に対して質問したところ、 60 人の人が 「みた」と答えた。札幌圏では、何%程 度の人がこのドラマを見ただろうか。区 間推定をしなさい。 信頼係数は95%で答えてください。
解答のポイント サンプルの結果 標準誤差 母平均( μ )= 0.20±2× %信頼区間
(統計的)仮説検定 ある弁当屋で売っている幕の内弁当は、重さ が 720 グラム、標準偏差が 3 グラムであるよう に作られている。いま無作為に 5 個の弁当の重 さを測ると下のデータが得られた。 718, 717, 722, 703, 714 (グラム) おかしなところ、問題(ミス、手抜きなど)はないか?
実験が最近主流の方法 要するに『こんなサンプルは出るのか』を問う > mean(jikken2); sd(jikken2) [1] [1] > min(jikken2) [1] 万回サンプリン グをしても、平均 グラムとい う結果は出ない。 どこかおかしい! 誤差 前提: 母平均 µ = 720 、(母)標準偏差 σ = 3
R : 実験の手順 > rnorm(5,720,3) [1] > mean(rnorm(5,720,3)) [1] > jikken2 <- replicate(10000,mean(rnorm(5,720,3))) > hist(jikken2,main="",xlab="",ylab="",breaks="FD") > mean(jikken2); sd(jikken2) [1] [1] > min(jikken2) [1]
『仮説検定』のキーワード
今回の結論 正常な状態(平均 720 グラム、標準偏差 3 グラム) 帰無仮説 5 個のサンプルの平均 グラムは有意である 有意性( Significance ) 結論 サンプルによれば、製造には問題が発生している