数理統計学 西 山
前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する 点推定
点推定と区間推定 区間推定は、 ここをどれだけ広くとるか 誤差を評価しない推定を点推定といいま す 標準誤差 ここまで 6 / 16
練習問題【1】 ある高校の 1 年生からランダムに20名を 選んで 100 メートル走の記録をとると、 だった。学年全体の平均について推定 しなさい。但し、信頼係数は95 % と する。
練習問題【1】の解答
推定には手順がある 信頼係数を決める 標準誤差を求める=標準偏差 「ルートNの公式」 標準値で区間をつくる 95 %信頼区間なら、 ±2 以内 標準値の定義式で置き換える 未知数 μ の区間に変形する 教科書: 151 ~ 156 ペー ジ
区間推定のまとめ: 95%信頼 区間 母集団の分散が分らない場合は、不偏分散を求めて、代わりに使 う サンプル数が 10 個未満なら、必ず T 分布の数値表を見て、 1.96 を修正しないといけない 標準誤差 1.96 を四捨五入して2としても、推定結果はほぼ同じです
【例題】 ○○ 率の推定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。 この例題は あとまわし 6 / 21
知りたいのは社会全体の視聴率で す 視聴率は 40 %だと、 いまわかったじゃない 社会全体のことは調べてませんか ら、 分かりません
ゼロイチ母集団の特徴 みた → 1 みない → 0 社会全体では 30%(= 0.30 )が みた 本当の視聴率は 母平均( μ )のこと
1の確率を未知数 P として 平均 分散
100 人サンプルの視聴率 はこうなる( 30% の場 合)
サンプル平均と標準誤差を求めよ! サンプル平均 標準誤差 母平均( μ )= 0.40±2× %信頼区間
練習問題【2】 札幌地区在住者を対象に、ある人気ドラ マをみたかどうかを、 300 人のサンプル に対して質問したところ、 60 人の人が 「みた」と答えた。札幌圏では、何%程 度の人がこのドラマを見ただろうか。区 間推定をしなさい。 信頼係数は95%で答えてください。
解答のポイント サンプル平均 標準誤差 母平均( μ )= 0.20±2× %信頼区間
今までのポイント 母平均( μ )の区間推定 標準誤差が決め手。元の母集団の 分散 σ 2 はわからない。不偏推定を母 分散のつもりで使う。 正規分布の性質から標準値で割り切 る。 95 %信頼区間なら Z が ± 2以内 → 誤差は標準誤差の 2 倍まで
不偏分散は正しくはない! 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 正規分布 カイ二乗 分布 不偏分散を使っていますが
T 値の定義 サンプルから求めた不偏分散を、 母集団の分散の代わりに使う 母集団の σ 2 に近ければ 大したことではない データ数が十分多け ればよい Gosset, W. S 年にペンネーム Student で T 分布の存在を発見しました
T値のポイント: Zより大きめ に! とにかく細かい話 平均= 170 センチ 標準偏差= 10 センチ サンプル 5 人 170
正規分布 ÷ カイ二乗 →T 分布 T 分布は正規分布とカイ二乗分布 の子どもです。フィッシャーが 1920 年までに数学的基礎を与え ました。 Fisher, R.A. T の値は自由度kの T 分布 フィッシャーの公式
T 値のイメージ 標準値(正規分布) カイ二乗値(自由度4 ) 自由度は4
T 値とT分布 ① ②
T 分布の特徴 ± 2以内とはいえな い 5個のサンプル=自由度 4
T 値の95%区間、90%区間 これは自由度( n - 1) 95%圏 90%圏
練習問題 【3】 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は 95 %とする。 しばらくの間、不偏分散が学 年全体の分散に一致している と、前提します この問題のイ ントロまで 6 / 21
ヒント: まず下の形で答えて下さ い 自由度は、データ数-1
例題【1】の 解答 自由度は、 5 ー1=4 ← 違いはここだけ