数理統計学 西 山
【まとめ】<ルートNの法則>とは? N個のサンプルをとると 合計値 平均値 1個ずつにわけてデータの特徴を確認すると、平均がμ、標準偏差がσ 正規分布を当てはめる! << 中心極限定理(データは30~100個以上が目安)
練習問題【1】 簡単のため11人満員の時の状況だけを考える 2号館に設置されているエレベーターの定員は11名であり、最大積載量は750Kgと明示されている。定員一杯のとき、平均68.2Kgだと「乗れない!」ということになる。そんなことがあるのか?統計上の観点にたって、考えるところを自由に述べなさい。 但し、上のエレベータに乗るかもしれない人たち(=母集団)の体重分布は、N(55,225)としておく。 簡単のため11人満員の時の状況だけを考える
【解答】 合計値の分析=平均値の分析 3シグマで最大値を予測しておけばよい。ないし、4シグマ。
練習問題【2】 100営業日後に200ドルを割る可能性は考慮しておくべきでしょうか? 下図はIBMの株価を1961年5月からから62年11月まで記録したものです。 (出所)Box, Jenkins, Reinsel,”Time Series Analysis” 100営業日後に200ドルを割る可能性は考慮しておくべきでしょうか?
練習問題 【3】 ある番組の視聴率は社会全体で30%である。ランダムに100人をとって「見た=1」、「見なかった=0」を聞くとします。設問に答えなさい。 データの合計値は何を表しますか? 合計値の確率分布の特徴を答えなさい。 100人の視聴率について期待値と標準偏差を答えなさい。
考え方の基本 30人はみて、70人は見ていないと回答する 視聴率は、サンプル平均値です!
今回の標本分布 0、1サンプルの母集団は? 0,1, 1, 0, 1,0,1, …. 1 ,1, 0, 0,0, …. 0,1, 1,0 1,1, ….
母集団の分布を確認します
解答 個別の値は 100人
反復実験してみると 100個の0‐1データの平均値は? この反復結果は理論どおり? 3000回データ抽出を反復しました. 最大値: 0.45 最大値: 0.45 最小値: 0.15 平均: 0.3002 分散: 2.037346e-03 標準偏差: 0.0451 サンプル誤差 この反復結果は理論どおり?
サンプルの結果のばらつきを調べてください 【3】の類題 視聴率、新聞社の行う○○支持率調査などは、概ね1000人前後のランダム・サンプル(=無作為標本)を対象にしています。調査結果に含まれる誤差はどの程度でしょう? とりあえず1000人、 社会全体の支持率等は50%として、 サンプルの結果のばらつきを調べてください
母集団はこうなっています 母集団のμとσ2はいくら?
母集団では50%の場合 ほぼ確実に、結果は47%から53%の範囲にはおさまる。 サンプル(=標本)誤差は、確率95%で3%だ。 授業はここまで 5/31 ほぼ確実に、結果は47%から53%の範囲にはおさまる。 サンプル(=標本)誤差は、確率95%で3%だ。
練習問題【4】 誤差を小さくしたい 何人かの人を無作為に選び、現在の内閣を支持するか、支持しないかを聞き、日本全体の内閣支持率を調べる。通常含まれる誤差は、1%以内としたい。最低、何人の人をアンケート対象に含めるべきか?
練習問題【4】の解答・・・未知数N 社会全体の支持率を50% と仮定すると アンケート対象を N人として
【2】の解答・・・Nを求める
50%以外の場合 いま社会全体の比率を50%でやった。 それ以外の比率を仮定するとσが小さい 2500人も必要ない 答えは2500人以上