市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集 データ入力、データ分析 報告書の作成
問題の設定 対象とする母集団は? 全数調査か、標本調査か どの様に標本を抽出すべきか 抽出方法 標本数 抽出された標本の質をどの様に保証するか
マーケティング・リサーチ 標本デザイン2 (標本数の決定)
単純無作為抽出を行う場合 では一体、標本数をいくつにすれば良いのか? その為にまず、精度についてちゃんと考えてみる 小 大 標本数 低 高 少 多 費用 では一体、標本数をいくつにすれば良いのか? その為にまず、精度についてちゃんと考えてみる
例1 意思決定問題 リサーチ問題 母集団 スポーツ産業のマーケティング政策立案 大学生は年平均何回位スポーツ観戦に行くのか? 日本国内の大学生全員
例2 例1の母集団を、「ある大学生5人」に限定する 大学生 A B C D E 回数 1 4 5
母集団の分布(ヒストグラム)
平均(mean, expectation)
記号を用いた平均の定義 N :データの数 xn :n 番目のデータ とするとき
標本数が2の場合 (A,B) (A,C) (A,D) (A,E) (B,C) (B,D) (B,E) (C,D) (C,E) (D,E) 2.5 1.0 3.0 4.0 4.5
標本数が3の場合 (A,B,C) (A,B,D) (A,B,E) (A,C,D) (A,C,E) (A,D,E) (B,C,D) (B,C,E) (B,D,E) (C,D,E) 2.0 3.0 3.3 (=10/3) 2.3 (=7/3) 4.3 (=13/3)
標本数が4の場合 (A,B,C,D) (A,B,C,E) (A,B,D,E) (A,C,D,E) (B,C,D,E) 2.50 2.75 3.50
標本数が多くなると精度が高くなる とは、どういう事か?
調査結果の平均? 標本数 調査結果 平均 2 2.5, 1.0, 2.5, 3.0, 2.5 4.0, 4.5, 2.5, 3.0, 4.5 3 2.0, 3.0, 3.3, 2.0, 2.3 3.3, 3.0, 3.3, 4.3, 3.3 4 2.50, 2.75, 3.50 2.75, 3.50 3.0
調査結果の平均は、標本数に依らず常に一定 しかも母平均(母集団の平均)に等しい これはいつでも成立する、統計学上の重要な性質 平均の普遍性(unbiased) では一体、どうやって調査結果の精度を評価すれば良いのか?
調査結果のバラツキ? 調査結果の精度が高い ⇔調査結果がいつも同じような値になる ⇔調査結果にバラツキがない
調査結果の分布
調査結果の分布
バラツキをどの様に表現するか? (標本数が4の場合) 調査結果 (A,B,C,D) 2.50 (A,B,C,E) 2.75 (A,B,D,E) 3.50 (A,C,D,E) (B,C,D,E) 平均 3.00 平均との差 -0.50 -0.25 +0.50 その二乗 0.25 0.06 0.00 0.18
分散(variance)の計算 (標本数が4の場合)
記号を用いた分散の定義
母分散の計算
調査結果の分散 標本数 調査結果 分散 2 2.5, 1.0, 2.5, 3.0, 2.5 4.0, 4.5, 2.5, 3.0, 4.5 3 2.0, 3.0, 3.3, 2.0, 2.3 3.3, 3.0, 3.3, 4.3, 3.3 4 2.50, 2.75, 3.50 2.75, 3.50 1.050 0.467 0.175
分散の性質 一般的な性質 分散と精度の関係 分散≧0 分散が小さい ⇔データのバラツキが小さい 調査結果の精度が高い ⇔調査結果の分散が小さい
一回しか調査を行わない場合は、調査結果の分散を計算できない! 調査結果の精度をもっと厳密に評価したい!
例3 例1の母集団を、「ある大学生7人」に限定する 大学生 A B C D E F G 回数 1 4 5
調査結果の分布(N=7)
母集団の大きさ、および標本数が大きくなるほど、調査結果の分布の形は、釣り鐘(bell)に近づく 正規分布(normal distribution) これは、母集団の分布がどんな形でも常に成立する、統計学上の重要な性質: 中心極限定理(central limit theorem)