サンプリングと確率理論
サンプリングとは サンプリングとは、母集団全体の特性を評価する目的で母集団を構成する調査単位のなかから一部分を抽出する行為である。
サンプリング誤差 サンプリング誤差:サンプリングに由来する誤差。 サンプリング誤差 = 標本値 - 母集団値 標本数を増やせば、小さくすることができる。
サンプリング方法 確率サンプリング…ターゲット母集団に抽出単位(消費者・顧客)が標本に含まれる確率を指定する。 単純無作為抽出法 系統抽出法 クラスターサンプリング 層化抽出法 2段抽出法 二相抽出法 非確率サンプリング…ターゲット母集団に抽出単位(消費者・顧客)が標本に含まれる確率を指定しない。 便宜的サンプリング 判断によるサンプリング 割り当てサンプリング スノーボールサンプリング
単純無作為抽出 ①単純無作為抽出…母集団に抽出単位のどれもがサンプルに含まれる 際に同等の確率を持っている。 際に同等の確率を持っている。 <例>乱数票による単純無作為抽出
系統抽出 ②系統抽出…母集団の成員全体に一連の番号を付けておき、第1番の 標本だけを無作為に決め、2番目以下の標本を一定の間隔 標本だけを無作為に決め、2番目以下の標本を一定の間隔 で決めていく。 等間隔サンプリングとも言われる 単純無作為標本と比べ、サンプリングの作業効率は遥かに高い <例>1000人からなる母集団から200人の標本を抽出する場合
クラスターサンプリング ③クラスターサンプリング 第1段階…母集団を互いに背反し、かつ網羅的なグループに分割 第1段階…母集団を互いに背反し、かつ網羅的なグループに分割 第2段階…それぞれのグループから単純無作為抽出をする <例>エリアサンプリング エリア別
層化抽出法 ④層化抽出法 第1段階…母集団を互いに背反し、かつ網羅的なサブグループに分割 第1段階…母集団を互いに背反し、かつ網羅的なサブグループに分割 第2段階…それぞれのグループから単純無作為抽出をする <例>標本を所得層別で抽出する場合 はそれぞれの所得水準を持った標本
2段抽出法 ⑤2段抽出法 第1段階…一次抽出単位を系統抽出やクラスターサンプリングで抽出 第2段階…二次抽出単位を単純無作為抽出する 第1段階…一次抽出単位を系統抽出やクラスターサンプリングで抽出 第2段階…二次抽出単位を単純無作為抽出する <例>一次抽出単位=大阪の13市、一次抽出単位=各市に在住の家計
二相抽出法 ⑥二相抽出法…母集団の各層のサイズが不明の場合 第1段階…大標本を抽出し、母集団の各層のサイズを推定 第1段階…大標本を抽出し、母集団の各層のサイズを推定 第2段階…選ばれた抽出単位から層化サンプリングを行なう 二相抽出法
便宜的サンプリング ①便宜的サンプリング…顧客や対象物が都合よく入手可能な場合 <例>インターセプト法 ショッピングモールで買い物をしたばかりの顧客 をインタビューする。 選挙時にテレビ局が街頭でインタビューする。 利点…経費がかからず、しかも短期に必要な情報が入手可能である。 欠点…リサーチの結果をターゲット母集団と関連付けることが不可能であり、 統計的な推計ができない。
判断によるサンプリング ②判断によるサンプリング…経験を積んだリサーチャーが個人的な判断 で行なうサンプリング。 <例> で行なうサンプリング。 <例> テストマーケティングを行なう際に、テスト市場あるいは都市をリサーチャー が選択する。
割当サンプリング ③割当サンプリング…性、年齢、地域などの基本特性について、サンプル 構成を一定の代表性が保たれるように、母集団構成 構成を一定の代表性が保たれるように、母集団構成 に比例して割り当てるサンプリング。 <例> ある大学の3・4年生を対象に調査する際に、学生数の比率が40対60とする。また3年生の男女比が60対40で、4年生のそれが50対50になっている。100人の標本を抽出する場合、3年生から40人、4年生から60人をサンプリングする。また3年生の40人の内24人が男子で16人が女子である。4年生の場合男子女子ともに30人ずつサンプリングする。
スノーボールサンプリング ④スノーボールサンプリング…ターゲット母集団が小さいため、紹介者を 経由して、雪だるま式にサンプルを増やして 経由して、雪だるま式にサンプルを増やして いく方法。 <例> ハイエンドのオーディオのユーザーを対象とした調査
サンプル数の決定要因 情報の価値 求められる推定の制度 母集団の分散 分析の詳細 サンプリング・コスト
母集団の特性(パラメーター)
標本の特性(統計量)
標本分布
標本分布 n = 100 n = 25
標準正規分布
標準正規分布
区間推定
標本数の決定 標本数を決定するには次の3つを設定しなければならない。 1.有意水準 2.期待分散 3.標本誤差
標本数の決定 <例> 1.有意水準 = 0.95 2.期待分散 = 1.49 3.標本誤差 = 0.3
比率の問題