サンプリングと確率理論.

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

◎標本調査とその問題点 ● 何らかの情報を得たい全体集団(母 集団)から、ランダムに適当な数の標 本(サンプル)を抽出し、それに対す る調査結果から母集団に関する情報を 推定する方法 ● 全数調査(悉皆調査:国勢調査等) と比較して、費用・時間の面で極めて 効率的 ● 標本調査が十分にその機能を果たすためには.
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
マーケティング情報の収集と活用.
マーケティング機会分析: マーケティング・リサーチ
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
社会調査とは何か(3) 調査対象者の選定方法
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
第2章 全数調査と標本調査 ー 経済統計 ー.
調査法B (心理カウンセリング学科・カウンセリング研究コース)
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
マーケティング情報.
行動計量分析 Behavioral Analysis
統計学 12/13(木).
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
調査対象の決定 (今日の目標) 1. 全数調査と標本調査の違いを理解する。 2. 標本調査の種類と特徴を理解する。 3.
橋本 保健統計演習への準備.
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
マーケティング情報の収集と活用.
マーケティング情報収集と活用.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
疫学概論 標本抽出法 Lesson 10. 標本抽出 §B. 標本抽出法 S.Harano,MD,PhD,MPH.
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

サンプリングと確率理論

サンプリングとは  サンプリングとは、母集団全体の特性を評価する目的で母集団を構成する調査単位のなかから一部分を抽出する行為である。

サンプリング誤差 サンプリング誤差:サンプリングに由来する誤差。 サンプリング誤差 = 標本値 - 母集団値  標本数を増やせば、小さくすることができる。

サンプリング方法 確率サンプリング…ターゲット母集団に抽出単位(消費者・顧客)が標本に含まれる確率を指定する。 単純無作為抽出法 系統抽出法 クラスターサンプリング 層化抽出法 2段抽出法 二相抽出法 非確率サンプリング…ターゲット母集団に抽出単位(消費者・顧客)が標本に含まれる確率を指定しない。 便宜的サンプリング 判断によるサンプリング 割り当てサンプリング スノーボールサンプリング

単純無作為抽出 ①単純無作為抽出…母集団に抽出単位のどれもがサンプルに含まれる 際に同等の確率を持っている。               際に同等の確率を持っている。 <例>乱数票による単純無作為抽出

系統抽出 ②系統抽出…母集団の成員全体に一連の番号を付けておき、第1番の 標本だけを無作為に決め、2番目以下の標本を一定の間隔          標本だけを無作為に決め、2番目以下の標本を一定の間隔          で決めていく。 等間隔サンプリングとも言われる 単純無作為標本と比べ、サンプリングの作業効率は遥かに高い <例>1000人からなる母集団から200人の標本を抽出する場合

クラスターサンプリング ③クラスターサンプリング 第1段階…母集団を互いに背反し、かつ網羅的なグループに分割   第1段階…母集団を互いに背反し、かつ網羅的なグループに分割   第2段階…それぞれのグループから単純無作為抽出をする <例>エリアサンプリング エリア別

層化抽出法 ④層化抽出法 第1段階…母集団を互いに背反し、かつ網羅的なサブグループに分割   第1段階…母集団を互いに背反し、かつ網羅的なサブグループに分割   第2段階…それぞれのグループから単純無作為抽出をする <例>標本を所得層別で抽出する場合 はそれぞれの所得水準を持った標本

2段抽出法 ⑤2段抽出法 第1段階…一次抽出単位を系統抽出やクラスターサンプリングで抽出 第2段階…二次抽出単位を単純無作為抽出する   第1段階…一次抽出単位を系統抽出やクラスターサンプリングで抽出   第2段階…二次抽出単位を単純無作為抽出する <例>一次抽出単位=大阪の13市、一次抽出単位=各市に在住の家計

二相抽出法 ⑥二相抽出法…母集団の各層のサイズが不明の場合 第1段階…大標本を抽出し、母集団の各層のサイズを推定   第1段階…大標本を抽出し、母集団の各層のサイズを推定   第2段階…選ばれた抽出単位から層化サンプリングを行なう 二相抽出法

便宜的サンプリング ①便宜的サンプリング…顧客や対象物が都合よく入手可能な場合 <例>インターセプト法  ショッピングモールで買い物をしたばかりの顧客                  をインタビューする。                  選挙時にテレビ局が街頭でインタビューする。 利点…経費がかからず、しかも短期に必要な情報が入手可能である。 欠点…リサーチの結果をターゲット母集団と関連付けることが不可能であり、      統計的な推計ができない。

判断によるサンプリング ②判断によるサンプリング…経験を積んだリサーチャーが個人的な判断 で行なうサンプリング。 <例>                   で行なうサンプリング。 <例> テストマーケティングを行なう際に、テスト市場あるいは都市をリサーチャー が選択する。

割当サンプリング ③割当サンプリング…性、年齢、地域などの基本特性について、サンプル 構成を一定の代表性が保たれるように、母集団構成               構成を一定の代表性が保たれるように、母集団構成               に比例して割り当てるサンプリング。 <例> ある大学の3・4年生を対象に調査する際に、学生数の比率が40対60とする。また3年生の男女比が60対40で、4年生のそれが50対50になっている。100人の標本を抽出する場合、3年生から40人、4年生から60人をサンプリングする。また3年生の40人の内24人が男子で16人が女子である。4年生の場合男子女子ともに30人ずつサンプリングする。

スノーボールサンプリング ④スノーボールサンプリング…ターゲット母集団が小さいため、紹介者を 経由して、雪だるま式にサンプルを増やして                     経由して、雪だるま式にサンプルを増やして                     いく方法。 <例> ハイエンドのオーディオのユーザーを対象とした調査

サンプル数の決定要因 情報の価値 求められる推定の制度 母集団の分散 分析の詳細 サンプリング・コスト

母集団の特性(パラメーター)

標本の特性(統計量)

標本分布

標本分布 n = 100 n = 25

標準正規分布

標準正規分布

区間推定

標本数の決定 標本数を決定するには次の3つを設定しなければならない。 1.有意水準 2.期待分散 3.標本誤差

標本数の決定 <例> 1.有意水準 = 0.95 2.期待分散 = 1.49 3.標本誤差 = 0.3

比率の問題