<minato@ypu.jp> 疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453) <minato@ypu.jp> http://phi.ypu.jp/epidemiology/

Slides:



Advertisements
Similar presentations
◎標本調査とその問題点 ● 何らかの情報を得たい全体集団(母 集団)から、ランダムに適当な数の標 本(サンプル)を抽出し、それに対す る調査結果から母集団に関する情報を 推定する方法 ● 全数調査(悉皆調査:国勢調査等) と比較して、費用・時間の面で極めて 効率的 ● 標本調査が十分にその機能を果たすためには.
Advertisements

分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
第1章 統計的方法の性質 高 尚策 (コウ ショウサク) 准 教授 1 富山大学知能情報工学科 「統計学」第1回 オリエンテーション.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
マーケティング情報の収集と活用.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
Lesson 21. 健康政策と疫学 §B. 集団データを用いた 疫学研究 疫学概論 集団データを用いた疫学研究
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか
社会調査とは何か(3) 調査対象者の選定方法
マーケティング戦略の決定.
検定 P.137.
統計学 12/3(月).
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
疫学概論 メタアナリシス Lesson 21. 健康政策と疫学 §D. メタアナリシス S.Harano, MD,PhD,MPH.
経済統計 第三回 5/1 Business Statistics
統計学 11/30(木).
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
疫学概論 無作為化比較対照試験 Lesson 14. 無作為化臨床試験 §A. 無作為化比較対照試験 S.Harano,MD,PhD,MPH.
マーケティング情報.
行動計量分析 Behavioral Analysis
統計学 12/13(木).
シミュレーション物理7 乱数.
統計学 第3回 10/11 担当:鈴木智也.
統計解析 第10回 12章 標本抽出、13章 標本分布.
調査対象の決定 (今日の目標) 1. 全数調査と標本調査の違いを理解する。 2. 標本調査の種類と特徴を理解する。 3.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
Study Design and Statistical Analysis
マーケティング情報の収集と活用.
河川工学 -水文統計- 昼間コース 選択一群 2単位 朝位
データ分析.
疫学(Epidemiology) 第3回 疫学研究のデザイン 中澤 港(内線1453)
マーケティング情報収集と活用.
疫学概論 横断研究 Lesson 11. 記述疫学 §A. 横断研究 S.Harano,MD,PhD,MPH.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
疫学概論 標本抽出法 Lesson 10. 標本抽出 §B. 標本抽出法 S.Harano,MD,PhD,MPH.
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
第3章 統計的推定 (その1) 統計学 2006年度.
食中毒と疫学調査の統計 ~2×2表~ 岡山理科大学 山本英二 2002/02/20.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
疫学概論 バイアス Lesson 17. バイアスと交絡 §A. バイアス S.Harano, MD,PhD,MPH.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
疫学概論 方法論的問題点(患者対照研究) Lesson 13. 患者対照研究 §B. 方法論的問題点 S.Harano,MD,PhD,MPH.
サンプリングと確率理論.
確率と統計 確率編- 平成20年10月29日(木).
疫学概論 横断研究 Lesson 11. 記述疫学 §A. 横断研究 S.Harano,MD,PhD,MPH.
実都市を対象とした初期マイクロデータの 推定手法の適用と検証
Presentation transcript:

<minato@ypu.jp> 疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453) <minato@ypu.jp> http://phi.ypu.jp/epidemiology/

第4回講義概要 これまでも多少触れたが,標本抽出法について概説し,標本抽出を含むデザインによって誤差やバイアスをどのように減らすことができるのかを説明する。 日本疫学会編「疫学」では概ね第17章と第10章に相当する。

標本抽出法とは? 疫学調査で得られた結果を適用したい集団(介入研究でいう参照集団にあたる。統計的に考えるならば母集団)の全数を調査する悉皆調査は,費用や時間などの制約,あるいはその必要がないなどの理由で実施されないことが多い。 その代わりに,集団全体を代表する適当なサイズの標本をうまく選んでやればよいことになる。 如何にうまく集団全体を代表するような標本を選ぶかという目的で考案されたさまざまな方法を総称して標本抽出法と呼ぶ。

なぜ標本抽出するのか? 悉皆調査には欠点がある 集団には多様性がある 代表性をもった部分を標本として抽出できれば,その部分を調べることによって全体の性質を推測できる(統計的推測の考え方)。 記述疫学では母集団が確定していないと無意味。分析疫学や介入研究では,必ずしもそうではない。

サンプルの種類 area sample cluster sample grab sample probability sample (広義のrandom sample)

単純無作為抽出法 まず母集団の全員をリストし連番を割り振る。 乱数表,さいころ,コンピュータなどを使ってランダムな番号を必要な個数選ぶ。例えば, 全員に(0,1)の一様乱数を与える 小さい順に並べ替える 小さい方から必要なところまで対象とする 統計ソフトを使うと簡単。N人からなる母集団からp人を抽出するとき,Rならrank(runif(N))の出力結果の左からp個の番号に当たる人を標本とすればよい。

層別抽出法 年齢別,性別,職業別など,既知の階層毎に単純無作為抽出する 層によって調査指標が異なることが既知の場合は単純無作為抽出より代表性がいい 層ごとの集計ができる サンプリング以前に,階層の情報がわかっていなければならない(が,予備的にその集団について階層を調べたりすると,それ自体が本調査に影響するかもしれない) 階層の出現頻度が事前にはわからない 時間と金がかかる 総サンプル数が決まっている場合,階層毎のサンプル数が減ってしまう

集束抽出法 集落抽出法ともいう。Cluster sampling 多段抽出の1つで,最終段階では全数を標本とする。最終段階の1つ前で選ばれる集団を単位として抽出する方法と考えられる 途上国の調査ではよく使われる。例えば,複数の村を含む州の調査などで,村をランダムに選んで,選ばれた村は全数調べる 比較的安上がりで同意を得やすく短期間で調査できる場合が多い

確率比例抽出法 Probability Proportionate Sampling (PPS) 母集団が不均質なとき,均質と考えられるブロックに分け,各ブロックの人口に比例した確率でいくつかのブロックが選ばれた後,各ブロックからは同数のサンプルを抽出する方法 逆にブロックサイズによらず等確率でいくつかのブロックが選ばれた後,各ブロックからそのサイズに比例した数のサンプルを抽出する方法を副次抽出法という。

標本抽出法の選択 母集団が小さいときは,単純無作為抽出か層別抽出 母集団が大きいときは,資金が豊富にあれば層別抽出 母集団が大きく資金が乏しいとかアクセスが悪いときは多段抽出

標本サイズの計算 表17.2を参照 目的によって計算式が異なる 測定値に関する予測(先行研究などから)が得られ,有意水準と検出力を決めれば計算できる

誤差 誤差=真値との差 標本誤差=標本抽出の偶然変動に伴う母集団の真値との差(標本サイズが大きいほど小さい) 非標本誤差=標本誤差以外の誤差(例えば不適切な標本抽出による誤差) ランダムな誤差(偶然誤差) ランダムな誤差が小さい=精度(precision)が高い 系統的な誤差=バイアス 研究デザイン,データ収集,分析,レビュー,出版など,研究のさまざまな段階で起こりうる。 系統的な誤差が小さい=正確さ(accuracy)が高い

バイアス 選択バイアス(selection bias) 観察する集団が母集団を正しく代表していないときに起こる偏り 情報バイアス(information bias) 観察するときに得られる情報が正しくないために起こる偏り 交絡バイアス(confounding bias) 分析疫学で起こる特殊な偏り。要因と疾病の両方と関連する交絡因子の存在によって起こる

バイアスの制御 無作為化(randomization):ランダムに群分けをすることで介入以外の条件を確率的に均質化 マッチング(matching):交絡因子の条件が似るように対照群を選ぶ 層化(stratification):交絡因子のカテゴリ別に解析することで交絡因子の影響を除く 標準化(standardization):基準集団を決めて交絡因子のカテゴリ別割合を調整することで交絡因子の影響を取り除く