保健統計演習 (1) 橋本・永吉・新井.

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
回答と解説.
Lesson 21. 健康政策と疫学 §B. 集団データを用いた 疫学研究 疫学概論 集団データを用いた疫学研究
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
保健統計演習 橋本.
保健統計演習(統計学 第1回) Hasimoto.
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
統計解析 第9回 第9章 正規分布、第11章 理論分布.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
疫学概論 無作為化比較対照試験 Lesson 14. 無作為化臨床試験 §A. 無作為化比較対照試験 S.Harano,MD,PhD,MPH.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
1変量データの記述 経済データ解析 2006年度.
Study Design and Statistical Analysis
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
地理情報システム論演習 地理情報システム論演習
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
疫学概論 疾病の自然史と予後の測定 Lesson 6. 疾病の自然史と 予後の測定 S.Harano,MD,PhD,MPH.
疫学概論 バイアス Lesson 17. バイアスと交絡 §A. バイアス S.Harano, MD,PhD,MPH.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
analysis of survey data 堀 啓造
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
都市・港湾経済学(総) 国民経済計算論(商)
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
疫学概論 カプラン・マイヤー法 Lesson 8. その他の生存分析 §A. カプラン・マイヤー法 S.Harano,MD,PhD,MPH.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
疫学概論 方法論的問題点(患者対照研究) Lesson 13. 患者対照研究 §B. 方法論的問題点 S.Harano,MD,PhD,MPH.
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
データ分布の特徴 基準化変量 歪度 尖度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

保健統計演習 (1) 橋本・永吉・新井

臨床研究の技法 RCTでない場合 バイアスを避ける手段の1つ 対照症例研究Case-Control StudyではMatched-Control(対応症例)という手法 バイアスを避ける手段の1つ RCT 盲検 2重盲検

臨床研究の技法 RCTでない場合 対照症例研究Case-Control StudyではMatched-Control(対応症例)という手法 アウトカムに関連すると考えられる因子を 症例群と対照群で均等になるように 対照群を作成する 年齢・性別

バイアスの種類 介入実験→バイアス 研究段階でのバイアス(submission bias) →できるだけポジティブな結果 公表バイアス(publication bias) 医学専門誌の編集者→できるだけポジティブな結果を掲載したがる傾向 思い出し(想起)バイアス(Recall bias) 選択バイアス(Selection bias) 情報バイアス(Information bias) ,etc

【復習】 RCT(Randomized Control Trial) 被験者を「無作為に群分け」し, アウトカムを観察 アウトカム: 例 死亡 5年生存率→  50%生存期間 !RCTに献身してくれた患者さんのおかげで医学は発展してきました 無作為化

【復習】 盲検化 研究者測定者バイアスの除去 →RCT+2重盲検が標準 【注意】量的研究だけでなく質的研究でも同じである

第3章 データ管理 臨床研究,看護研究→データの取得 データ収集のプロトコール のドキュメント化 →実験ノート(実験マニュアル)

3.3.A 変数と測定値の型 ユニークなID 番号 →識別番号 測定 比例尺度→血圧 名義尺度→性別 順序尺度 →5段階アンケート

統計処理用ソフトウェアSPSS EXCELと似ているが

SPSSの例

変数への割り当て 変数名→A-Zの8文字まで 変数ラベルに詳細を記述する

変数が持つ意味の方向性の再検討 うつ病と関連あるもの CES-D2, CES-D4 →逆にするべき

変数の変換 リンパ数→Log変換 体表面積→平方根変換

一変量統計 Univariate Statistics データの記述と把握  研究対象の把握 男女構成比,平均身長 第4章 1変量統計

はじめに行うこと 視覚的にそれらの分布を概観する

eGFRとは 腎臓のすべての糸球体により濾過される血漿量の推定値→単位はml/分/1.73m2 →参考 クレアチニンクリアランス

平均値を用いない場合

箱ひげ図box plots

ツベルクリン反応検査皮膚硬化の2 峰性分布

2値変数の場合

2値変数の場合 疾患あり1 疾患なし 0

名義的変数の場合

名義的変数の場合

時間経過によって生じるイベント 生存曲線survival curve 罹患率incidence rate

カプラン‐マイヤー法 Kaplan-Meier method 時間( x 軸) は患者が最初の塞栓症で 抗凝血剤療法を中止した時点からの測定時間 y 軸は各時点でアウトカムを経験した( あるいはしていない) 参加者の割合 メディアン生存時間 median survival time 被験者の50% がアウトカムを経験したポイント(時間)

 カプラン- マイヤー曲線

罹患率 罹患率は0 から無限まで ある期間(人年)の疾病の新発生患者数

罹患率

保健統計演習(2) 橋本 永吉 新井

【復習】第4章 一変量統計 重要なこと 扱う変数の属性をおさえること データの特性・分布に従った代表値を使うこと グラフを書くこと

変数の属性(尺度) 男1 女2→名義尺度 ★離散量?連続量? 5段階アンケート調査→順序尺度 5:おおいに感動した 4:やや感動した 男1 女2→名義尺度 ★離散量?連続量? 5段階アンケート調査→順序尺度 5:おおいに感動した 4:やや感動した 3:普通 2:あまり感動しなかった 1:全く感動しなかった 血圧

変数の属性(尺度) 男1 女2→名義尺度

連続量の扱い 計算するときはそのまま 図表に表す時は階級(またはカテゴリー)にわける 注意) 日本では伝統的に以上・未満で 分類してきた. 米国では違う

階級値=(階級の真ん中の値) 80から90→85

度数分部表

ヒストグラム 階級値が棒の中央!

教科書p.72

図をちゃんと理解する 階級値 図での値 階級下限 階級上限 126 124 128 130 132 134 136

グラフ→基本統計 分析ツール(EXCEL)

基本統計のEXCEL関数

標本の大きさ Sample size,Size of Sample 連続変量に関するEXCELのバグ Modeの値は不正です 標本数,データ数←間違え 標本の大きさ Sample size,Size of Sample

標準偏差(Standard Deviation) ばらつきの目安 同じ平均20でも ばらつき2倍 10 20 30 20 40 20 ばらつき=0 20 20

正規分布(Normal Distribution) http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg

正規分布 平均μと標準偏差σで決定 左右対称 別名 誤差分布,ガウス分布 標準正規分布(基準正規分布) 平均0 標準偏差1

【最重要】正規分布の性質 平均±標準偏差の範囲に全体の68.26% 平均±2倍の標準偏差の範囲に全体の95.45% 平均±3倍の標準偏差の範囲に全体の99.73 %

応用例 身長←正規分布 平均170cm 標準偏差5cm 人口1万人 165cm-175cmに68.26%→6826人

(10000人- 9545人)/2≒227.5人 9545人 10000人

【重要】基準化の公式 X:平均μ,標準偏差σの正規分布 Z:平均0,標準偏差1の正規分布

【参考】尖度(せんど) Kurtosis クルトシス 小麦の発芽(子葉鞘) 遠赤色光 暗箱 −0.194 0.055

【参考】歪度(わいど) Skewness スキューネス 左に裾をひく 歪度 負 右に裾を引く 歪度 正

2 つの変数の間の関連性をしらべる 二変量統計

ポイント 変数の属性 2値変数(男女,暴露/非暴露)X比尺度(血圧) 比尺度(血圧) X 比尺度

対応がないデータで二変数の間の関連性を評価するための統計

 2 × 2 分割表

(1)観察の結果(周辺)

(2)帰無仮説をつくる 帰無仮説 糖尿病と死亡は無関係(独立) →帰無仮説(Null Hypnosis)

糖尿病と死亡は無関係(独立)

計算値と実測の比較

統計的仮説検定 帰無仮説 H0 対立仮説 H1 H0を否定(めったに起きない)して H1であることをしめす

カイ2乗検定 カイ2乗=Σ(観測度数ー期待度数)2÷期待度数 自由度: CHITEST(観測度数のセル範囲,期待度数のセル範囲)←自由度は自動計算

自由度 205-47=158 726-47=679 NXMの分割表では 自由度は(N-1)X(M-1)となる

マタンブレの摂食とボツリヌス中毒

リスク比

オッズ比

第92回保健師国家試験問題

血栓溶解療法を受けた糖尿病患者間で改善されない場合の皮質障害の影響

アフリカ系アメリカ人の民族性と不十分な血糖コントロールの関連性

カイ2乗の注意

正規分布するか?

二値変数と正規分布に従う間隔変数の関連性 t検定

二値変数と非正規分布に従う間隔変数を持ったの関連性を決定する場合は,  マン‐ホイットニーの検定Mann-Whitney    test(マン‐ホイットニーのU 検定 Mann-Whitney U-test,マン‐ホイットニーの順位和検定Mann-Whiteny rank sum test,またはウィルコクソンの順位和検定Wilcoxon rank sum test とも言う74) を使用してください

マンホイットニーの検定 正規性の仮定が否定された 順序尺度であるとき

名義変数と正規分布に従う間隔変数との関連性(3 つ以上の平均値の比較) 分散分析(ANOVA) を使用してください. ボンフェローニの補正?

2 つの間隔変数の間の関連性を検定 身長と体重