保健統計演習 (1) 橋本・永吉・新井
臨床研究の技法 RCTでない場合 バイアスを避ける手段の1つ 対照症例研究Case-Control StudyではMatched-Control(対応症例)という手法 バイアスを避ける手段の1つ RCT 盲検 2重盲検
臨床研究の技法 RCTでない場合 対照症例研究Case-Control StudyではMatched-Control(対応症例)という手法 アウトカムに関連すると考えられる因子を 症例群と対照群で均等になるように 対照群を作成する 年齢・性別
バイアスの種類 介入実験→バイアス 研究段階でのバイアス(submission bias) →できるだけポジティブな結果 公表バイアス(publication bias) 医学専門誌の編集者→できるだけポジティブな結果を掲載したがる傾向 思い出し(想起)バイアス(Recall bias) 選択バイアス(Selection bias) 情報バイアス(Information bias) ,etc
【復習】 RCT(Randomized Control Trial) 被験者を「無作為に群分け」し, アウトカムを観察 アウトカム: 例 死亡 5年生存率→ 50%生存期間 !RCTに献身してくれた患者さんのおかげで医学は発展してきました 無作為化
【復習】 盲検化 研究者測定者バイアスの除去 →RCT+2重盲検が標準 【注意】量的研究だけでなく質的研究でも同じである
第3章 データ管理 臨床研究,看護研究→データの取得 データ収集のプロトコール のドキュメント化 →実験ノート(実験マニュアル)
3.3.A 変数と測定値の型 ユニークなID 番号 →識別番号 測定 比例尺度→血圧 名義尺度→性別 順序尺度 →5段階アンケート
統計処理用ソフトウェアSPSS EXCELと似ているが
SPSSの例
変数への割り当て 変数名→A-Zの8文字まで 変数ラベルに詳細を記述する
変数が持つ意味の方向性の再検討 うつ病と関連あるもの CES-D2, CES-D4 →逆にするべき
変数の変換 リンパ数→Log変換 体表面積→平方根変換
一変量統計 Univariate Statistics データの記述と把握 研究対象の把握 男女構成比,平均身長 第4章 1変量統計
はじめに行うこと 視覚的にそれらの分布を概観する
eGFRとは 腎臓のすべての糸球体により濾過される血漿量の推定値→単位はml/分/1.73m2 →参考 クレアチニンクリアランス
平均値を用いない場合
箱ひげ図box plots
ツベルクリン反応検査皮膚硬化の2 峰性分布
2値変数の場合
2値変数の場合 疾患あり1 疾患なし 0
名義的変数の場合
名義的変数の場合
時間経過によって生じるイベント 生存曲線survival curve 罹患率incidence rate
カプラン‐マイヤー法 Kaplan-Meier method 時間( x 軸) は患者が最初の塞栓症で 抗凝血剤療法を中止した時点からの測定時間 y 軸は各時点でアウトカムを経験した( あるいはしていない) 参加者の割合 メディアン生存時間 median survival time 被験者の50% がアウトカムを経験したポイント(時間)
カプラン- マイヤー曲線
罹患率 罹患率は0 から無限まで ある期間(人年)の疾病の新発生患者数
罹患率
保健統計演習(2) 橋本 永吉 新井
【復習】第4章 一変量統計 重要なこと 扱う変数の属性をおさえること データの特性・分布に従った代表値を使うこと グラフを書くこと
変数の属性(尺度) 男1 女2→名義尺度 ★離散量?連続量? 5段階アンケート調査→順序尺度 5:おおいに感動した 4:やや感動した 男1 女2→名義尺度 ★離散量?連続量? 5段階アンケート調査→順序尺度 5:おおいに感動した 4:やや感動した 3:普通 2:あまり感動しなかった 1:全く感動しなかった 血圧
変数の属性(尺度) 男1 女2→名義尺度
連続量の扱い 計算するときはそのまま 図表に表す時は階級(またはカテゴリー)にわける 注意) 日本では伝統的に以上・未満で 分類してきた. 米国では違う
階級値=(階級の真ん中の値) 80から90→85
度数分部表
ヒストグラム 階級値が棒の中央!
教科書p.72
図をちゃんと理解する 階級値 図での値 階級下限 階級上限 126 124 128 130 132 134 136
グラフ→基本統計 分析ツール(EXCEL)
基本統計のEXCEL関数
標本の大きさ Sample size,Size of Sample 連続変量に関するEXCELのバグ Modeの値は不正です 標本数,データ数←間違え 標本の大きさ Sample size,Size of Sample
標準偏差(Standard Deviation) ばらつきの目安 同じ平均20でも ばらつき2倍 10 20 30 20 40 20 ばらつき=0 20 20
正規分布(Normal Distribution) http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg
正規分布 平均μと標準偏差σで決定 左右対称 別名 誤差分布,ガウス分布 標準正規分布(基準正規分布) 平均0 標準偏差1
【最重要】正規分布の性質 平均±標準偏差の範囲に全体の68.26% 平均±2倍の標準偏差の範囲に全体の95.45% 平均±3倍の標準偏差の範囲に全体の99.73 %
応用例 身長←正規分布 平均170cm 標準偏差5cm 人口1万人 165cm-175cmに68.26%→6826人
(10000人- 9545人)/2≒227.5人 9545人 10000人
【重要】基準化の公式 X:平均μ,標準偏差σの正規分布 Z:平均0,標準偏差1の正規分布
【参考】尖度(せんど) Kurtosis クルトシス 小麦の発芽(子葉鞘) 遠赤色光 暗箱 −0.194 0.055
【参考】歪度(わいど) Skewness スキューネス 左に裾をひく 歪度 負 右に裾を引く 歪度 正
2 つの変数の間の関連性をしらべる 二変量統計
ポイント 変数の属性 2値変数(男女,暴露/非暴露)X比尺度(血圧) 比尺度(血圧) X 比尺度
対応がないデータで二変数の間の関連性を評価するための統計
2 × 2 分割表
(1)観察の結果(周辺)
(2)帰無仮説をつくる 帰無仮説 糖尿病と死亡は無関係(独立) →帰無仮説(Null Hypnosis)
糖尿病と死亡は無関係(独立)
計算値と実測の比較
統計的仮説検定 帰無仮説 H0 対立仮説 H1 H0を否定(めったに起きない)して H1であることをしめす
カイ2乗検定 カイ2乗=Σ(観測度数ー期待度数)2÷期待度数 自由度: CHITEST(観測度数のセル範囲,期待度数のセル範囲)←自由度は自動計算
自由度 205-47=158 726-47=679 NXMの分割表では 自由度は(N-1)X(M-1)となる
マタンブレの摂食とボツリヌス中毒
リスク比
オッズ比
第92回保健師国家試験問題
血栓溶解療法を受けた糖尿病患者間で改善されない場合の皮質障害の影響
アフリカ系アメリカ人の民族性と不十分な血糖コントロールの関連性
カイ2乗の注意
正規分布するか?
二値変数と正規分布に従う間隔変数の関連性 t検定
二値変数と非正規分布に従う間隔変数を持ったの関連性を決定する場合は, マン‐ホイットニーの検定Mann-Whitney test(マン‐ホイットニーのU 検定 Mann-Whitney U-test,マン‐ホイットニーの順位和検定Mann-Whiteny rank sum test,またはウィルコクソンの順位和検定Wilcoxon rank sum test とも言う74) を使用してください
マンホイットニーの検定 正規性の仮定が否定された 順序尺度であるとき
名義変数と正規分布に従う間隔変数との関連性(3 つ以上の平均値の比較) 分散分析(ANOVA) を使用してください. ボンフェローニの補正?
2 つの間隔変数の間の関連性を検定 身長と体重