臨床統計入門(2) 箕面市立病院小児科 山本威久 平成23年10月20日
質問1: 研修医の先生に聞きました。 先生が良く知っている統計にはどんなものが ありますか? 答え: カイ2乗検定、それから、t 検定!! それ以外は????、、、、、、、、、。
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
2つの検定法の特徴 パラメトリック検定 ノンパラメトリック検定 ・正規分布 分布に依存しない ・等分散 ・等分散でなくても良い ・間隔尺度、 比例尺度である 連続変数 ・離散値のある順序変数 ・対数 ・絶対0の定まらない体温、 pHなど
正規分布がどうかを調べる方法 検定の仮説:数値が正規分布する。 正規性の検定(Shapiro Wilk:シャピロ ウイルク検定) 正規性の検定(Shapiro Wilk:シャピロ ウイルク検定) 検定の仮説:数値が正規分布する。 有意差が有る(P<0.05)と正規分布でない! いつもの有意差が有ればOKという感覚と違うので要注意!
2009年から2010年に新型インフルエンザで 入院した小児の最高体温(N=71) 直線にのれば正規分布 正規分布でない!!
具体的にパラメトリックかノンパラメトリックか? 小標本の場合(例:N<10) 厳密に正規性、等分散性を検定しても、少数のために 正規性の検定(Shapiro Wilk:シャピロ ウイルク検定) をパスする。 従って、極端な場合を除いて事実上t 検定の適応はOK. 大標本の場合(例:N>30) 厳密にはt検定を適用できる場合がほとんどない。大標本の 場合、ノンパラメトリックでもパラメトリックでも、結果に大きな 差はでないことが多い。
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
2群の比較のイメージ 平均+/-SD B A 統計一口メモ SD(標準偏差):検討した集団の測定値のばらつき 平均+/-SD B A SD(標準偏差):検討した集団の測定値のばらつき SE(標準誤差):母集団の平均値のばらつき 統計一口メモ
Mann-whitney(マン フイトニー)検定 2群の比較検定(データに対応が無いとき) 1、パラメトリック検定(平均値の比較) t 検定 2、ノンパラメトリック検定(中央値の比較) Mann-whitney(マン フイトニー)検定
Mann-whitney(マン フイトニー)検定 B t検定 Mann-whitney(マン フイトニー)検定 最高体温に性差はあるか?
時間的変化があるデータ解析:例治療前後、研修前後 2群の比較検定(データに対応があるとき) 対応があるとは? 時間的変化があるデータ解析:例治療前後、研修前後 1、パラメトリック検定(平均値の比較) ペアード t 検定 2、ノンパラメトリック検定(中央値の比較) Wilcoxon検定(ウイルコクソン)検定
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
3群以上の比較のイメージ A B C
対応のない3群以上の比較検定法 分散分析 3つの群(例:A,B,C)の平均値のどれか一つに 有意差があるかどうかを見るための検定? 有意差があるかどうかを見るための検定? 具体的に、AとB、AとC、BとCのどこに有意差が有るかは下記の方法。 Tukey Kramer(ツユーキー、クレイマー)法:上記3つを全て比較 またはDunnett(ダネット)法:特定の一つと比較:例 AとC, BとC
複数のt検定をすることと多重比較検定の違い
無気肺スコアーで最高体温に差が有るか? 3群のどこか一つに有意差有 一つ一つでは有意差無し
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
カイ2乗検定、Fisherの直接確率法 (対応のない2群の比率の検定) 1)カイ2乗検定 2群の比率を用いて関連性の有無について 検定する。 (対応のない2群の比率の検定) 1)カイ2乗検定 2群の比率を用いて関連性の有無について 検定する。 2)Fisherの直接確率法 カイ2乗検定で人数が少ないとき(具体的には 5人以下の結果がある場合)に用いる検定法。
喘息の既往歴有とベータ2吸入に関連性があるか? 強い関連性あり
カイ2乗検定、Fisherの直接確率法 (対応のない2群の比率の検定) 1)カイ2乗検定 2群の比率を用いて関連性の有無について 検定する。 (対応のない2群の比率の検定) 1)カイ2乗検定 2群の比率を用いて関連性の有無について 検定する。 2)Fisherの直接確率法 カイ2乗検定で人数が少ないとき(具体的には 5人以下の結果がある場合)に用いる検定法。
喘息の既往歴有とガンマグロブリン治療に関連性があるか? 関連性無し
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
相関分析 注意事項 対応のない2つの変数間の関連性を調べる。 関連性を調べる方法:直線性があるかどうかで判定 相関分析 対応のない2つの変数間の関連性を調べる。 関連性を調べる方法:直線性があるかどうかで判定 パラメトリック(正規分布同士のみ適応有) ピアソンの相関係数 ノンパラメトリック:スピアマンの相関係数 注意事項 AとBに有意な相関があっても因果関係はいえない! 例:AがBの原因だ!
相関分析のピットフォール 直線関係の無いものは分析できない!!
相関係数の評価
最高体温と最高脈拍数に関連性があるか? ピアソンの相関係数 スピアマンの相関係数
予測できるかを調べる方法:直線式になるかどうか? 回帰分析 対応のない2つの変数間の予測式を調べる。 予測できるかを調べる方法:直線式になるかどうか? 注意事項 1、有意な直線式にならなければ予測できない!! 2、回帰分析からは因果関係はいえない!!
直線性はOK! 最高体温に意味有! 最高脈拍数は最高体温で予測できるか?
臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 臨床統計の実際 1、統計検定の種類 パラメトリック検定とノンパラメトリック検定 2、2項目の比較のための検定 3、3項目の比較のための検定 4、2項目の比率の検定 5、相関係数、回帰式 6、アンケート調査入門
アンケート作成上の注意事項(1) [1]曖昧な表現を避ける [2]難しい言葉は使わない [3]言葉の偏りに注意する 例えば、「人事制度の改定に賛成ですか」という質問と「人事制度を 改定することはやむを得ないと思いますか」では回答に違いがでる。 [4]ダブル・バーレル(double-barrel)にならないようにする ダブル・バーレルとは、1つの項目に複数の意味が含まれていることを指す。例えば、「上司はあなたの業務状況について指導する機会を持ち、目標達成に向けて有効なアドバイスと適切なサポートをしてくれる」というような項目がこれにあたる。 [5]誘導的な表現を避ける 例えば、「一般的に○○施策は効果的であると言われていますが、わが社においてもこれを導入することに賛成しますか」というような表現は回答者に「YES」と言わせるように誘導している。
アンケート作成上の注意事項(2) 一般に項目数が多くなるほど回答率が下がり、 また回答する内容の精度も下がると言われている。 回答にはできるだけ負担がかからないよう項目数を 最小限に抑え、回答時間はできるだけ10~20分、 長くても30分以内におさめることが望ましい。
アンケートの対象 調査の対象となる集団のことを母集団という。 たとえば、ダイエットに対して日本の女子大生が 調査の対象となる集団のことを母集団という。 たとえば、ダイエットに対して日本の女子大生が どのように考えているかを調べようとすると、 日本中の女子大生が母集団となる。アンケート をする場合、母集団の全数を調査するならば、 全数調査といい、母集団の一部を抜き取って 調査するならば、標本調査という。
調査規模 標本調査ならば、母集団から選び出す人数を 決めなければならない。この人数は、要求精度、 回収率、予算を考慮して決定される。
要求精度と標本数 標本数=(2÷目標精度)2 標本と母集団の間には調査結果に誤差がともなう。 この最大誤差(例:95%信頼区間)が要求精度。 これは調査担当者が任意に決める。 標本数=(2÷目標精度)2 例:目標精度が10%であれば標本数は400となる。
回収率と標本数との関係 50人と選び出しても、回収率を50%と予想したら、 100人必要になる。 回収率は過去のアンケートを参考に予想する。 要求精度に基づいた統計計算によって調査人数を 50人と選び出しても、回収率を50%と予想したら、 100人必要になる。 回収率は過去のアンケートを参考に予想する。 → 通常は20~70%の間
アンケート集計時の注意事項 1.回答内容のチェック ●無回答の多い調査票は、無効票として解析の対象 から除外する。 1.回答内容のチェック ●無回答の多い調査票は、無効票として解析の対象 から除外する。 (通常は、調査票の質問のうち半分または 1/3以上が無回答であるときに無効票とする。) 2.入力ミスのチェック ●はずれ値分析で桁数の誤りを検出できる。 ●入力内容は出来れば2人でのダブルチェックが望ましい。
アンケート調査のスケジュール例
豊能広域こども急病センターでアンケートに 応じていただいた保護者数と回収率 応じていただいた保護者数と回収率 保護者数(人) 回収率(%) 平成18年度 657 84.2
豊能広域こども急病センター受診時間帯と医師に対する満足度 日勤 準夜 深夜
受診時間帯と医師に対する満足度との関係 分散分析:5段階評価を 連続変数として解析 クラスカルワーリス解析: 5段階評価を順序変数として解析
受診患者年齢と医師に対する満足度との関係 関連性無し
御清聴ありがとうございました。