臨床統計入門(1) 箕面市立病院小児科 山本威久 平成23年10月11日
臨床統計の基礎知識 1、数値の意味が違う? 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 4、何を統計解析で証明したいのか? 5、統計学的に有意(P値)の基準。
統計での数の考え方 区別が必要 この2つは区別しなくても良い。 2つまとめて連続変数
田部井明美:SPSS完全活用法、AMOSによるアンケート処理 統計での数の考え方(名義尺度) 田部井明美:SPSS完全活用法、AMOSによるアンケート処理
統計での数の考え方(順序尺度)
統計での数の考え方(間隔尺度)
統計での数の考え方(比例尺度)
統計での数の考え方(まとめ)
臨床統計の基礎知識 1、数値の意味が違う? 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 4、何を統計解析で証明したいのか? 5、統計学的に有意(P値)の基準。
臨床統計の基礎知識 1、数値の意味が違う? 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 4、何を統計解析で証明したいのか? 5、統計学的に有意(P値)の基準。
数の分布と統計量 正規分布 非正規分布 人数 人数 (釣り鐘型) 中央値 身長 X 平均値 平均値、分散がはっきりしている 中央値の方が意味がある
平均値、中央値 平均は1638万円 内田学、兼子良久:仕事が10倍速くなる! 統計学の生かし方
平均値、中央値、最頻値 Mean 平均値 総和/サンプル数 数値データで分布が対称性の場合に用いる。 Median 中央値 データの大きさの順に並び替えた時、真ん中の値 (50%点) 順序変数や数値データでも分布が対称でない 場合に用いる。 Mode 最頻値 もっとも度数(頻度)が高い値。 モードはbimodal distributionの場合に用いる。
分散、標準偏差、標準誤差 Variance : V 分散 ---ばらつきの要約値 ={[データxi]と[平均X]の差(偏差)}の2乗した総和を、 [データ数n-1]で割った値。 Standard deviation : SD 標準偏差 ---データが、その平均からどれだけ広い範囲にばらついているか を示す。 正規分布の場合は、グラフの変曲点。 =[分散V]の正の平方根 Standard error of MEAN : SE (SEM) 平均値の標準誤差 ---データの平均がどのあたりにばらついているかを示す。 =[標準偏差SD]を[データ数n]で割った値。 (標準誤差はデータ数に依存するので、必ずデータ数を記載する。)
臨床統計の基礎知識 1、数値の意味が違う? 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 4、何を統計解析で証明したいのか? 5、統計学的に有意(P値)の基準。
2つの仮説 帰無仮説:統計学で否定したい仮説 対立仮説:今回証明したい仮説 証明したいこと(対立仮説) 血中コレステロールの値は動脈硬化と関係する。 統計ですること(帰無仮説) 血中コレステロールの値は動脈硬化と無関係。
統計学はへそ曲がり!!! 統計ですること(帰無仮説) 血中コレステロールの値は動脈硬化と関係しない。 対立仮説を証明する。 血中コレステロールの値は動脈硬化と関係しない。 対立仮説を証明する。 血中コレステロールの値は動脈硬化と関係する。
例:発表の中で、“多いように思います。少ないように思います” は個人的な見解で科学的に証明されていない!! 統計解析で何を知りたい? 自分の身の回りで観察したことが 一般的に応用できるか? 例:発表の中で、“多いように思います。少ないように思います” は個人的な見解で科学的に証明されていない!!
自分の身の回りで観察したこと (標本集団) 一般的に応用できるか? (母集団で統計的に考える)
統計解析で何を知りたい?
臨床統計の基礎知識 1、数値の意味が違う? 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 数にもいろいろある! 2、グラフの種類 3、数値の分布が統計には重要! 4、何を統計解析で証明したいのか? 5、統計学的に有意(P値)の基準。
統計学的に有意(P値)の基準 P<0.05:普通の基準 証明したい仮説が95%の確率で 正しい可能性があること。
有意差の基準は? P<0.05:普通の基準 P<0.01:やや高い基準 P<0.001:かなり高い基準 結果が常識的に説明できる場合には意味がある。 P<0.01:やや高い基準 普通は、この値であれば十分意味があると考えられる。 P<0.001:かなり高い基準 結果がかなり新しい内容であっても意味がある可能性 があるもの。
御清聴ありがとうございました。