藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
2008/9/24 岡山県看護協会一般研修 資料 データ分析の基礎知識 統計的検定編 岡山商科大学商学部 商学科長・教授 田中 潔.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子 基本的な統計 ー簡単な分析統計ー 藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子 製作者:柿崎真沙子

基本的な統計 分析統計とは 検定の流れ 検定の例 製作者:柿崎真沙子

分析統計 偶然なのかそうでないかを判断する 帰無仮説をたて、それが採択されるか棄却されるかを判断する 製作者:柿崎真沙子

検定の流れ   ① 設 問   ② 仮説の設定   ③ 統計手法の選択   ④ 統計量を求める   ⑤ 確率Pを求める   ⑥ 判 定 製作者:柿崎真沙子

例)2群の平均値の違いを求める チームAとチームBの平均年齢に違いはあるか? どうやって検討したらいいだろうか? 製作者:柿崎真沙子

検定の例(独立2群の差の検定) 例:チームAとチームBの年齢について、両群間に差があると考えて良いか。 (※架空のデータです) チームA 20 24 25 28 23 18 22 26 27 29 17 例:チームAとチームBの年齢について、両群間に差があると考えて良いか。 (※架空のデータです) 製作者:柿崎真沙子

検定の流れ   ① 設 問   ② 仮説の設定   ③ 統計手法の選択   ④ 統計量を求める   ⑤ 確率Pを求める   ⑥ 判 定 製作者:柿崎真沙子

①設問 チームAとチームBの年齢平均値に差がある これを検証したい仮説H1とする 製作者:柿崎真沙子

②帰無仮説の設定 帰無仮説(H0): 検討したい仮説(H1) : 帰無仮説(H0) : 「差がない」「効果がない」といった検討したい仮説(差がある、効果がある)と逆の仮説 この仮設を棄却する(=棄てる)ことで、「差がある」「効果がある」ということができる 検討したい仮説(H1) : チームAとチームBの年齢平均値に差がある(H1) 帰無仮説(H0) : 年齢平均値に差がないと仮定 製作者:柿崎真沙子

③統計手法の選択 帰無仮説(H0) :年齢平均値に差がない つまり2標本の平均値の差を検定する 年齢=正規分布 平均値の差 →統計手法は二標本t検定 製作者:柿崎真沙子

どのような統計手法を選択するか データの性質とデータの分布から統計手法を選択する データの性質 データの分布 カテゴリー変数(名義尺度、順序尺度) 連続変数(間隔尺度、比尺度) データの分布 パラメトリック:データの分布を仮定する ノンパラメトリック:分布を仮定しない 製作者:柿崎真沙子

データの種類と要約値の種類 意味 例 要約値 演算 カテゴリー変数 順序尺度 大小関係にのみ意味がある 順序にも意味がある 薬効 度数 最頻値 中央値 大小の比較 名義尺度 区別することに意味がある 疾患名 血液型 演算不可 連続変数 間隔尺度 数値の差のみに意味がある 温度 日付 平均値 加法 減法 比尺度 数値の差と比に意味がある 年齢 身長 乗法 除法 製作者:柿崎真沙子

データの分布と統計手法 パラメトリック検定: ノンパラメトリック検定: 統計学的パワーは高い(効率的) 分布などで適応と禁忌がある 計算可能ならデータ数は少なくてもよい ノンパラメトリック検定: 数値よりも順序・順位に基づくデータ処理 適応と禁忌はないに等しい パワーは弱まる(保守的) 検定可能な最小データ数が問題になる 製作者:柿崎真沙子

パラメトリック検定代表 t検定が使える条件 連続変量・数量によるデータであること 正規分布すること※(対数処理などによる正規化を含む) 等分散であること これらの条件を満たさなければ、 ノンパラメトリックな検定手法を 例)Mann-Whitney 検定:順位の群間差 ※正規性の検定には、D’Agostino & Pearson omnibus normality test Shapiro-Wilk normal test、Kolmogorov–Smirnov testなどがある。 製作者:柿崎真沙子

④統計量を求める 計算する統計量は、使用する統計方法によってすべて異なる t検定で必要な統計量tを求める t検定→t値 F検定→F値 カイ二乗検定→χ2値 Mann-Whitney U検定→U値 t検定で必要な統計量tを求める t検定の場合、平均値の差(x1-x2)に2群の差が要約されていると考える まずはデータを要約し、データ数と平均値、標準偏差、平均の差を出してみる 製作者:柿崎真沙子

④統計量を求める データの要約 A B データ数 平均値 分散 標準偏差 平均の差 チームA チームB 20 24 25 28 23 22 21 26 27 18 29 17 データの要約 A B データ数 15 平均値 22.93 24.80 分散 12.495 5.314 標準偏差 3.535 2.305 平均の差 1.867 (※架空のデータです) 製作者:柿崎真沙子

√ ④統計量を求める t検定で必要な統計量tを求める |2群の平均値の差| 統計量t= S√ 1 1 + n m n:Aのデータ数 m:Bのデータ数 S:両群の分散から求めた合成分散 S√ 1 n + 1 m √ 分散A(n-1)+分散B(m-1) S= (n-1)+(m-1) 製作者:柿崎真沙子

√ ④統計量を求める t検定で必要な統計量tを求める 12.495(15-1)+5.314(15-1) S= =2.984084768 15+15-2 |22.93-24.8| 統計量t= = 1.86667 =1.713114 S√ 2.98408×0.36515 1 15 + 1 15 製作者:柿崎真沙子

⑤確率P( P値、P value )を求める H0のもと、平均の差の生じる確率Pを求める 確率P(P値、P value) 通常この確率が5%未満 (P<0.05)であれば、帰無仮説(H0)は棄却され、対立仮説(H1)が採用される t検定における確率Pは、平均の差をその標準誤差で標準化すると、自由度n+m-2のt分布に従うことを利用して求める t値を自由度n+m-2としてt分布表で調べる 製作者:柿崎真沙子

⑤確率Pを求める 自由度=標本数ーパラメーター数 今回の場合自由度=標本数ーグループ数 =30ー2=28        =30ー2=28 使用する統計手法により参照する分布表は異なる F検定→F分布 カイ二乗検定→χ2分布 Mann-Whitney U検定→標準正規分布 製作者:柿崎真沙子

t分布表 P df 0.10 0.05 0.01 0.001 1 6.3138 12.706 63.657 636.62 15 1.7530 2.1315 2.9467 4.073 2 2.9200 4.3027 9.9248 31.598 16 1.7459 2.1199 2.9208 4.015 3 2.3534 3.1825 5.8409 12.941 17 1.7396 2.1098 2.8982 3.965 4 2.1318 2.7764 4.6041 8.610 18 1.7341 2.1009 2.8784 3.922 5 2.0150 2.5706 4.0321 6.859 19 1.7291 2.0930 2.8609 3.883 6 1.9432 2.4469 3.7074 5.959 20 1.7247 2.0860 2.8453 3.850 7 1.8946 2.3646 3.4995 5.405 21 1.7207 2.0796 2.8314 3.819 8 1.8595 2.3060 3.3554 5.041 22 1.7171 2.0739 2.8188 3.792 9 1.8331 2.2622 3.2498 4.781 23 1.7139 2.0687 2.8073 3.767 10 1.8125 2.2281 3.1693 4.587 24 1.7109 2.0639 2.7969 3.745 11 1.7959 2.2010 3.1058 4.437 25 1.7081 2.0595 2.7874 3.725 12 1.7823 2.1788 3.0545 4.318 26 1.7056 2.0555 2.7787 3.707 13 1.7709 2.1604 3.0123 4.221 27 1.7033 2.0518 2.7707 3.690 14 1.7613 2.1448 2.9768 4.140 28 1.7011 2.0484 2.7633 3.674 製作者:柿崎真沙子

t分布表 P df 0.10 0.05 0.01 0.001 1 6.3138 12.706 63.657 636.62 15 1.7530 2.1315 2.9467 4.073 2 2.9200 4.3027 9.9248 31.598 16 1.7459 2.1199 2.9208 4.015 3 2.3534 3.1825 5.8409 12.941 17 1.7396 2.1098 2.8982 3.965 4 2.1318 2.7764 4.6041 8.610 18 1.7341 2.1009 2.8784 3.922 5 2.0150 2.5706 4.0321 6.859 19 1.7291 2.0930 2.8609 3.883 6 1.9432 2.4469 3.7074 5.959 20 1.7247 2.0860 2.8453 3.850 7 1.8946 2.3646 3.4995 5.405 21 1.7207 2.0796 2.8314 3.819 8 1.8595 2.3060 3.3554 5.041 22 1.7171 2.0739 2.8188 3.792 9 1.8331 2.2622 3.2498 4.781 23 1.7139 2.0687 2.8073 3.767 10 1.8125 2.2281 3.1693 4.587 24 1.7109 2.0639 2.7969 3.745 11 1.7959 2.2010 3.1058 4.437 25 1.7081 2.0595 2.7874 3.725 12 1.7823 2.1788 3.0545 4.318 26 1.7056 2.0555 2.7787 3.707 13 1.7709 2.1604 3.0123 4.221 27 1.7033 2.0518 2.7707 3.690 14 1.7613 2.1448 2.9768 4.140 28 1.7011 2.0484 2.7633 3.674 製作者:柿崎真沙子

⑤確率Pを求める 有意水準0.05、自由度28の時のt値(t0.05)は 2.0484 有意水準0.10、自由度28の時のt値(t0.1)は  2.0484 有意水準0.10、自由度28の時のt値(t0.1)は  1.7011 今回求めたt値(t)は  1.713 つまり 0.05<P<0.10 DF/P 0.10 0.05 0.01 0.001 28 1.7011 2.0484 2.7633 3.674 製作者:柿崎真沙子

⑥判定 Pが有意水準αより大きい Pが有意水準αより小さい 今回の有意水準は0.05で、求めたP>0.05 帰無仮説を棄却できない H0を棄却し、H1を採用 今回の有意水準は0.05で、求めたP>0.05 つまり①帰無仮説を棄却できない 2群の平均年齢に差があるとは言えない 製作者:柿崎真沙子