Download presentation
Presentation is loading. Please wait.
Published byひろみ みしま Modified 約 7 年前
1
2008/9/24 岡山県看護協会一般研修 資料 データ分析の基礎知識 統計的検定編 岡山商科大学商学部 商学科長・教授 田中 潔
2
統計手法の中で「検定(Test)」は医療統計でよく使われます。
薬効評価、効果判定のために用いられます 以前は、平均値を比較するパラメトリック手法が用いられましたが、最近ではノンパラメトリック検定が多く用いられています。
3
仮説検定の考え方を知る
4
統計的検定はどんなもの ある仮説(○=△)を判定する 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」
例: この実験結果=160.0 例: 群1の平均=群2の平均 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」 (厳密には仮説を認めたくないがやむを得ない) 棄却とは「この仮説を積極的に否定する」
5
看護に代表的な検定 t検定 ある測定データの平均値がある値かどうか 2群の平均は等しいとみなせるか カイ2乗検定
仮説: 測定データの平均値=46.7 2群の平均は等しいとみなせるか 仮説: 群1の平均=群2の平均 カイ2乗検定 クロス表に傾向や関連性があるか 仮説: このクロス表の度数は同じか
6
(統計的)仮説検定の流れ ある検定手法を選択する(パラでもノンパラでも) 帰無仮説H0:とは 対立仮説H1:とは
否定する(だろう)ための仮説 帰無=無に帰する=否定を期待する 対立仮説H1:とは 帰無仮説以外の結果 H0を否定するだけなので積極的な採択はしない H0:とH1:を対にして用意する 分析データを統計ソフトにかける→有意水準を求める 有意水準の値に応じてH0かH1かを判定する 目的に応じて手法はたくさん存在する
7
仮説の立て方 1.自分の持っている仮説(作業仮説ともいう)を対立仮説H1とする 2.H1の否定(逆)をH0とする
3.H0は○=△のように等号で作成するのがよい 4.H0:○=△とした時、3種類のH1が考えられる H1その1: ○>△ 片側検定 H1その2: ○<△ 片側検定 H1その3: ○≠△ 両側検定
8
仮説の事例 新薬Bは薬Aより効果あることを証明したい H0は等号関係で作成すると良い H1には3つの作り方あり
H0: 新薬B=薬A(同じ、効果なし) で決まり! H1には3つの作り方あり ① H1: 新薬B>薬A 効果ある 片側 ② H1: 新薬B<薬A 効果劣る 片側 ③ H1: 新薬B≠薬A 同じでない 両側 「効果ある」なので通常③を採用
9
仮説H1に方向性があるならば両側検定 関係があるかないか ない= ある≠ 両側検定 正(負)や大小の関係があるかないか ない= ある> 片側検定 優れている(劣っている) 同じ= <や> 片側検定 同じか否か 同じ= 同じでない≠ 両側検定
10
H0とH1の例 H0はハッキリと1点で指定するのが普通(点指定) H1は指定された1点以外のすべて(だからはっきりと値が判定できない) ○
H0: 日本人の平均160センチ 平均=160 H1: 160センチではない(何センチかは不明) H0はハッキリと1点で指定するのが普通(点指定) H1は指定された1点以外のすべて(だからはっきりと値が判定できない) ○ 残り全てがH0 H0
11
棄却と採択 H0が明らかに成立しないならば棄却
つまりH1を採用 H0は帰無したいがどうしても棄却できない状態のことを採択(=積極的には帰無・棄却しない)という つまりH0を採用する
12
検定に見る計算と判定 計算: 統計ソフトなどを使用する 判定: 出てくる結果の有意確率か有意水準の値により判定
計算: 統計ソフトなどを使用する 判定: 出てくる結果の有意確率か有意水準の値により判定 有意水準>0.05 有意水準5%以上で採択 0.5%以下ならば棄却された 0.05~0.01 5%有意 * 星1つ 0.01~0.005 1%有意 ** 星2つ 0.005より小 0.5%有意 *** 星3つ
13
まとめましょう 正規分布を仮定できそうな時 正規分布を仮定できそうでない時 仮説は次に固定すると理解し易い
平均値に関するt検定 正規分布を仮定できそうでない時 ノンパラメトリックな検定法 仮説は次に固定すると理解し易い H0: A=B H1:A≠B(両側検定) 計算は統計ソフトやWebサイトで行う 有意かどうかの判定は有意水準で行う
14
検定の実際に慣れる
15
統計ソフトについて 記述統計、グラフなどはエクセルで十分 検定、多変量分析となると専用ソフトが望ましい
市販ソフトとしては SPSS 高い、施設向き、論文投稿には望ましい。世界的権威ソフト 新規18万円 エクセル統計 4万円、エクセルのアドイン、おおむね使えるが細かな使い勝手はあまり良くない フリーソフト(無料) R 良くできているが上級者でまければ使いにくい!
16
医療統計向けソフト比較 http://www.kenkyuu.net/comp-soft-01.htmlより引用
17
2グループの平均値差検定 (通称t検定) 仮説は以下のとおりに立てる H0: 平均1=平均2(2つの平均は同じ)
H0: 平均1=平均2(2つの平均は同じ) H1: 平均1≠平均2(同じでない)→両側 注意 H0: 平均1≠平均2(同じでない) H1: 平均1=平均2(2つの平均は同じ) のように逆には立てない H0は等号関係で作ります!
18
パラメトリック検定 集めたデータが正規分布しそうな場合に適 検定力は強い 平均値と標準偏差に関する検定がおも
2群(実験群と対照群)の平均値差検定 =通称:t検定が有名
19
サイトで行う2群平均値差の検定(t検定) 次の2群の平均値は同じといえるか 平均 ケース数 標準 偏差 A群 10.0 10 5
平均 ケース数 標準 偏差 A群 10.0 10 5 B群 10.5 20 15 等分散性 0.002 棄却 2群は同じ分散ではない 平均値差 0.894 採択 平均値は等しい(差ない) 使用サイト 赤字部分は配布資料に誤りがありました。ここに訂正します。
20
ノンパラメトリック検定群 正規分布を仮定しない 検定力はパラメトリック検定にやや劣る 頑健な検定法 多いのは、平均値など代表値差の検定が多い
クロス表のカイ2乗検定もノンパラ検定法の1つ
21
パラメトリックvsノンパラ比較表
23
主な統計的検定法の体系図 (青木サイトより)
24
クロス表の独立性の検定 通称カイ2乗検定 実はノンパラメトリックな検定手法の1つです 2×2クロス表の精密なカイ2乗検定
R×C表 クロス表入力 通常版 R×C表 クロス表入力 正確計算版 (計算量が多いため通常版で十分) R×C表 素データで入力する版
25
代表的なノンパラメトリック検定法 対応のない2標本(群)の代表値差 対応のある2標本(群)の代表値差 マンーホイットニのU検定
2標本コルモゴロフースミロノフ検定 ファンデル・ワーデン検定 中央値検定 対応のある2標本(群)の代表値差 ウイルコクソン符号検定 ウイルコクソン符号付順位和検定
26
対応のあるデータ、ないデータ 対応ありと考えられる場合 同じ人やグループを追跡して測定 対応ないと考えられる場合
1回 2回 3回・・・ Aさん 1.0 1.5 2.0・・・ Bさん 1.2 1.7 2.2・・・ 対応ないと考えられる場合 毎回グループの構成者を取り替えて測定 岡山 東京 大阪 福岡・・・ 人口 生産額 学生数
27
対応のないk標本(群)の代表値差 クラスカル・ウォリス検定 中央値検定 対応のあるk標本(群)の代表値差 フリードマン検定
28
マンーホイットニ検定 2群、対応なし 9個の部品について4個は処置群、残り処置なし群とした。この2つの群の母代表値に差があるかどうか検定しなさい。 処置群の観察値 1.2,1.5,1.8,2.6 処置なし群の観察値 1.3,1.9,2.9,3.1,3.9
29
有意確率=0.142または0.190 有意確率>0.05なので有意差なし・採択 つまり両群に差は認められない
参考: つまり両群に差は認められない
30
ウイルコクソン符号検定 2群、対応あり 10 人の被検者について,五段階評価をした。同じ被検者に対して,1 年後にもう一度評価した。その結果を表 に示す。1 年間で母代表値に差があったかどうか検定しなさい 1 2 3 4 5 6 7 8 9 10 最 初 A A C B D A C B D B 1年後 C A E D B B D A E D
31
Wilcoxson符号検定の結果 正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない
正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない もしも計量値としてWilcoxsonの符号付順位検定を行ったならば、 漸近有意確率=0.114>0.05 採択 やはり 最初と1年後では差はない 分布計算
32
クラスカルーウォリス検定 3群以上、対応なし
12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえるか SPSS入力 表 1.餌の種類による肝臓の重量 A餌 3.42 3.84 3.96 3.76 B餌 3.17 3.63 3.47 3.44 3.39 C餌 3.64 3.72 3.91
33
H0: 平均1=平均2=平均3 H1: 3群の平均は同じでない 漸近有意水準0.062>0.005 棄却 結論: 3群の平均は同じではない ただ、有意水準6.2%と5%に近いことにも留意する 参考
34
フリードマン検定 3群以上、対応あり 表 1 のようなデータがある。4 種の肥料間で収量に差があるか
参考: 行列を入れ替えれば3品種間に差があるかを検定できる 表 1.フリードマン検定が対象とするデータ 肥料 品種 B1 B2 B3 B4 A1 9 17 12 16 A2 1 21 11 A3 7 19 6 9
35
漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると 漸近有意確率0.004<0.005
エクセル版 H0: 4群の平均は等しい H1: 4群の平均は等しくない 漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると H0: 3品種の平均は等しい H1: 等しくない 漸近有意確率0.004<0.005 ***0.5%有意→3品種の平均は異なる 総合的には、肥料、品種いずれも差あり
36
表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。
肥料 品種 B1 B2 B3 B4 A1 9 17 12 16 A2 1 21 11 A3 7 19 6 9 表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。 クロス表では行か列はそれぞれ要因。フリードマンでは行か列は標本(ケース)である。
37
まとめ・チェックリスト □ 統計的検定法の概念 □ 採択と棄却がわかる □ 帰無仮説と対立仮説 H0とH1
□ 統計的検定法の概念 □ 採択と棄却がわかる □ 帰無仮説と対立仮説 H0とH1 □ 計算は統計ソフトで、統計ソフトは色々 □ 時代はパラメトリックからノンパラへ □ ノンパラ検定にはたくさんの手法 □ 代表的ノンパラ検定の用法・読み方
38
研修講師のメモ 田中 潔(たなかきよし) 略歴: 岡山大、九州大修了の後商大へ勤務。助手、講師、助教授を経て現在教授。2008年より商学科長。 主な科目:情報システム論、情報ネットワーク論他 専門分野:計算機統計学、マーケティング 連絡先 岡山商科大学 〒 (番号で届く) 検索エンジン 「岡山商科大学 田中潔」 大学電話 大学FAX
39
研修後に相談があれば データ分析相談は随時応ずるが、エクセルに素データを入力しておくのが望ましい また希望する仮説も事前に固まっている方がスムーズに進む。 遠方の場合メールだけで指導する場合もある
40
より大規模な分析体制 施設からの応需制度として大学では産学官連携センター受付による受託研究や共同研究などの制度もあり。
おおむね1件1年50万円程度から受託し、担当者も指定可。 例:「アミューズメントにおけるマーケティング研究」パチンコ業受託2007、08年
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.