第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p i は 1/6 H 0 :p 1 = ・・・ =μ 6 =1/6 対立仮説:サイコロは歪んでいる H 1 :p 1 ≠ ・・・ ≠ p 6 有意水準 5% で検定 サイコロの目 期待値: 60 回中 (E i ) 教科書 p122~141
ポアソン分布 =m 2 項分布 m=np σ 2 =np(1-p) n: 大 p: 小 計数値の分布 TT T :計測時間 X :計測数 時間
サイコロの目 (i) 観測度数 : 実験値 (O i ) 期待値: 60 回中 (E i ) 期待値からのズレ具合? 自由度 n-1 の χ 2 (カイ 2 ジョウ)分布 m ;自由度
χ 2 (カイ 2 ジョウ)分布 z i :標準正規分布
自由度 df=5 x=χ 2 =8.8 π x ≧ 8.8 > α 帰無仮説を棄却できない χ 2 α=5% =11.07 χ 2 =8.8
問題例2 ある臓器の癌の症例をその組織型( A 1,A 2,A 3 )と主たる 転移巣( B 1,B 2,B 3 )によって分類した。癌の種類と転移巣 の間に一定の傾向があると判断してよいか。 B 1 B 2 B 3 計 A A A 計 帰無仮説:癌の種類と転移巣の間に一定の傾向はない H 0 : 周辺度数にのみ従うイベント 対立仮説:癌の種類と転移巣の間に一定の傾向がある H 1 : 周辺度数にのみ従うイベントとは言えない 有意水準 5% で検定
l×m 分割表 B 1 B 2 ・・・ B m 計 A 1 O 11 O 12 ・・・ O 1 m R 1 A 2 O 21 O 22 ・・・ O 2 m ・・・・・・・ ・・ O ij ・・・・ A l O l 1 ・・・・ O lm R l 計 C 1 C m N H 0 :要因 A 、要因 B が互いに無関係ならば、周辺度数(要因の計)のみに依存する。 B 1 B 2 ・・・ B m 計 A 1 E 11 E 12 ・・・ E 1 m R 1 A 2 E 21 E 22 ・・・ E 2 m ・・・・・・・ ・・ E ij ・・・・ A l E l 1 ・・・・ E lm R l 計 C 1 C m N O ij :観測データ 期待値: E ij = R i ×C j N 自由度 df=(l-1)(m-1)
B 1 B 2 B 3 計 A A A 計 B 1 B 2 B 3 計 A A A 計 自由度 df=(l-1)(m-1)=(3-1)(3-1)=4 χ 2 α=5% =9.488 χ 2 =17.09 π x ≧ < α 帰無仮説を棄却
問題例3 ある疾患には小児型と成人型があるという、その疾患を持つ患者 にある抗体反応テストをし、陽性か陰性を調べたものである。 小児型成人型計 陽性 陰性 計 小児型と成人型で抗体反応に差があるといってよいか。有意水準 5% イベント数が少ない 期待度数の分散が大きめになる 小児型成人型計 陽性 陰性 計 E ij = R i ×C j N 期待値: 期待度数に 5 以下がある場合 Fisher の直接確率計算法
B 1 B 2 計 A 1 abR 1 A 2 cdR 2 計 C 1 C 2 N この結果になる確率 p ① 小児型 成人型 計 陽性 陰性 計 ② 小児型 成人型 計 陽性 陰性 計 ③ 小児型 成人型 計 陽性 陰性 計 まれな結果 上側確率 p=p 1 +p 2 +p 3 = = π Ei ≦5 < α 帰無仮説を棄却
演習 6.1 日本のある年の人口の年齢構成比が分かっている。ある調査のために 2000 名 を無作為に選び、年齢区分毎の人数を調べた。 年齢構成比に偏りがないといえるか。有意水準 5% で検定しなさい。 演習 6.2 ある症状を持つ患者の生年月日の季節的分布を見たところ 春夏秋冬 度数 であった。その症状発生に季節的な偏りがあるといえるか。 有意水準 5% で検定しなさい。 演習 6.3 ある病気を持つ患者 140 名を無作為に 2 群に分け、 A,B2 種の方法で治療した。 一定期間後の生存・死亡数を比較した。 AB 生存 4824 死亡 3236 治療法により生存率が異なるといえるか。有意水準 5% で検定しなさい。