法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田 尤度・尤度比・事前確率 法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田
臨床検査と尤度・尤度比 検査値が高いと「病気である」と診断 検査値が低いと「病気ではない」と診断
病気Xの診断をするために 検査Tを実施する Tが陽性 Tが陰性 Xである a b s Xではない c d t u v 1 a/s : 病気であるときの検査の陽性率(感度) d/t : 病気でないときの検査の陰性率(特異度) a/u : 検査が陽性のときに病気である確率(PPV) d/v : 検査が陰性のときに病気でない確率(NPV) s : 対象集団のうちの病気である割合(病気である事前確率) t : 対象集団のうちの病気でない割合(病気でない事前確率)
受診した、検査した 検査が陽性だった a b s c d t u v 1 病気であったとしたら a/s の確率で陽性になる Xである a b s Xではない c d t u v 1 受診した、検査した 検査が陽性だった 病気であったとしたら a/s の確率で陽性になる 感度 病気であるという仮説の下での尤度 病気でなかったとしたら c/t の確率で陽性になる 1-特異度 病気でないという仮説の下での尤度 尤度の比 (a/s) / (c/t) = (at)/(cs) 病気である・病気でない の事前確率を等しいとした場合
検査した、診断する 検査が陽性だった a b s c d t u v 1 病気である確率は a/u 病気でない確率は 1-a/u=c/u Xである a b s Xではない c d t u v 1 検査した、診断する 検査が陽性だった 病気である確率は a/u 「Xであると診断」する確率 PPV 病気でない確率は 1-a/u=c/u 「Xではないと診断」する確率 1-PPV
検査した、診断する 検査が陽性だった a b s c d t u v 1 病気である確率は a/u 病気でない確率は 1-a/u=c/u Xである a b s Xではない c d t u v 1 検査した、診断する 検査が陽性だった 病気である確率は a/u 病気でない確率は 1-a/u=c/u 比をとる → 尤度比 a/c =(s x a/s) / (t x c/t) s x a/s : (病気である事前確率) x (病気である仮説での尤度) t x c/t : (病気でない事前確率) x (病気でない仮説での尤度) 事前確率を持ち込んだ尤度比 事前確率を等しいとした尤度比は (a/s) / (c/t)
2つの診断 高いPPV : a/u 高いNPV : d/v a b s c d t u v 1 「病気Xです」と診断 『ルール・インする』 『ルール・アウトする』
病気Xの診断をするために 検査Tを実施する Tが陽性 Tが陰性 Xである a b s Xではない c d t u v 1
Aさんが、夫婦Xの子xであるかどうか x A ジェノタイプが一致する? Aのジェノタイプ Aのジェノタイプ以外のジェノタイプ b s 一般人のジェノタイプ c d t u v 1 x A
Aさんが、夫婦Xの子xであるかどうか x A a/s, b/s は計算できる → 感度の計算が可能 確率 Aのジェノタイプ Aのジェノタイプ以外のジェノタイプ Xの子xのジェノタイプ a b s 一般人のジェノタイプ c d t u v 1 a/s, b/s は計算できる → 感度の計算が可能 c/t, d/t も計算できる → 特異度の計算が可能 尤度比 (a/s)/(c/t) は計算できる 判断のためのPPV,NPVはs,t(事前確率)を与えないと計算できない x A
2つの判定 x A AさんはX夫婦の子供である AさんはX夫婦の子供ではない a b s c d t u v 1 PPV : a/u で判断 NPV : d/v で判断 x A
判定例 x A xのDNAが得られている場合 s c d t u v 1 a=s, b=0 Aさんのジェノタイプがxさんのそれと一致すれば Xではない c d t u v 1 判定例 xのDNAが得られている場合 a=s, b=0 Aさんのジェノタイプがxさんのそれと一致すれば PPV : a/u = s/u = s/(s+ct) で「A=x」と判断 Aさんのジェノタイプがxさんのそれと一致しなければ NPV : d/v = d/d = 1 で「Aさん以外の人がxである~Aさんはxではない」と判断 事前確率s,t によらない x A
判定例 2 x A xのDNAが得られていない場合 a b s c d t u v 1 a/s はそこそこ小さく、b/s はそれなりに大きい 判定例 2 xのDNAが得られていない場合 a/s はそこそこ小さく、b/s はそれなりに大きい c/t はかなりちいさく、d/t はそれなりに大きい PPV は大きくなりえるが Aさんがxさんであるという判定はできるが NPV は大きくなりにくい Aさんがxさんではない、という判定は難しい x A
どれくらいのPPVが必要? PPV : a/u (事前確率込み) a b s c d t u v 1 Tが陽性 Tが陰性 Xである
診断する、治療する 診断名の重みで必要なPPV, NPVが変わる 治療の判断は、診断があいまいなまま、行える(行う) 心筋梗塞 急性腹症 肺がん 片肺摘出は「確定診断」がついてから
PPVの大きさの基準は 判断後の行動が左右する DNA鑑定という判断後の行動とは? 「親子なのか、そうでないのか」 「犯人なのか、そうでないのか」 どのレベル? 酸素吸入? 試験開腹? 肺切除?
もう少し臨床診断に即して 考えてみる
臨床診断 H1:「Aさんは病気Xである」 H2:「Aさんは病気Xではない」 仮説は2つしかない 尤度とその比 H1∪H2 = Ω 事前確率を均等に (a/s) / (c/t) = (at)/(cs) 事前確率を持ち込んで a/c =(s x a/s) / (t x c/t)
少し複雑にする
AさんとBさんとが受診した H1:「Aさんが病気X、Bさんも病気X」 H2:「Aさんは病気X、Bさんは病気Xではない」 事前確率は? H1=H2=H3=H4=1/4 ?? H1=ss,H2=H3=st,H4=tt ??
Aさんは男、Bさんは女 A(男)用 Tが陽性 Tが陰性 Xである a b s Xではない c d t u v 1 B(女)用 Tが陽性 事前確率は H1=ss’, H2=st’, H3=s’t, H4=tt’
Aさんが受診した 病気Xの検査Txと病気Yの検査Ty H1:「Aさんが病気Xであり、病気Yでもある」 H2:「Aさんは病気Xであり、病気Yではない」 H3:「Aさんは病気Xではなく、病気Yである」 H4:「Aさんは病気Xではなく、病気Yでもない」 事前確率は? H1,H2,H3,H4
Aさんが受診した 病気Xの検査Txと病気Yの検査Ty b s Xではない c d t u v 1 Y用 Tyが陽性 Tが陰性 Yである a’ b’ s’ Yではない c’ d’ t’ u’ v’ 1
Aさんが受診した 病気Xの検査Txと病気Yの検査Ty H1:「Aさんが病気Xであり、病気Yでもある」 H2:「Aさんは病気Xであり、病気Yではない」 H3:「Aさんは病気Xではなく、病気Yである」 H4:「Aさんは病気Xではなく、病気Yでもない」 事前確率は H1 : H2 : H3 : H4 = 0 : st’ : s’t : tt’
Aさん、Bさん、2人のXの診断は独立して下した 2人のための確率計算表は異なった 1人の人に考えられる複数の診断名は相互に独立していなかった 事前確率が0の仮説があった
DNA鑑定という判断 いくつかの例を
取り違え事件 夫婦Xの子x 夫婦Yの子y 親がわからなくなった子供AとB
個人識別のためのテスト xさん/yさんのジェノタイプは確率的に予想される Aのジェノタイプである確率 p(A=x) 1 Bのジェノタイプである確率 p(B=x) Bのジェノタイプではない確率 1-p(B=x) y用 Aのジェノタイプである確率 p(A=y) Aのジェノタイプではない確率 1-p(A=y) 1 Bのジェノタイプである確率 p(B=y) Bのジェノタイプではない確率 1-p(B=y)
取り違え事件 夫婦Xの子x 夫婦Yの子y 子供AとB A=x A=y B=x H1: A=x & B=x H2: A=y & B=x B=y A=x & B=y H4: A=y & B=y
取り違え事件 夫婦Xの子x 夫婦Yの子y 子供AとB A=x A=y B=x H1: A=x & B=x H2: A=y & B=x B=y A=x & B=y H4: A=y & B=y 事前確率は H1 = H4 = 0 H2=H3 = 0.5 『割り付け』するときには あり得ない仮説がある
取り違え事件 事前確率込みの尤度の比較 事前確率は H1 = H4 = 0 H2=H3 = 0.5 H1 = 0 H2 = P(A=x)P(B=y) H3 = P(A=y)P(B=x) H4 = 0 A=x A=y B=x H1: A=x & B=x H2: A=y & B=x B=y H3: A=x & B=y H4: A=y & B=y
取り違え事件 事前確率込みの尤度の比較 事前確率は H1 = H4 = 0 H2=H3 = 0.5 H1 = 0 H2 = P(A=x)P(B=y) H3 = P(A=y)P(B=x) H4 = 0 尤度比としていくつが適当?
PPVの大きさの基準は 判断後の行動が左右する DNA鑑定という判断後の行動とは? 「親子なのか、そうでないのか」 「犯人なのか、そうでないのか」 どのレベル? 酸素吸入? 試験開腹? 肺切除?
取り違え事件 事前確率は H1 = H4 = 0 H2=H3 = 0.5 事前確率込みの尤度の比較 H1 = 0 H2 = P(A=x)P(B=y) H3 = P(A=y)P(B=x) H4 = 0 尤度比としていくつが適当? P(A=x)P(B=y) : P(A=y)P(B=x) 自分なら、いくつの値で決断するか 決断に困ったら・・・現実的に考えるために 「値段で考えてみる」というのも一つのやり方 尤度比100なら10万円 尤度比1000なら100万円 尤度比10000なら1000万円 尤度比100000なら1億円・・・かかるとしたら、どこで手を打つ?
取り違え大事件 夫婦X1の子x1 夫婦X2の子x2 ...全部でN夫婦のN人の子 親がわからなくなった子供A1,...,AN
個人識別のためのテスト xiさんのジェノタイプは確率的に予想される p(A1=x1) 1-p(A1=x1) p(A2=x1) ・・・・・・・・・ ・・・・・・・・・・・・ x2用 p(A1=x2) 1-p(A1=x2) 1 p(A2=x2) 1-p(A2=x2) ・・・・・・・・・ ・・・・・・・・・・・・ x3用 p(A1=x3) 1-p(A1=x3) 1 p(A2=x3) 1-p(A2=x3) ・・・・・・・・・ ・・・・・・・・・・・・
いろんな割り付けがある A1=x1 A2=x1 のような割り付けは許されないので、書くのを省略する 許されない割り付けを書かないのは、『事前確率が0だから』 A1 A2 A3 ... AN H1 X1 X2 X3 XN H2 H3 HN! XN-1 XN-2
Xi = Aj であるかどうかの判断はどうしたらよいか ... AN H1 X1 X2 X3 XN H2 H3 HN! XN-1 XN-2 どの割り付けが最も適当か? Xi = Aj であるかどうかの判断はどうしたらよいか 大規模災害時の割り付け問題(前回・前々回の話)
取り違え大事件 N人のうち、xj である尤度が一番大きく、それ以外の尤度のすべてを併せたものと比べて、L倍だったら、信じよう L1=尤度(Ai = xj, あとの組合せはなんでもあり) L2=尤度(Ai != xj, あとの組合せは相変わらず何でもあり) L1 : L2 尤度比としていくつが適当? N人のうち、xj である尤度が一番大きく、それ以外の尤度のすべてを併せたものと比べて、L倍だったら、信じよう どれくらいの L が必要?
PPVの大きさの基準は 判断後の行動が左右する 「取り違え事件」と「取り違え大事件」とでは、判断後の行動は同じなのでは?
取り違え大事件 判断後の行動が同じなら、 L は同じでよいのでは??
島の子ザル 絶海の孤島 ボス(雄)ザルが倒れ序列が崩壊 N頭の雄ザル 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か! 1頭だけ、『血統書付き』 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か!
島の子ザル 雄ザルのDNA 『血統書付き』の雄ザルのDNAはある それ以外はマーカーの『頻度』だけ 事前確率 すべての雄ザルが 1/N
島の子ザル 雄ザル S1,S2,...,SN S 1:血統書付き 尤度比 子ザルのジェノタイプの子が産まれる確率 p(1) : (N-1)p(2) 雄ザル 子ザルのジェノタイプの子が産まれる確率 S1 p(1) S2 p(2) S3 P(3) = P(2) ... SN P(N) = P(2)
島の子ザル 雄ザル 個体別の尤度比 個体別の尤度比として、どれくらいの大きさで納得するか 「取り違え事件」の1/N ? p(1) : p(2) 個体別の尤度比として、どれくらいの大きさで納得するか 「取り違え事件」の1/N ? 雄ザル 子ザルのジェノタイプの子が産まれる確率 S1 p(1) S2 p(2) S3 P(3) = P(2) ... SN P(N) = P(2)
島の子ザル 実は すべての雄ザルと雌ザルには「GPS」がつけられていて、「近くに居た時間」が計測されていた! 近くに居た時間に比例して『事前確率』を変更しよう! GPS搭載のウミガメ
父親鑑定
島の子ザル 絶海の孤島 ボス(雄)ザルが倒れ序列が崩壊 N頭の雄ザル 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か! 1頭だけ、『血統書付き』 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か!
日本列島の子 絶海の孤島 N人の候補者 1人だけ、『お墨(戸籍)付き』 父親は『お墨付き』か否か!
日本列島の子 候補者のDNA 事前確率 『お墨付き』候補者のDNAはある それ以外はマーカーの『頻度』だけ すべての候補者が 1/N ??? ~5000万(半数) ? ~4000万(成人男性) ?
日本列島の子 実は 近くに居た時間に比例して『事前確率』を変更しよう! すべての候補者と母親には「GPS」がつけられていて、「近くに居た時間」が計測されていた!!! 近くに居た時間に比例して『事前確率』を変更しよう!
日本列島の子 候補者個体別の尤度比は計算できる さすがに、GPS記録はないけれども・・・ それに準じて、事前確率の重みはつけられるか・・・ p(1) : p(2) さすがに、GPS記録はないけれども・・・ それに準じて、事前確率の重みはつけられるか・・・
GPS記録はないけれども・・・ 事前確率 事前確率「込み」での尤度比が L なら信用するのなら、 妊娠時期の見積もりずれが30-60日??として N~30-60?? (単位は『日』) N~30-60 x 24 (単位は『時間』) N~30-60 x 24 x 60 (単位は『分』) 『近くに居た時間』という重みづけは、もう少し、考えられそう 事前確率「込み」での尤度比が L なら信用するのなら、 Lは2体取り違えと大差ない・・・?
GPS記録はないけれども・・・ N~30-60?? 事前確率「込み」での尤度比が L なら信用するのなら、 要求される候補者個体別の尤度比 p(1) / p(2) は p(1) / (p(2)xN) = L p(1) / p(2) = NxL
今日はここまで
次回? マルチプルテスティング問題 ペテン師団が 手を変え品を変えて、100人を候補者として順繰りに送り込んできて、100人目で「当たった」とする
次回? マルチプルテスティング問題 カタログと照合するときのこと そのときの尤度・尤度比の評価 それらしいカタログ、それらしくないカタログ 事前確率の高いカタログ、そうでもないカタログ そのときの尤度・尤度比の評価 カタログの大きさ(母集団に占めるカタログ上サンプルの比率)の影響・・・
肉親を求めて 記憶喪失で発見された。天涯孤独? いとこはいそうだ
肉親を求めて 事前確率は 1/N : Nは人口? 可能性のあるジェノタイプは K 種類、それぞれの確率はpi, i=1,2,...,K 世界でそれぞれのジェノタイプの頻度はqi 尤度が pi の人が Nxqi 人
肉親を求めて ペテン師が登場 ペテン師のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 その100人のジェノタイプが、一般集団に占める割合を ti, i=1,2,...,100 ペテン師のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える?
肉親を求めて H1 ペテン師のリストに本当のいとこが含まれている H2 ペテン師のリストに本当のいとこが含まれていない
肉親を求めて H1 H2 ペテン師のリストに本当のいとこが含まれている 100人のうち1人が「本物」で、残りの99人を「偽物」とした上で、すべての場合について、生起確率を計算して合算する L1 = Σi ri Πj != i tj H2 ペテン師のリストに本当のいとこが含まれていない 100人のうち全員の100人を「偽物」とし、N-100人の中の1人がいとこである、生起確率を計算して合算する L2 = Πj tj L1/L2 = Σi ri / ti
肉親を求めて 『親切な人』が登場 『親切な人』のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 『親切な人』のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 『ペテン師』と『親切な人』の差は リストに含まれている、と信じる「事前確率」が異なること ペテン師の場合、100/N 親切な人の場合、 >100/N 『親切』な程度の『根拠』に応じて事前確率を上げる
熟考すべきは 事前確率か