法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮 決断するための情報 法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮
DNA鑑定と決断
DNA鑑定と決断 決断とは?
どちらにしようかな 天の神様の言うとおり
決めた!
婚活
こっちにしようかな?
こっちにしようかな? 決めた!
こっちにしようかな? 決めた!
尽きない悩み
~決断理論~
~決断理論~ イントロダクション だけど 328ページ
~決断理論~ 哲学 経済学 心理学 数学
『最適な決断戦略』 「情報がないなら、ないなりに、あるなら、あるなりに」 「確率的に決断」しよう それが「長い目」で見たときの、『最適戦略』 生物進化、ギャンブル… Multi-armed bandit problem, Thompson sampling
裏を返すと…
情報があっても 確率的に決断するしかない 最後の決断は 個人に任せて 個人によって決断が割れてもよい
決断するための情報 法数学の役割
決断するための情報 法数学の役割 決断したい人の 役に立つような情報を 使い方指南も含め 利用しやすい形で 情報提供
× 決断 情報 事前●● 事後●●
× 決断 データ × 解釈 事前●● 事後●●
法数学勉強会@京都大学 2010年~ 2010年8月 仮説空間について 2011年2月 DNA鑑定における尤度比と仮説検定 2010年8月 仮説空間について 2011年2月 DNA鑑定における尤度比と仮説検定 2011年5月 複雑な家系図でのDNA鑑定用尤度計算法について (東日本大震災を受けて) 2011年9月 多人数一括DNAプロファイリング手法の開発 2011年11月 DNA鑑定とそれ以外の情報の組合せのための基礎 2012年3月 犯人である確率を正確に計算する 2012年9月 事前確率と共役事前分布 2013年1月 事前確率の推定その2 2013年4月 不確かな情報と確かな情報の違いを可視化する
× 事前●● 事後●● データ 解釈 決断
どのくらいの「事後●●」が必要か?
『確実』でなくても決断できる(こともある)
世界でこれまでに11人しか罹ったことのない病気に罹ってしまいました! 治療法は2つ、AとB、とがあります AとBとは、片方しか受けられません AとBとは、どちらも安全です AとBとのどちらを選びますか?
治療法 AとB A 2 1 3 B 5 8 7 4 11 過去の11人は、AとBとのどちらを受けたのか? その結果、治ったのか、治らなかったのか? あなたはどちらの治療法を選びますか? 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11
何を考慮した? ?
何を考慮した? どちらの治療法を選ぶと「治りやすい?」 どちらの治療法が「より良い」? 治る確率の「期待値」が高いのはどちら? Aの治癒率>Bの治癒率なのか。その確率は?
何を考慮した? どちらの治療法を選ぶと「治りやすい?」 どちらの治療法が「より良い」? 治る確率の「期待値」が高いのはどちら? Aの治癒率>Bの治癒率なのか。その確率は?
この問に答えるために必要なのは ベイズ推定 共役事前分布 A 2 1 3 B 5 8 7 4 11 二項の観察から A、Bの成功率を ベータ分布として 推定する 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11
二項分布・ベータ分布 成功 s 回、失敗 f 回、計 n 回 背後にある成功率 p はいくつ?
確率・尤度 二項分布 成功確率 p のとき、n 回中 s 回成功して f 回失敗する確率は p = 0.8 の場合
確率・尤度 二項分布 n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p である尤度は? p = 0.8 の場合
n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p である尤度は? p = 0.6 の場合 p = 0.8 の場合
n=10 回中 s 回成功して f 回失敗したという。 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?
n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?
この形を ベータ分布 と呼ぶ n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p = 0.15, 0.275,0.825である尤度は? この形を ベータ分布 と呼ぶ
ベータ分布 n=10 回中 s=6 回成功して f=4 回失敗したときの成功確率の分布 最もありそうなの(最尤推定値) pL = s/n = 0.6 成功確率の平均(期待値)は pM = (s+1)/(n+2) = 0.5833…
何を考慮した? どちらの治療法を選ぶと「治りやすい?」 A 2 1 3 B 5 8 7 4 11 治る確率の「期待値」が高いのはどちら? 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 Aを選択して治る確率の期待値 (2+1)/ ((2+1)+(1+1)) = 0.6 Decision_beta.2 <- function(x){ if(x[1] < x[4]){ x <- x[4:1] } ret <- 0 common <- -log(x[3]+x[4])+lgamma(x[1]+x[2])+lgamma(x[3]+x[4]+1)-lgamma(x[1])-lgamma(x[2])-lgamma(sum(x)-1) for(j in x[3]:(x[3]+x[4]-1)){ tmp <- lgamma(x[1]+j)+lgamma(sum(x[2:4])-1-j)-lgamma(j+1)-lgamma(x[3]+x[4]-j) ret <- ret + exp(tmp+common) return(ret) Decision_beta.2(c(2,1,5,3)+1) Bを選択して治る確率の期待値 (5+1)/ ((5+1)+(3+1)) = 0.6
どちらの治療法の成功率がい? 治療A 治療B
どちらの治療法の成功率がい? 治療Aの成功率は0.6かもしれない 治療Bの成功率は0.5かもしれない このときは治療法Aの方がBより成功率がよい 治療A 治療B
どちらの治療法の成功率がい? 治療Aの成功率は0.4かもしれない 治療Bの成功率は0.8かもしれない このときは治療法Bの方がAより成功率がよい 治療A 治療B
どちらの治療法の成功率がい? 治療Aの成功率は0.6かもしれない 治療Bの成功率は0.5かもしれない このときは治療法Aの方がBより成功率がよい 治療A 治療B
どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療A 治療B (A, B)=(0.4,0.8)
どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療A 治療B (A, B)=(0.6,0.5)
どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療B 治療A 治療B
(A, B)=(0.4,0.8) (A, B)=(0.6,0.5)
(A, B)=(0.4,0.8) (A, B)=(0.6,0.5) どちらの可能性が高い? 等高線から…
何を考慮した? どちらの治療法が「より良い」? A 2 1 3 B 5 8 7 4 11 Aの治癒率>Bの治癒率なのか。その確率は? 二項の観察から A、Bの成功率を ベータ分布として 推定する 何を考慮した? どちらの治療法が「より良い」? Aの治癒率>Bの治癒率なのか。その確率は? 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11
治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 治療法 治った 治らなかった 計 A 240 160 400 B 120 90 210 360 250 610
治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.6 Aの方が治療成績が良い確率 0.51 治療法 治った 治らなかった 計 A 240 160 400 B 120 90 210 360 250 610 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 Aの方が治療成績が良い確率 0.75
A 2 B 1 3 5 A 200 400 B 100 50 150 300 250 550 ?十分? 治療法 治った 治らなかった 計 B 1 3 5 ?十分? 治療法 治った 治らなかった 計 A 200 400 B 100 50 150 300 250 550 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 Aの方が治療成績が良い確率 0.75
?十分? Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 事後●●を何にするか? 「AとBとを比べて『Aがより良い』確率? 事後●●の値はいくつが十分か?
全員一律のコンセンサスでなくてもよい(多分) かなりの難問 全員一律のコンセンサスでなくてもよい(多分) 事後●●を何にするか? 「AとBとのそれぞれの『期待値』」 「AとBとを比べて『Aがより良い』確率? 事後●●の値はいくつが十分か? 最後の決断は 個人に任せて 個人によって決断が割れてもよい
解決!(したとしよう)
どのくらいの「事前●●」が必要か? 解決!(したとしよう)
どのくらいの「事前●●」が必要か? 解決!(したとしよう) 事前●●を何にするかは決まった。 「AとBとのそれぞれの『期待値』」 「AとBとを比べて『Aがより良い』確率? 事前●●の値はいくつが不十分なのか?
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 無関係な人? 血縁者? 無関係な人? 血縁者? 近縁関係の強弱と地域差
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん 1人、2人、…、たくさん 『複数の候補が居る』
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん 1人、2人、…、たくさん 『複数の候補が居る』 平均を取る
「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん 1人、2人、…、たくさん 『複数の候補が居る』 平均を取る 平均だけでは、まずいこともある
「事前●●」に関する問題 『複数の候補が居る』 平均を取る 平均だけでは、まずいこともある たとえば:バースデイ・パラドクス 平均を取る 平均だけでは、まずいこともある たとえば:バースデイ・パラドクス 『パーティの出席者に同じ誕生日の人がいるだろうか?』 『この人と同じDNAジェノタイプの人がいるだろうか?』 誕生日:すべての日の確率を1/365と揃えて計算する。簡単 DNAタイプ:タイプ別の確率は不均一。簡単じゃない
均一な場合 ばらばらな場合 全員が違う確率 パーティの人数
均一な場合 ばらばらな場合の一例 ただし、『ばらばらな場合』は色々な『ばらばら具合』があるので、それごとにカーブは違う 全員が違う確率 http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/%E3%83%90%E3%83%BC%E3%82%B9%E3%83%87%E3%82%A4%E3%83%BB%E3%83%91%E3%83%A9%E3%83%89%E3%82%AF%E3%82%B9%E3%81%A8%E3%83%95%E3%83%A9%E3%82%AF%E3%82%BF%E3%83%AB パーティの人数
どんな試料? どんな実験?マーカー数? 実験精度?計算手法? 解決!(したとしよう) 解決!(したとしよう)
課題、たくさん
試料 1人 複数人混合 十分量 希少量 質の良否
多型 多型種類 多型箇所数 集団のアレル頻度推定値
実験 実験成否 実験精度
統計計算 実験データのクオリティコントロールと外れ値 推定を含む処理 同一事項の推定に複数手法の提案、その異同 ベイズ流の判定
入口と出口が違えば データ×解釈に求められる 情報力は変わる
入口と出口が違えば データ×解釈に求められる 情報力は変わる 場合の整理とそれに応じた情報力の確認
今日のまとめ 事後●●(事後確率など) 事前●●(事前確率など) データと解釈 人によって変わる、場合によって変わる、事後情報の強さ 個人の意見があってよい…DNA鑑定でも? 事前●●(事前確率など) 事後●●に影響を与える事前●●は、どこまで精度を保っているか? データと解釈 事前●●と事後●●をつなぐ部分 いろいろな課題 試料の量と混合・マーカー種類と数・実験精度・解釈手法