法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
読解力・思考力を鍛える.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
ベイズ的ロジスティックモデル に関する研究
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
集団における適応 知識構造論講座 下嶋研究室          M1 関本 和弘.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
Basic Calculus Ptolemy and the Dynamics of the Universe [2]
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
Basic Calculus The Greeks Measure the Universe [4]
法数学勉強会 2011/11/26 京都大学大学院医学研究科 統計遺伝学分野 山田 亮
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
動学的一般均衡モデルについて 2012年11月9日 蓮見 亮.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
法数学勉強会 2018/07/21 京大(医) 統計遺伝学分野 山田亮
新入生の事前知識の違いによる コンピュータリテラシ学習効果の分析
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
法数学勉強会 2016年4月会 京都大学(医)統計遺伝学分野 山田 亮
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田
遺伝統計学 集中講義 (4) SNPによる領域の評価
東日本大震災におけるご遺体身元確認と行方不明家族捜索のためのDNA鑑定
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
2011/05/28 京都大学大学院 附属ゲノム医学センター統計遺伝学分野 山田 亮
第24回日本法科学技術学会 2018/11/08 京都大学 医学研究科 統計遺伝学分野 山田 亮
確率と統計2009 第12日目(A).
尤度の比較と仮説検定とを比較する ~P値のことなど~
第3章 線形回帰モデル 修士1年 山田 孝太郎.
法数学のための 機械学習の基礎 京大(医) 統計遺伝学分野 山田 亮 2017/04/15.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
決断のための分布合算 京大(医)統計遺伝学分野 山田 亮.
決断のための分布合算 京大(医)統計遺伝学分野 山田 亮.
クロス表とχ2検定.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
親子鑑定に見る尤度比を 角度を変えて眺めてみる
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
C9 石橋を叩いて渡るか? ~システムに対する信頼度評価~
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
DNA鑑定を理解するために必要な数学の学び方
ベイズ音声合成における 事前分布とモデル構造の話者間共有
問題 あなたはポケモンGOをやっています. これから5か所のポケモンの巣(ポケモンがよく出る場所)を回って レアポケモンを捕まえに行こうと思っています. しかし,持ち物を見たらハイパーボール1つしかありませんでした. なるべくCPが高い(強い)レアポケモンを 捕まえたいのですが, 何か所目で捕まえれば.
重回帰分析入門 (第5章補足) 統計学 2007年度.
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
混合試料の構成人数 Nuisance パラメタ
混合ガウスモデル Gaussian Mixture Model GMM
アルゴリズム ~すべてのプログラムの基礎~.
2012年度 情報数理 ~ ハミング距離 ~.
Presentation transcript:

法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮 決断するための情報 法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮

DNA鑑定と決断

DNA鑑定と決断 決断とは?

どちらにしようかな 天の神様の言うとおり

決めた!

婚活

こっちにしようかな?

こっちにしようかな? 決めた!

こっちにしようかな? 決めた!

尽きない悩み

~決断理論~

~決断理論~ イントロダクション だけど 328ページ

~決断理論~ 哲学 経済学 心理学 数学

『最適な決断戦略』 「情報がないなら、ないなりに、あるなら、あるなりに」 「確率的に決断」しよう それが「長い目」で見たときの、『最適戦略』 生物進化、ギャンブル… Multi-armed bandit problem, Thompson sampling

裏を返すと…

情報があっても 確率的に決断するしかない 最後の決断は 個人に任せて 個人によって決断が割れてもよい

決断するための情報 法数学の役割

決断するための情報 法数学の役割 決断したい人の 役に立つような情報を 使い方指南も含め 利用しやすい形で 情報提供

× 決断 情報 事前●● 事後●●

× 決断 データ × 解釈 事前●● 事後●●

法数学勉強会@京都大学 2010年~ 2010年8月 仮説空間について 2011年2月 DNA鑑定における尤度比と仮説検定 2010年8月 仮説空間について 2011年2月 DNA鑑定における尤度比と仮説検定 2011年5月 複雑な家系図でのDNA鑑定用尤度計算法について (東日本大震災を受けて) 2011年9月 多人数一括DNAプロファイリング手法の開発 2011年11月 DNA鑑定とそれ以外の情報の組合せのための基礎 2012年3月 犯人である確率を正確に計算する 2012年9月 事前確率と共役事前分布 2013年1月 事前確率の推定その2 2013年4月 不確かな情報と確かな情報の違いを可視化する

× 事前●● 事後●● データ 解釈 決断

どのくらいの「事後●●」が必要か?

『確実』でなくても決断できる(こともある)

世界でこれまでに11人しか罹ったことのない病気に罹ってしまいました! 治療法は2つ、AとB、とがあります AとBとは、片方しか受けられません AとBとは、どちらも安全です AとBとのどちらを選びますか?

治療法 AとB A 2 1 3 B 5 8 7 4 11 過去の11人は、AとBとのどちらを受けたのか? その結果、治ったのか、治らなかったのか? あなたはどちらの治療法を選びますか? 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11

何を考慮した? ?

何を考慮した? どちらの治療法を選ぶと「治りやすい?」 どちらの治療法が「より良い」? 治る確率の「期待値」が高いのはどちら? Aの治癒率>Bの治癒率なのか。その確率は?

何を考慮した? どちらの治療法を選ぶと「治りやすい?」 どちらの治療法が「より良い」? 治る確率の「期待値」が高いのはどちら? Aの治癒率>Bの治癒率なのか。その確率は?

この問に答えるために必要なのは ベイズ推定 共役事前分布 A 2 1 3 B 5 8 7 4 11 二項の観察から A、Bの成功率を ベータ分布として 推定する 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11

二項分布・ベータ分布 成功 s 回、失敗 f 回、計 n 回 背後にある成功率 p はいくつ?

確率・尤度 二項分布 成功確率 p のとき、n 回中 s 回成功して f 回失敗する確率は p = 0.8 の場合

確率・尤度 二項分布 n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p である尤度は? p = 0.8 の場合

n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p である尤度は? p = 0.6 の場合 p = 0.8 の場合

n=10 回中 s 回成功して f 回失敗したという。 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?

n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?

この形を ベータ分布 と呼ぶ n=10 回中 s=6 回成功して f=4 回失敗したという。 成功確率 p = 0.15, 0.275,0.825である尤度は? この形を ベータ分布 と呼ぶ

ベータ分布 n=10 回中 s=6 回成功して f=4 回失敗したときの成功確率の分布 最もありそうなの(最尤推定値)      pL = s/n = 0.6 成功確率の平均(期待値)は     pM = (s+1)/(n+2) = 0.5833…

何を考慮した? どちらの治療法を選ぶと「治りやすい?」 A 2 1 3 B 5 8 7 4 11 治る確率の「期待値」が高いのはどちら? 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 Aを選択して治る確率の期待値 (2+1)/ ((2+1)+(1+1)) = 0.6 Decision_beta.2 <- function(x){ if(x[1] < x[4]){ x <- x[4:1] } ret <- 0 common <- -log(x[3]+x[4])+lgamma(x[1]+x[2])+lgamma(x[3]+x[4]+1)-lgamma(x[1])-lgamma(x[2])-lgamma(sum(x)-1) for(j in x[3]:(x[3]+x[4]-1)){ tmp <- lgamma(x[1]+j)+lgamma(sum(x[2:4])-1-j)-lgamma(j+1)-lgamma(x[3]+x[4]-j) ret <- ret + exp(tmp+common) return(ret) Decision_beta.2(c(2,1,5,3)+1) Bを選択して治る確率の期待値 (5+1)/ ((5+1)+(3+1)) = 0.6

どちらの治療法の成功率がい? 治療A 治療B

どちらの治療法の成功率がい? 治療Aの成功率は0.6かもしれない 治療Bの成功率は0.5かもしれない このときは治療法Aの方がBより成功率がよい 治療A 治療B

どちらの治療法の成功率がい? 治療Aの成功率は0.4かもしれない 治療Bの成功率は0.8かもしれない このときは治療法Bの方がAより成功率がよい 治療A 治療B

どちらの治療法の成功率がい? 治療Aの成功率は0.6かもしれない 治療Bの成功率は0.5かもしれない このときは治療法Aの方がBより成功率がよい 治療A 治療B

どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療A 治療B (A, B)=(0.4,0.8)

どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療A 治療B (A, B)=(0.6,0.5)

どちらの治療法の成功率がい? (A,B) = (0.4, 0.8) (A,B) = (0.6, 0.5) どちらの可能性が高い? 治療B 治療A 治療B

(A, B)=(0.4,0.8) (A, B)=(0.6,0.5)

(A, B)=(0.4,0.8) (A, B)=(0.6,0.5) どちらの可能性が高い? 等高線から…

何を考慮した? どちらの治療法が「より良い」? A 2 1 3 B 5 8 7 4 11 Aの治癒率>Bの治癒率なのか。その確率は? 二項の観察から A、Bの成功率を ベータ分布として 推定する 何を考慮した? どちらの治療法が「より良い」? Aの治癒率>Bの治癒率なのか。その確率は? 治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11

治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 治療法 治った 治らなかった 計 A 240 160 400 B 120 90 210 360 250 610

治療法 治った 治らなかった 計 A 2 1 3 B 5 8 7 4 11 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.6 Aの方が治療成績が良い確率 0.51 治療法 治った 治らなかった 計 A 240 160 400 B 120 90 210 360 250 610 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 Aの方が治療成績が良い確率 0.75

A 2 B 1 3 5 A 200 400 B 100 50 150 300 250 550 ?十分? 治療法 治った 治らなかった 計 B 1 3 5 ?十分? 治療法 治った 治らなかった 計 A 200 400 B 100 50 150 300 250 550 Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 Aの方が治療成績が良い確率 0.75

?十分? Aを選択して治る確率の期待値 0.6 Bを選択して治る確率の期待値 0.57 事後●●を何にするか?  「AとBとを比べて『Aがより良い』確率? 事後●●の値はいくつが十分か?

全員一律のコンセンサスでなくてもよい(多分) かなりの難問 全員一律のコンセンサスでなくてもよい(多分) 事後●●を何にするか?  「AとBとのそれぞれの『期待値』」  「AとBとを比べて『Aがより良い』確率? 事後●●の値はいくつが十分か? 最後の決断は 個人に任せて 個人によって決断が割れてもよい

解決!(したとしよう)

どのくらいの「事前●●」が必要か? 解決!(したとしよう)

どのくらいの「事前●●」が必要か? 解決!(したとしよう) 事前●●を何にするかは決まった。 「AとBとのそれぞれの『期待値』」  「AとBとを比べて『Aがより良い』確率? 事前●●の値はいくつが不十分なのか?

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 無関係な人? 血縁者?  無関係な人?  血縁者?  近縁関係の強弱と地域差

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』  1人、2人、…、たくさん

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』  1人、2人、…、たくさん

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』  1人、2人、…、たくさん

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん  1人、2人、…、たくさん 『複数の候補が居る』

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん  1人、2人、…、たくさん 『複数の候補が居る』  平均を取る

「事前●●」に関する問題 「犯人か」「犯人でないか」の2択 「犯人でない」=「別の誰かが犯人だ」 『別の誰?』 1人、2人、…、たくさん  1人、2人、…、たくさん 『複数の候補が居る』  平均を取る  平均だけでは、まずいこともある

「事前●●」に関する問題 『複数の候補が居る』 平均を取る 平均だけでは、まずいこともある たとえば:バースデイ・パラドクス  平均を取る  平均だけでは、まずいこともある たとえば:バースデイ・パラドクス 『パーティの出席者に同じ誕生日の人がいるだろうか?』 『この人と同じDNAジェノタイプの人がいるだろうか?』 誕生日:すべての日の確率を1/365と揃えて計算する。簡単 DNAタイプ:タイプ別の確率は不均一。簡単じゃない

均一な場合 ばらばらな場合 全員が違う確率 パーティの人数

均一な場合 ばらばらな場合の一例 ただし、『ばらばらな場合』は色々な『ばらばら具合』があるので、それごとにカーブは違う 全員が違う確率 http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/%E3%83%90%E3%83%BC%E3%82%B9%E3%83%87%E3%82%A4%E3%83%BB%E3%83%91%E3%83%A9%E3%83%89%E3%82%AF%E3%82%B9%E3%81%A8%E3%83%95%E3%83%A9%E3%82%AF%E3%82%BF%E3%83%AB パーティの人数

どんな試料? どんな実験?マーカー数? 実験精度?計算手法? 解決!(したとしよう) 解決!(したとしよう)

課題、たくさん

試料 1人 複数人混合 十分量 希少量 質の良否

多型 多型種類 多型箇所数 集団のアレル頻度推定値

実験 実験成否 実験精度

統計計算 実験データのクオリティコントロールと外れ値 推定を含む処理 同一事項の推定に複数手法の提案、その異同 ベイズ流の判定

入口と出口が違えば データ×解釈に求められる 情報力は変わる

入口と出口が違えば データ×解釈に求められる 情報力は変わる 場合の整理とそれに応じた情報力の確認

今日のまとめ 事後●●(事後確率など) 事前●●(事前確率など) データと解釈 人によって変わる、場合によって変わる、事後情報の強さ 個人の意見があってよい…DNA鑑定でも? 事前●●(事前確率など) 事後●●に影響を与える事前●●は、どこまで精度を保っているか? データと解釈 事前●●と事後●●をつなぐ部分 いろいろな課題 試料の量と混合・マーカー種類と数・実験精度・解釈手法