0/1 表現型と 個別化医療における決断 多要素を勘案した末に 白黒つけること 京都大学 ( 医 ) 統計遺伝学分野 山田 亮
ゲノム 統計遺伝学 家系 離散 少数 トランスクリプトーム プロテオーム 連続量系 正規分布系 デジタル インフォマティクス 大規模 情報系 数値解析系 数学系 抽象代数 グラフ理論
統計遺伝学分野 GWAS SNP 遺伝疫学 疾患関連遺伝子多型 ゲノム創薬 。。。 「疾病の理解」と「個別化医療」 治験
統計遺伝学分野 GWAS SNP 遺伝疫学 疾患関連遺伝子多型 ゲノム創薬 。。。 「疾病の理解」と「個別化医療」 治験
Unreliable research Trouble at the lab Scientists like to think of science as self-correcting. To an alarming degree, it is not Oct 19th 2013
癌創薬 6/ = 53
FIGURE 1 | Analysis of the reproducibility of published data in 67 in- house projects. FROM THE FOLLOWING ARTICLE: Believe it or not: how much can we rely on published data on potential drug targets? Florian Prinz, Thomas Schlange & Khusru Asadullah Nature Reviews Drug Discovery 10, 712 (September 2011)
Unreliable research Trouble at the lab Scientists like to think of science as self-correcting. To an alarming degree, it is not Oct 19th 2013
Yukinori OkadaYukinori Okada, et. al Nature Genetics 44, 511–516 (2012) doi: /ng.2231
マルチプルテスティング Yukinori OkadaYukinori Okada, et. al Nature Genetics 44, 511–516 (2012) doi: /ng.2231
治療法A vs. B p = 0.01 「AはBよりよい」と信じよう 「AはBよりよい」と信じると、それは 100回に1度は「誤った選択」
治療法A vs. B p = 0.01 「AはBよりよい」と信じよう 「AはBよりよい」と信じると、それは 100回に1度は「誤った選択」
「誤った選択」とは 本当はBの方がよい治療法なのに N人のトライアルで 「A>B (p < 0.01) 」となったので (N+1)番目以降の人はAだけとなっ た ・・・「本当はBの方が良い治療法」 だったのに 『誤った治療法への固定』という問題
サンプルサイズを増やせば … p 値の基準を厳しくすれば …
サンプルサイズを増やすのにも限界があ る – コスト – 希少疾患・個別化医療による細分 「スタディの賞味期限」はそれほど長く ない – スタディをしている間に、新治療薬が登場!
サンプルサイズを増やせば … p 値の基準を厳しくすれば … サンプルサイズを増やすのにも限界があ る – コスト – 希少疾患・個別化医療による細分 「スタディの賞味期限」はそれほど長く ない – 新規治療法が出てくれば、もういらない それに・・・
白黒つかないうちに決断する
わからなくても決断する あなたは冒険旅行中 分かれ道があって、電光掲示板がある – 『右の道を選んだ者、7名あり。4名は幸福 に、3名は不幸になった』 – 『左の道を選んだ者、3名あり。2名は幸福 に、1名は不幸になった』 11 例目のあなたは、どちらの道を選ぶか 我を過ぐれば憂ひの都あり、 我を過ぐれば永遠の苦患あり、 我を過ぐれば滅亡の民あり
二項分布から ベータ分布を思う
○率○率 道X道X 道Y道Y ○× 和 X Y347 最頻値 期待値 (12+1)/(23+2)12/23 3/7 (3+1)/(7+2)
期待値で選択することは「悪くな い」 方針 – 「期待値」が大きい方を選ぶ – 「期待値」が同じなら、どちらかを選ぶ
本当はよい道を選んで 不幸になった 本当は悪い道を選んで 不幸になった 本当は悪い道を選んで 幸福になった 本当はよい道を選んで 幸福になった
本当に「よい方」ばかりが 選ばれるようになるか
Sele 本当によい方が選ばれがち 本当は悪い方が選ばれがち
期待値で選択することは「悪くな い」 方針 – 「期待値」が大きい方を選ぶ – 「期待値」が同じなら、どちらかを選ぶ 画一的な方針だと、どうしても、 「悪い方への固定」が起きる
確率的な決断 Multi-armed bandit 問題 – 複数のスロットマシンがあって、それぞれの マシンには「当たり」の確率が決まっている が、その確率が不明であるという – マシンを1つずつ選んでは、勝負をして、各 マシンの当否結果を記録しながら、勝負を繰 り返すことにする – どんなルールで選ぶと、儲けが最大になりや すいか、という問題
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切っ て選んでみないといけないよ」~確率的決断 – よさそうな方に8回 – 悪そうな方に 2回 「何度もスロットマシーンを試せるなら … 」 「何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるな ら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
○ 率が高い確率応じて X,Y を「確率的に」選択してみよ う
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切っ て選んでみないといけないよ」 ~確率的決 断 – よさそうな方に8回 – 悪そうな方に 2回 「何度もスロットマシーンを試せるなら … 」 「何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるな ら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切っ て選んでみないといけないよ」 ~確率的決 断 – よさそうな方に8回 – 悪そうな方に 2回 「何度もスロットマシーンを試せるなら … 」 「何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるな ら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切っ て選んでみないといけないよ」 ~確率的決 断 – よさそうな方に8回 – 悪そうな方に 2回 「何度もスロットマシーンを試せるなら … 」 「何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるな ら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切っ て選んでみないといけないよ」 ~確率的決 断 – よさそうな方に8回 – 悪そうな方に 2回 「何度もスロットマシーンを試せるなら … 」 「何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるな ら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
倫理的課題
無知につけこんではならない
○率○率 道X道X 道Y道Y ○× 和 X Y347 最頻値 期待値 (12+1)/(23+2)12/23 3/7 (3+1)/(7+2) ベータ分布を 知らないがために 判断がばらつく というのようなことはよく ない
倫理的課題 無知につけこんではならない 何か受け入れ可能な指標は? – 「個人によってばらつく何か」によって – 「ベータ分布に基づいて変わる何か」
倫理的課題 無知につけこんではならない 何か受け入れ可能な指標は? – 「個人によってばらつく何か」によって – 「ベータ分布に基づいて変わる何か」
たとえば … (12+1)/(23+2)(3+1)/(7+2) 期待値は黒の方が高いが
たとえば … (12+1)/(23+2)(3+1)/(7+2) 期待値は黒の方が高いが 「成功率が 7 割を超える確 率」 は 赤の方が高い
たとえば … 「成功率が 7 割を超える確 率」 は 赤の方が高い そんな変な発想をする人が居る? 100 人治療して 50 人成功の治療法がある。 その治療法は 成功率が 60% 以上である確率は 2 % しかない そんな治療法には満足できない もしかしたら 成功率が 80% を超えるかもしれない そんな治療法があるなら その治療法の治験をしよう! チャレンジ精神
たとえば … 「成功率が 7 割を超える確 率」 は 赤の方が高い そんな変な発想をする人が居る? 100 人治療して 50 人成功の治療法がある。 その治療法は 成功率が 60% 以上である確率は 2 % しかない そんな治療法には満足できない もしかしたら 成功率が 80% を超えるかもしれない そんな治療法があるなら その治療法の治験をしよう! チャレンジ精神
選択問題 Multi-Armed Bandit 「一見、悪そうに見える選択肢も、思い切って選んでみ ないといけないよ」~確率的決断 何か受け入れ可能な指標は? – 「個人によってばらつく何か」によって – 「ベータ分布に基づいて変わる何か」 – チャレンジ精神の強さには個人差がある ( だろう ) 「 何人も子孫を残せるなら … 」 – 生物の生き抜き戦略 「自分ではない、ほかの人が試してくれるなら … 」 – 治験とはある意味そういう枠組み 倫理的課題 Bandit solutions provide unified ethical models for randomized clinical trials and comparative effectiveness research PNAS vol. 106 no. 52 William H. Press, 22387–22392, doi: /pnas
全員がチャレンジャー である必要はない 詳細は 現在、進行形
何の話だったのか
選択という 0/1 決め打ちではなく、確率的 0/1 少数でもよいから、チャレンジャーを 生物戦略としての 0/1 を介した多様性 離散性・区分性を導入して決め打ちを避 ける … これが生物の本質? 0/1
離散が大事 0/1
離散 vs. 連続量
21 世紀初めの 大きな棲み分け SNP 遺伝疫学 vs. マイクロアレイ 発現解析
家系図 連鎖解析 グラフ 離散 タイピング シークエンシン グ 正規分布 アナログ測定 連続量検定
NGS DNA も RNA も同じデータ 家系図 連鎖解析 グラフ 離散 タイピング シークエンシン グ 正規分布 アナログ測定 連続量検定 DNA 大量並列 RNA ポアソン分布モデル 離散化
離散~統計遺伝学分野
連鎖解析は離散
コアレセントも離散
家系図も離散 グラフからベイジアンネットワー ク
あふれる離散表現型
健病 0/1
未分化 分化
活静
OnOff
良悪
たくさん調べて、病気を理解す る たくさん、情報を集めて、 判断に活かす そのもっとも単純な場 合 決断という離散
決断
個体 組織 細胞 分子 決断
化学反応も離散的
動きも離散 ブラウン運動という離散
ブラウン運動という離散 遺伝的浮動という ブラウン運動
離散化と閾値 活性電位 コモン・ディジーズの 閾値モデル
離散化と非線形・相転移 健 病 分岐モデル 非線形アトラクタ ロジスティック関数 曲率による相転移
負の曲率 正の曲率 良性腫瘍 悪性腫瘍 膀胱癌 大腸ポリープ
離散化と相転移 … 量子化 群論 代数統計学
デジタル解析は離散
疎行列という手法としての離散
グラフという手法としての離散 ネットワーク De Bruijn
グラフで組み合わせ 次世代データ De Bruijn 分岐木 →ZDD
グラフで組み合わせ 次世代データ De Bruijn 分岐木 →ZDD 非線形 アトラクタとつながる
グラフで組み合わせ 次世代データ De Bruijn … で 1細胞解析 という離散
ゲノム 統計遺伝学 家系 離散 少数 トランスクリプトーム プロテオーム 連続量系 正規分布系 デジタル インフォマティクス 大規模 情報系 数値解析系 数学系 抽象代数 グラフ理論