奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
講義予定 9月5日 9月6日 9月7日 分子生物学概観 分子生物学データベース 配列アラインメント 実習1(データベース検索と配列アラインメント) 9月6日 モチーフ発見 隠れマルコフモデル カーネル法 進化系統樹推定 9月7日 タンパク質立体構造予測 相互作用推定 スケールフリーネットワーク 実習2(構造予測)
内容 相互作用の種類 遺伝子ネットワーク推定 タンパク質相互作用推定
相互作用の種類 遺伝子間相互作用 タンパク質間相互作用 化合物-タンパク質間相互作用 タンパク質-DNA間相互作用 どの遺伝子が、どの遺伝子を、どのように制御するか? タンパク質間相互作用 どのタンパク質と、どのタンパク質が結合するか? 化合物-タンパク質間相互作用 どの化合物と、どのタンパク質が結合するか? タンパク質-DNA間相互作用 どのタンパク質が、DNAのどの部分に結合するか?
遺伝子発現データからの遺伝子ネットワーク推定 DNAマイクロアレイ・DNAチップ技術の進歩により、数千種類の遺伝子の発現量が同時に測定可能となった そこで、環境変化(熱ショック、栄養状態)や発生、細胞分裂時の遺伝子の時系列データを観測して、その結果から遺伝子の制御関係(ネットワーク)を推定
ネットワーク推定のための離散モデル ブーリアンネットワーク ベイジアンネットワーク ペトリネットモデル 発現状態を 0,1 の2値で表現し、ブール関数により制御規則を表現 デジタル回路と本質的に同じ ベイジアンネットワーク 制御規則を確率的な規則を用いて表現 ペトリネットモデル トークンの遷移規則により制御規則を表現
ネットワーク推定のための連続モデル 線形微分方程式系 非線形微分方程式系 グラフィカルモデリング ハイブリッドペトリネット 線形の微分方程式で制御規則を表現 非線形微分方程式系 非線形の微分方程式で制御規則を表現 グラフィカルモデリング 変数の因果関係をグラフと確率を用いて表現 ハイブリッドペトリネット 微分方程式 + ペトリネット
線形微分方程式系を用いたネットワーク推定(1) 線形微分方程式系を用いたネットワーク推定(1) vi(t): 遺伝子 vi の時刻 t における発現量 各遺伝子の発現量の変化が以下の微分方程式に従うと仮定 問題: t=Δ, 2Δ, 3Δ, 4Δ, … における vi(t) の値が与えられたとして、すべての ai,j を推定 推定法: dvi(t)/dt を (vi(t+Δ) - vi(t))/Δ で近似 ⇒ 差分方程式 vi(t+Δ) - vi(t) は定数とみなせるので、この式は ai,j を未知変数とする連立一次方程式 最小二乗法などを用いて最適な解を計算
線形微分方程式系を用いたネットワーク推定(2) 線形微分方程式系を用いたネットワーク推定(2) vi(t): 遺伝子 vi の時刻 t における発現量 問題: t=Δ, 2Δ, 3Δ, 4Δ, … における vi(t) の値が与えられたとして、すべての ai,j を推定 この例のグラフと微分方程式の関係はイメージ図であり正確ではない
ドメイン間相互作用に基づくタンパク質相互作用推定 タンパク質はドメインとよばれる部品から構成されていると考えられる ドメイン間相互作用を直接計測するのは難しいか、一部のタンパク質間相互作用は実験により計測可能 既知のタンパク質間相互作用データからドメイン間相互作用を予測 未知のタンパク質間相互作用を、予測したドメイン間相互作用から推定
ドメイン間相互作用の予測(例) 左側の3種類の相互作用データから、右のドメイン間相互作用を推定
ドメイン間相互作用の確率モデル 確率モデル[Deng et al., 2002] どれか1組ドメインが相互作用すれば、 タンパク質どうしが相互作用 各ドメインペアの相互作用の確率は独立 Pij=1: タンパク質 Pi と Pj が相互作用 Dmn=1: ドメイン Dm と Dn が相互作用
アソシエーション法 既知データからのドメインどうしの相互作用の確率を頻度に基づいて推定 Imn: ドメインペア Dm, Dn を含むタンパク質のペアのうち、相互作用しているペアの個数 Nmn: ドメインペア Dm, Dn を含むタンパク質のペアの個数
EM法 尤度を以下(L)のように定義し、それを極大化する一般手法である EM法 を適用 fp: false positive rate, fn: false negative rate Pij: Pi と Pj が相互作用する確率 Oij: Pi と Pj の相互作用が観測される確率
まとめ 相互作用予測 遺伝子間相互作用推定(遺伝子ネットワーク推定) タンパク質間相互作用推定 様々な相互作用の種類がある 遺伝子間相互作用、タンパク質間相互作用、 ... 遺伝子間相互作用推定(遺伝子ネットワーク推定) 様々な数理モデルを用いた様々な方法が提案されている しかし、決定版とよべる方法はなく、高精度の予測は難しい タンパク質間相互作用推定 こちらも、様々な方法が提案されている やはり、決定版とよべる方法はなく、高精度の予測は難しい 参考文献 阿久津:バイオインフォマティクスの数理とアルゴリズム、共立出版、2007.