遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測 November 3, 2002 第15回計算力学講演会 遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測 Protein Tertiary Structure Predictions by Parallel Simulated Annealing using Genetic Crossover ○小掠真貴(日本電気) 三木光範(同志社大学) 廣安知之(同志社大学) 岡本祐幸(岡崎国立共同研究機構) 青井桂子(同志社大院) 小椋信弥(同志社大院)
研究背景 タンパク質の立体構造の研究 タンパク質の立体構造 生物学的機能と密接な関係 新薬の開発 病理の発現機構の解明 自然なタンパク質はエネルギーの最も低い状態で存在 20種類のアミノ酸の並びがタンパク質を構成 アミノ酸配列は最小エネルギー構造に折りたたまれる
研究背景 タンパク質の立体構造 最小エネルギー構造に 折りたたまれる Amino acid sequence Tertiary Energy function of protein Amino acid sequence Tertiary structure
研究背景 並列SAにGAオペレーションを用いたアルゴリズムの提案 遺伝的交叉を用いた並列シミュレーテッドアニーリング 局所的に無数の極小値, 大域的にもいくつかの 極小値を持つため, 現在用いられているSA では予測が困難 Energy function of protein 局所探索に優れたSAと大域探索に優れたGAのオペレーションとの ハイブリッドアルゴリズム 遺伝的交叉を用いた並列シミュレーテッドアニーリング (Parallel Simulated Annealing using Genetic Crossover : PSA/GAc)
研究の目的 遺伝的交叉を用いた並列SA(PSA/GAc)を タンパク質立体構造予測に適用し, 現在用いられているSAよりも高い性能を得る アミノ酸配列からのタンパク質立体構造予測に 有効な手法であることの証明
遺伝的交叉を用いた並列SA (PSA/GAc) PSAの解の伝達に遺伝的交叉(Crossover)を用いる手法 d d:Crossover interval SA Crossover End d Crossover Temperature High Low
遺伝的交叉を用いた並列SA (PSA/GAc) 遺伝的交叉の処理 e.g. 3設計変数の連続関数最小化問題 Energy -1.3 -1.8 Parent1 Parent2 Next searching points -1.1 -2.0 Child1 Child2 Crossover
PSA/GAcによるタンパク質立体構造予測 タンパク質立体構造予測のモデル化 設計変数:主鎖と側鎖にある二面角 e.g. 5つのアミノ酸残基を持つMet-enkephalin Main chain Side
PSA/GAcによるタンパク質立体構造予測 タンパク質立体構造予測のモデル化 設計変数:主鎖と側鎖にある二面角 e.g. 5つのアミノ酸残基を持つMet-enkephalin A B D C Dihedral angle
PSA/GAcによるタンパク質立体構造予測 タンパク質立体構造予測のモデル化 設計変数:主鎖と側鎖にある二面角 e.g. 5つのアミノ酸残基を持つMet-enkephalin Main chain Side すべての二面角について,生成処理,受理判定を行い,一巡すればクーリングを行う. この一巡の処理をMCsweepということとする.
PSA/GAcによるタンパク質立体構造予測 立体構造予測の対象としたタンパク質 5つのアミノ酸からなるMet-enkephalin 最小エネルギー値が既知 34個のアミノ酸からなる ヒト副甲状腺ホルモンのフラグメント PTH(1-34) 最小エネルギー値が未知
Met-enkephalinの立体構造予測 最小エネルギー値が既知のタンパク質 5つのアミノ酸からなるMet-enkephalin 設計変数 19個の二面角 Met-enkephalin 1MCsweepごとに 19回の生成処理,受理判定 最小エネルギー構造 E < -11 kcal/mol
Met-enkephalinの立体構造予測 立体構造予測の成功率 PSA/GAc SSA Success rate 0.90 0.50 Number of evaluations 96,158 × 19 100,000 × 19 SSAは現在構造予測に用いられている逐次SA. Success rateは10試行中エネルギー値が-11kcal/mol以下の構造が得られた確率. 評価計算回数を同等にして比較.
PTH(1-34)の立体構造予測 最小エネルギー値が未知のタンパク質 34個のアミノ酸からなる 設計変数 178個の二面角 1MCsweepごとに178回の生成処理,受理判定 NMR実験と逐次SA探索によって2個のα-helixが確認
PTH(1-34)の立体構造予測 立体構造予測の結果 -240.0kcal/mol -210.0kcal/mol 199,955 × 178 PSA/GAc SSA Lowest-energy -240.0kcal/mol -210.0kcal/mol Number of evaluations 199,955 × 178 200,000 × 178 Lowest-energy conformation of PTH(1-34) gained by PSA/GAc
結論 遺伝的交叉を用いた並列シミュレーテッドアニーリング(PSA/GAc)をタンパク質立体構造予測に適用 最小エネルギー値が既知のMet-enkephalin: 従来のSAよりも高い確率で最小エネルギー構造を得た 最小エネルギー値が未知のPTH(1-34): 従来のSAよりも低いエネルギー値を持つ構造を得た タンパク質立体構造予測において,PSA/GAcは 従来立体構造予測に用いられていた逐次SAよりも 高い解探索能力を示すことが明らかとなった