奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測

Slides:



Advertisements
Similar presentations
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
Advertisements

動的計画法を用いたアラインメント  小菅孝史.
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
情報生命科学特別講義III (5)配列アラインメント
生命情報学基礎論 (2) 配列の比較と相同性検索
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (1) 文字列マッチング
低分子化合物の結合情報を含む高精度タンパク質 立体構造予測データベースを全世界に公開 -創薬研究の効率化や新規機能性生体物質の創製に向けて-
自己重力多体系の 1次元シミュレーション 物理学科4年 宇宙物理学研究室  丸山典宏.
タンパク質相互作用ネットワークの スケールフリーモデル
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
生命情報学入門 タンパク質立体構造予測演習2011年5月31日
奈良女子大集中講義 バイオインフォマティクス (1) 分子生物学概観
生命情報学入門 機械学習を用いたタンパク質の分類法 2011年6月7日
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
集中講義(九州大学数理学研究院) バイオインフォマティクスにおける カーネル法およびグラフ理論 (4) タンパク質立体構造の比較と予測
HMM:隠れマルコフモデル 電子情報工学科 伊庭 斉志 奈良女子大集中講義 バイオインフォマティクス (6)
京都大学 化学研究所 バイオインフォマティクスセンター
3)たんぱく質中に存在するアミノ酸のほとんどが(L-α-アミノ酸)である。
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
京都大学 化学研究所 バイオインフォマティクスセンター
京都大学 化学研究所 バイオインフォマティクスセンター
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
配列および化合物データ解析のためのカーネル法
生命情報学入門 タンパク質の分類法演習 2011年6月14日
北大MMCセミナー 第76回 附属社会創造数学センター主催 Date: 2017年10月12日(木) 16:30~18:00
情報生命科学特別講義III (11) RNA二次構造予測
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
生命情報学基礎論 (5) タンパク質立体構造予測
生命情報学入門 配列のつなぎ合わせと再編成
Deep Learningを用いたタンパク質のコンタクト残基予測
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による 化合物の性質予測(3) 配列アライメント
膜タンパク質の 立体構造予測.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
SVMを用いた生体分子への 金属結合部位予測手法の提案
情報生命科学特別講義III (12) タンパク質立体構造の比較と予測
神奈川科学技術アカデミー バイオインフォマティクスコース 蛋白質立体構造予測 I,II,演習
Keigo Gohda / CAMM-Kansai
京都大学 化学研究所 バイオインフォマティクスセンター
明治大学大学院理工学研究科 総合講義C バイオインフォマティクスにおける 数理的手法
生  物  数  学 斉木 里恵.
分子生物情報学(2) 配列のマルチプルアライメント法
膜タンパク質のインフォマテイクス 必要とされている課題.
情報生命科学特別講義III (13) 固定パラメータアルゴリズムと 部分k木
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
九州大学大学院 情報学専攻特別講義 (5)タンパク質立体構造の比較と予測
タンパク質.
タンパク質-リガンド複合体への共溶媒効果の系統的解析
サポートベクターマシン Support Vector Machine SVM
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
京都大学 化学研究所 バイオインフォマティクスセンター
全原子の位置 r(t) を求める(各原子がいつ,どこにあるか)
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
ポッツスピン型隠れ変数による画像領域分割
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
生命情報学 (8) 生物情報ネットワークの構造解析
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
北大MMCセミナー 第23回 Date:2014年3月6日(木) 16:30~18:00 ※通常と曜日が異なります
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
配列解析アルゴリズム特論 配列アライメントI
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター

講義予定 9月5日 9月6日 9月7日 分子生物学概観 分子生物学データベース 配列アラインメント 実習1(データベース検索と配列アラインメント) 9月6日 モチーフ発見 隠れマルコフモデル カーネル法 進化系統樹推定 9月7日 タンパク質立体構造予測 相互作用推定 スケールフリーネットワーク 実習2(構造予測)

内容 立体構造予測に関連する基本事項 立体構造予測法の分類 スレッディング法 3D-1Dプロファイル ポテンシャル型スコア関数を用いたスレッディング CASP

タンパク質立体構造予測 アミノ酸配列から、タンパク質の立体構造(3次元構造)をコンピュータにより推定 実験よりは、はるかに精度が悪い だいたいの形がわかれば良いのであれば、4~5割近くの予測率

タンパク質とアミノ酸 アミノ酸:20種類 タンパク質:アミノ酸の鎖(短いものはペプチドと呼ばれる)

側鎖の例

タンパク質の種類と高次構造 タンパク質の分類 一次構造(アミノ酸配列) 二次構造(α、β、それ以外(ループ、コイル)) 球状タンパク質 繊維状タンパク質 膜タンパク質 一次構造(アミノ酸配列) 二次構造(α、β、それ以外(ループ、コイル)) 三次構造(三次元構造、立体構造) 四次構造(複数の鎖)

タンパク質立体構造の決定 主にX線結晶解析かNMR解析による アミノ酸配列決定より困難 既知アミノ酸配列 >> 10万 しかし、結晶中の構造しかわからない アミノ酸配列決定より困難 半年から1年くらいかかることも珍しく無い 既知アミノ酸配列 >> 10万 既知立体構造 < 数万

タンパク質立体構造の特徴 基本的には鎖(ひも)状 二種類の特徴的な構造が頻繁に現れ、立体構造の骨格(コア)を作る αへリックス(らせん状の部分) βシート(ひも状の部分が並んだ部分)

構造とアミノ酸の種類の関係 (球状)タンパク質 αへリックス βストランド ループ領域 内側:疎水性アミノ酸 外側:親水性アミノ酸 内側:疎水性アミノ酸 外側:親水性アミノ酸 αへリックス 内側:疎水性 外側:親水性 βストランド 疎水性と親水性が交互に現れる ループ領域 親水性が高い

立体構造データベース PDB(Protein Data Bank ) SCOP FSSP/DALI タンパク質立体構造データベース 2007年5月15日現在43459データ(ただし重複あり) SCOP 立体構造分類データベース FSSP/DALI 立体構造アライメントデータベース/アライメントサーバー

タンパク質立体構造の分類 構造分類の必要性 SCOPによる階層的クラス分け 立体構造と機能の間には密接な関係 配列が似ていなくても構造類似のタンパク質が多数存在 SCOPによる階層的クラス分け Class: 二次構造の組成(α、β、α+βなど)に基づく分類 Fold: 構造の類似性 ← スレッディング法の対象 Superfamily: 進化的類縁性 Family: 明らかな進化的類縁性高い

立体構造予測法の分類 物理的原理に基づく方法 格子モデル 2次構造予測 スレッディング

物理的原理に基づく方法 エネルギー最小化、もしくは、微分方程式を(数値的に)解く、などの物理的原理に基づく方法 主として分子動力学法(Molecular Dynamics) 数十残基程度であれば、実際のタンパク質やペプチドと似た構造を推定可能(なことがある) 構造の最適化や安定性の解析には実用的 超並列計算機の利用、専用計算機の開発

格子モデル(1) 各残基が格子点にあると仮定 予測よりも、フォールディングの定性的な理解のために利用される

格子モデル(2) エネルギー最小となる折畳みを計算 HPモデルでは疎水性アミノ酸どうしが隣接すると -1で、他はすべて0 という簡単なエネルギー関数を用いる 親水性アミノ酸 疎水性アミノ酸 スコア =-9 =-5 配列

二次構造予測 アミノ酸配列中の各残基が、α、β、それ以外のどれに属するかを予測 でたらめに推定しても、33.3%の的中率 最も高精度なソフトを使えば、80%近い的中率 ニューラルネット、HMM、サポートベクタマシンなどの利用

ニューラルネットによる二次構造予測

膜タンパク質の膜貫通領域予測 膜貫通領域: αへリックス 7~17残基程度の疎水性指標の平均値をプロット 平均値が高い部分が膜貫通領域と推定

フォールド予測 精密な3次元構造ではなく、だいたいの形(fold)を予測 立体構造は1000種類程度のパターンに分類される、との予測(Chotia, 1992)に基づく

タンパク質スレッディング 立体構造(テンプレート)とアミノ酸配列の間のアライメント

スレッディングとアライメント スレッディング アラインメント

スレッディング法の分類 プロファイルによるスレッディング 残基間ポテンシャルによるスレッディング 3D-1D法 PSI-BLAST 構造アライメントを用いるスレッディング 残基間ポテンシャルによるスレッディング コンタクトポテンシャル 距離依存ポテンシャル その他のポテンシャル

プロファイル アライメントにおけるスコア行列と類似 スレッディングの場合、残基位置ごとにスコア(位置依存スコア)

プロファイルによるアライメント 動的計画法(DP)により最適解を計算 スコア行列のかわりにプロファイルを使う

3D-1Dプロファイル 最初のversionはEisenbergらが1991年に提案 構造中の残基(位置)を18種類の環境に分類 二次構造(3種類) 内外性+極性(6種類)

3D-1Dプロファイル

配列のマルチプルアライメントに基づくプロファイル その他のプロファイル 配列のマルチプルアライメントに基づくプロファイル PSI-BLAST、HMM 立体構造のマルチプルアライメントに基づくプロファイル作成 角度情報なども考慮したプロファイル プロファイル vs プロファイルによるアライメント

ポテンシャル型スコア関数を用いたスレッディング 全体のポテンシャルエネルギーを最小化(Σfd(X,Y)が最小となるようなスレッディングを計算) 精度向上が期待できる でも計算時間が問題

プロファイル型スコア関数と ポテンシャル型スコア関数 各アミノ酸は独立 位置にのみ依存 ポテンシャル型スコア関数 アミノ酸ペア(種類)とその距離に依存

立体構造予測コンテスト:CASP CASP (Critical Assessment of Techniques for Protein Structure Prediction) ブラインドテストにより予測法を評価 半年以内に立体構造が実験により決定する見込みの配列(数十種類)をインターネット上で公開 参加者は予測結果を送付 構造決定後、正解とのずれなどを評価、順位づけ

CASPの経過と結果の公表 CASP1 (1994), CASP2(1996), CASP3(1998), CASP4(2000), CASP5(2002), CASP6(2004), CASP7(2006) CAFASP(1998,2000,2002,2004,2006) 完全自動予測法の評価 結果の公表 会議 ホームページ http://predictioncenter.org/ 学術専門誌(Proteins)

まとめ 正確な座標の予測は難しい だいたいの形の予測であれば4~5割近く 二次構造予測であれば、80%近い予測率 タンパク質スレッディング法が有力 プロファイルを用いる方法 残基間ポテンシャルを用いる方法 近年では、構造フラグメントと ab initio 法の組み合わせも有力 二次構造予測であれば、80%近い予測率 参考文献 丸山修、阿久津達也:バイオインフォマティクス –配列データ解析と構造予測、朝倉書店、2007