低分子化合物の結合情報を含む高精度タンパク質 立体構造予測データベースを全世界に公開 -創薬研究の効率化や新規機能性生体物質の創製に向けて-

Slides:



Advertisements
Similar presentations
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
Advertisements

NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
メール暗号化:秘密鍵・公開鍵の作成  作業手順 Windows メール(Vista).
7-1.WEKOコンテンツ 一括登録 マニュアル Version2.5
4.ユーザー登録マニュアル              Version 年6月10日 国立情報学研究所.
情報基礎A 情報科学研究科 徳山 豪.
eラーニング推進機構eラーニング授業設計支援室
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
Digital Network And Communication
図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
5.WEKOコンテンツ登録 準備 マニュアル Version 2.1
動物への遺伝子導入 hGH 遺伝子 右:ひと成長ホルモン遺伝子を 導入したラット 左:対照ラット
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
生命情報学入門 タンパク質立体構造予測演習2011年5月31日
ネットで百科 for Library の使いかた
検索テーマ [糖尿病における高脂血症の薬物療法] 丸善株式会社 教育・学術事業本部 商品センター
無機結晶構造データベース について紹介します. まずは検索画面から. このPowerpointは, 全画面表示をすると, アニメーションが
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
WebCluster スライドショーで見る操作ガイド
京都大学 化学研究所 バイオインフォマティクスセンター
生理活性化合物の合成 ライフ 主たる提供特許 技術概要
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
InternetExplorerを起動・・・
教育研究支援センター 利用方法.
管理画面操作マニュアル <サイト管理(1)> 基本設定 第9版 改訂 株式会社アクア 1.
生命情報学入門 タンパク質の分類法演習 2011年6月14日
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
CINAHL データベース チュートリアル 基本検索 featuring:
生命情報学基礎論 (5) タンパク質立体構造予測
Deep Learningを用いたタンパク質のコンタクト残基予測
膜タンパク質の 立体構造予測.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
SVMを用いた生体分子への 金属結合部位予測手法の提案
神奈川科学技術アカデミー バイオインフォマティクスコース 蛋白質立体構造予測 I,II,演習
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
環境リスクマネジメントに関する 検索システム
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
WWW上の効率的な ハブ探索法の提案と実装
産学連携BICSシンポジウム シリーズ3回 (日本化学会春期年会 平成18年3月28日)
Keigo Gohda / CAMM-Kansai
クイックガイド <キーワードによる検索方法>
eラーニング推進機構eラーニング授業設計支援室
DynaMed 新しい検索インターフェースについて support.ebsco.com.
EGSに対応した粒子軌跡と 計算体系の3次元表示ソフト - CGVIEW -
情報処理概論Ⅰ 2007 第5回 2019/4/7 情報処理概論Ⅰ 第5回.
膜タンパク質のインフォマテイクス 必要とされている課題.
管理画面操作マニュアル <物件情報> 第5版 改訂 株式会社アクア 1.
植物系統分類学・第14回 分子系統学の基礎と実践
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
日本語タイトル(point 28) 第4回DSANJ Bio Conference’19 Open
EPOC指導医マニュアル 2007年度 製作者:UMIN センター       EPOC 事務局 製作日:2007/09/12.
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
Googleマップを活用した 生物調査データベースの構築
eラーニング推進機構eラーニング授業設計支援室
細胞膜受容体-天然物リガンド間架橋に最適化した架橋法の開発
地理情報コンテンツ・データベースコンテンツ新規作成
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

低分子化合物の結合情報を含む高精度タンパク質 立体構造予測データベースを全世界に公開 -創薬研究の効率化や新規機能性生体物質の創製に向けて- 2006.9.28 2:00PM 独立行政法人 理化学研究所 ゲノム科学総合研究センター タンパク質構造・機能研究グループ

アミノ酸(20種類)がつながり、3次元的な「立体構造」(形)をとったもの タンパク質とは アミノ酸(20種類)がつながり、3次元的な「立体構造」(形)をとったもの アミノ酸配列 Glu RNA X線結晶解析 NMRなどから 得られた立体 構造情報 DNA 遺伝子配列 1

ホモロジーモデリングとは ホモロジーモデリング 医薬品開発など 標的タンパク質の立体構造予測(モデリング) コンピュータを用いた 立体構造未知のタンパク質(目的タンパク質)の立体構造を、類似のアミノ酸配列をもつ立体構造既知のタンパク質(参照タンパク質)を参照して予測する方法 X線結晶解析 NMRなどから 得られた立体 構造情報 コンピュータを用いた ホモロジーモデリング アミノ酸配列 目的タンパク質 (立体構造未知) 参照タンパク質 (立体構造既知) 標的タンパク質の立体構造予測(モデリング) 医薬品開発など

CHIMERAとFAMSを統合したウェブユーザーフェースシステム ホモロジーモデリング法の開発 CHIMERA FAMS  様々な情報や研究者の工夫を入れながら、対話的にモデリングできるシステム。  CHIMERAの工程の自動化を目指して開発されたシステム。ゲノムワイドなモデリングに適している。 SKE-CHIMERA CHIMERAとFAMSを統合したウェブユーザーフェースシステム  モデリングの際に参考になる様々な情報をデータベース化し、自動化できる部分は自動化されているため、簡便に大量な情報を取り入れながら対話的にモデリングを行うことができるシステム。創薬などにおいて求められる高精度なモデルを構築するのに適している。  タンパク質の機能、リガンドとの相互作用などを考える際に、側鎖のコンフォメーションは非常に重要。そこで、主鎖構造のみならず、側鎖構造も精度良く予測できることを目指した。

データベース構築の流れ SKE-CHIMERA RIKEN FAMSBASE 構造未知タンパク質のアミノ酸配列 CHIMERA FAMS (インタラクティブ) FAMS (全自動システム) アライメント 繰り返し データベース モデル モデル構築 モデリング情報、低分子化合物情報などを含めたデータベース、およびこれらの情報を最新の状態に維持するためのシステムを構築した。 RIKEN FAMSBASE ・モデリングされたタン  パク質データの評価値 ・高精度なタンパク質立体  構造予測(モデリング)情報 ・タンパク質に結合する  低分子化合物情報 ・ヒト遺伝子モデリングデータ ・ラット、マウス実験動物遺伝子モデリングデータ ・全タンパク質モデリングデータ ・全277生物種遺伝子モデリングデータ ・タンパク質の説明

RIKEN FAMSBASEのホームページ http://famshelp.gsc.riken.jp/famsbase/ 全277生物種遺伝子 モデリングデータ 全タンパク質 モデリングデータ ラット、マウス遺伝子 モデリングデータ ヒト遺伝子 モデリングデータ

検索画面 ゲノム名検索 遺伝子番号検索 タンパク質構造番号検索 期待値検索 配列相同性検索 キーワード検索 アミノ酸配列検索

検索結果画面の例 GDT_TS=90 GDT_TS=48 評価値 GDT_TS : Global Distance Test Total Score

検索結果画面の例 GDT_TS=90 GDT_TS=48 評価値 GDT_TS : Global Distance Test Total Score

RIKEN FAMSBASEの使い方ーアミノ酸配列からモデリングする場合ー まず、 http://famshelp.gsc.riken.jp/famsbase/ を経由してRIKEN FAMSBASE http://famshelp.gsc.riken.jp/famsbase/famsbase.html に入ります。 一方、ブラウザの別ウインドウで、http://www.ncbi.nlm.nih.gov サイトを開いて調べたい立体構造未知のタンパク質のアミノ酸配列を入手する。 Searchウインドウに、目的タンパク質名、例えば「human multidrug resistance protein MDR1」を入力して「Go」をクリックします。 P08183 を選択します。 「Human FAMSBASE」 を選択します。 最初はDisplay: 「GenPept」のページが現れるので、Display のプルダウンメニューから「FASTA」 を選択します。 FASTA のページが現れます。 RIKEN FAMSBASEの検索画面の Sequence Search (BLAST) にアミノ酸配列をペーストし、直下の「BLAST search」 ボタンをクリックします。 目的タンパク質表示されたアミノ酸配列を範囲選択&コピーします。 次頁へ

前頁から タンパク質立体構造ビューワーソフトでダウンロードされた構造情報ファイル(この例では MDR1 のモデルと reference PDB: 1Z2R の重ね合わせ)を読み込み、ビューワーソフトの表示方法を操作すると、このようなタンパク質立体構造を見ることができます。 BLAST の結果画面で Score の値が最高値を示している「2484」の部分をクリックします BLAST の結果の詳細が表示されます。 BLAST の結果画面で「NP_000918.2」をクリックします。 「Superimpose」ボタンをクリックすると、RIKEN FAMSBASE の検索画面(前頁)でアミノ酸配列入力をした目的タンパク質 (human multidrug resistance protein MDR1) のモデルと、モデルを作る土台となるタンパク質の立体構造(reference PDB)を重ね合わせた構造情報ファイル(拡張子pdb)が自動的にダウンロードされます。 reference PDBの PDBID 「1Z2R」をクリックします 上段には立体構造データファイルのダウンロードのボタン等、中段には reference PDB のアミノ酸配列との比較、配列比較の下にはリガンド情報が表示されます。 モデリングデータや評価値の一覧表が表示されます。 RIKEN FAMSBASE トップページの上段の「Simple Japanese explanation to use RIKEN FAMSBASE from a journal site」から簡単な日本語マニュアルが、 また、「Searching examples for Riken Famsbase」から詳しい使い方や実例を紹介したファイルがダウンロードできます。 RIKEN FAMSBASE トップページの下段の Links に、タンパク質立体構造ビューワーソフト (PYMOLなど) へのリンクが貼ってあります。

モデリングから得られた立体構造とモデリングに使用した 参照タンパク質の立体構造を重ね合わせた例 数字は評価値 GDT_TS (Global Distance Test Total Score)。評価値が高いほど重ね合わせた構造はよく一致している。 60

タンパク質立体構造予測の国際コンテスト Critical Assessment of Techniques for Protein Structure Prediction Round 6 (CASP6) http://predictioncenter.org/casp6/Casp6.html  タンパク質立体構造予測の精度を競う国際 blind コンテスト          実験的に立体構造が解明(公開)される直前のタンパク質          のアミノ酸配列が出題される。          参加者は、予測モデルを期限日までに提出する。     CASP6(2004年)  SKE-CHIMERAを用いて本研究室も参加        6月7日~9月2日 コンテスト開催           出題ターゲット数 : 64 (90ドメイン)           参加グループ数 : 266        12月4日~8日 結果発表会 (Gaeta in Italy)           主催者側から成績が発表される。           成績が優秀であった上位入賞グループは、招待講演を行う。

December 5th: Homology Based Modeling Day http://predictioncenter.org/casp6/meeting/presentations/CASP6_Program.doc 9:00 CM/easy, CM/hard Alfonso Valencia 10:00 FR/H Roland Dunbrack 11:10 Group 450 Ginalski Krzysztof Ginalski 11:30 Group 176 Skolnick-Zhang Jeffrey Skolnick 11:50 Group 591 VENCLOVAS Ceslovas Venclovas 12:10 Group 272 CBRC-3D Kentaro Tomii 12:30 Group 454 CHIMERA Mayuko Takeda-Shitaka 12:50 Group 35 GeneSilico-Group Marcin Feder 18:30 Group 242 ZHOUSPARKS2 Yaoqi Zhou 18:50 Group 400 ACE Ming Li assessorによる評価 招待講演 (human predictor) 招待講演 (server)  独自に開発したシステムを用いて参加し、250を超える参加グループの中で、予測構造の正確さで国際的に高い評価を得ることができた。 Takeda-Shitaka M. et al., Proteins, 61 Suppl 7, 122-127 (2005).

コンテストに使われたタンパク質の例 Target 229_2 (37%) TM0919, T. maritima (CM/easy) psipred :CEEEECCCEEEEEECCCCEEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCCEEEEEEEEEE sam-t02-dssp :CEEEECSTCEEEEEETTSEEEEECCCHHTTTCTCCCCHHHHHHHHHHHHHHHHHHHHHHHTTCCCCCEEEEEEEEEECCTTSCCEEEEEEEEEEE sam-t02-stride :CEEEEETTTEEEEEETTTEEEEEETTTTTTTTTTCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCTTEEEEEEEEECTTTTTTEEEEEEEEEEE robetta-jufo-3d :CEEEEECCEEEEEEECCCCEEECCCCCCCCCCCCCCCCHHHHHHHCCCCCHHHHHHHHHHHCCCCCCEEEEEEEEEEECCCCCCCEEEEEEEEEE profsec :CEEEEECCCEEEEECCCCCEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCEEEEEEEEEEE T0229 :MQARWIGNMMFHVRTDSNHDVLMDTKEEVGGKDAAPRPLELVLTGLMGCTGMDVVSILRKMKVIDQMKDFRIEIEYERTEEHPRIFTKVHLKYIF :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV psipred :EECCCCCHHHHHHHHHHHCCCCCCEEEECCCCCEEEEEEEECC sam-t02-dssp :ECSSCCCHHHHHHHHHHHHHHHHHHHHHHTTCCEEEEEEEEEC sam-t02-stride :ECTTTCCHHHHHHHHHHHHHTCCCHHHHHTTTEEEEEEEEECC robetta-jufo-3d :EEECCCCHHHHHHHHHHHCCCCCCCCCHHCCCEEEEEEEEECC profsec :EECCCCCHHHHHHHHHHHHHCCCCCEEEECCCCEEEEEEEECC T0229 :KFDGEPPKDKVEKAVQLSQEKYCSVSAILKCSSKVTYEIVYEN :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVV model native: 1vla GDT_TS = 80.15 The highest score among the participants.

タンパク質立体構造情報に基づく合理的薬剤設計 (SBDD:Structure-Based Drug Design) タンパク質の機能は,特異的に結合する分子(基質)との相互作用により制御され,この結合には立体構造的な相補性が重要な役割を果たす.一方,疾病の多くは,タンパク質の正常な活動からの逸脱に起因すると考えられる.したがって,ある疾病関連タンパク質が特定された場合,その立体構造から引き出される情報を利用することにより,合理的な薬剤設計を行うことが可能となる. また,PCクラスター等大規模計算機システムとの組み合わせにより,短期間・低コストでの創薬が期待できる. ゲノム情報の解読 実験による立体 構造決定 計算による立体 構造予測 計算によるヒット 化合物探索 実験によるリード化合物探索 計算によるリード化合物最適化 創薬ターゲットの 選定 実験によるリード化合物最適化 薬剤候補物質 立体構造解析 活性部位 化合物探索 化合物最適化