低分子化合物の結合情報を含む高精度タンパク質立体構造予測データベースを全世界に公開－創薬研究の効率化や新規機能性生体物質の創製に向けて－

Slides:

Advertisements

Similar presentations

奈良女子大集中講義バイオインフォマティクス (3) 配列アラインメント

Advertisements

NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会

メール暗号化：秘密鍵・公開鍵の作成　作業手順 Windows メール（Vista）.

７-１．WEKOコンテンツ一括登録マニュアル Version2.5

４．ユーザー登録マニュアル　　　　　　　　　　　　 Version 年6月10日　国立情報学研究所.

情報基礎A 情報科学研究科徳山　豪.

eラーニング推進機構eラーニング授業設計支援室

デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル

ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。

奈良女子大集中講義バイオインフォマティクス (8) タンパク質立体構造予測

Digital Network And Communication

図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会

５．WEKOコンテンツ登録準備マニュアル Version 2.1

動物への遺伝子導入 hGH 遺伝子右：ひと成長ホルモン遺伝子を導入したラット左：対照ラット

Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.

生命情報学入門タンパク質立体構造予測演習2011年5月31日

ネットで百科 for Library の使いかた

検索テーマ [糖尿病における高脂血症の薬物療法] 丸善株式会社教育・学術事業本部商品センター

無機結晶構造データベースについて紹介します．まずは検索画面から．このPowerpointは，全画面表示をすると，アニメーションが

卒業論文最終発表 WWW情報検索ナビゲーションシステムの設計と実装

空間メタデータ整備における課題園山実三菱総合研究所.

WebCluster スライドショーで見る操作ガイド

京都大学化学研究所バイオインフォマティクスセンター

生理活性化合物の合成ライフ主たる提供特許技術概要

EBSCOhost 詳細検索チュートリアル support.ebsco.com.

CiNii Articlesトップページクイックガイド <キーワードによる検索方法>

生物科学科(高分子機能学) 生体高分子解析学講座（第3）スタッフ教授新田勝利助教授出村誠助手相沢智康

Java ソフトウェア部品検索システム SPARS-J のためのリポジトリ自動更新機能の実現

InternetExplorerを起動・・・

教育研究支援センター利用方法.

管理画面操作マニュアル＜サイト管理（１）＞基本設定第9版改訂株式会社アクア 1.

生命情報学入門タンパク質の分類法演習 2011年6月14日

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

CINAHL データベースチュートリアル基本検索 featuring:

生命情報学基礎論（５）タンパク質立体構造予測

Deep Learningを用いたタンパク質のコンタクト残基予測

膜タンパク質の立体構造予測.

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

SVMを用いた生体分子への金属結合部位予測手法の提案

神奈川科学技術アカデミーバイオインフォマティクスコース蛋白質立体構造予測 I,II,演習

2017年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

2018年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

環境リスクマネジメントに関する検索システム

2017年度植物バイオサイエンス情報処理演習第1回情報検索(1) ビッグデータを眺める

只見町インターネット・エコミュージアムの「キーワード」検索の改善

WWW上の効率的なハブ探索法の提案と実装

産学連携BICSシンポジウムシリーズ３回（日本化学会春期年会平成18年３月28日）

Keigo Gohda / CAMM-Kansai

クイックガイド <キーワードによる検索方法>

eラーニング推進機構eラーニング授業設計支援室

DynaMed 新しい検索インターフェースについて support.ebsco.com.

EGSに対応した粒子軌跡と計算体系の3次元表示ソフト - CGVIEW -

情報処理概論Ⅰ 2007 第5回 2019/4/7 情報処理概論Ⅰ 第5回.

膜タンパク質のインフォマテイクス必要とされている課題.

管理画面操作マニュアル＜物件情報＞第5版改訂株式会社アクア 1.

植物系統分類学・第14回分子系統学の基礎と実践

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

2018年度植物バイオサイエンス情報処理演習第12回情報解析（2）配列相同性解析・DNA

背景課題目的手法作業期待成果有限体積法による汎用CFDにおける流体構造連成解析ソルバーの計算効率の検証

日本語タイトル（point 28）第4回DSANJ Bio Conference’19 Open

EPOC指導医マニュアル 2007年度製作者：UMIN センター　　　　　 EPOC 事務局製作日：2007/09/12.

2017年度植物バイオサイエンス情報処理演習第11回系統樹

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

2018年度植物バイオサイエンス情報処理演習第13回メタゲノミクス

Googleマップを活用した生物調査データベースの構築

eラーニング推進機構eラーニング授業設計支援室

細胞膜受容体-天然物リガンド間架橋に最適化した架橋法の開発

地理情報コンテンツ・データベースコンテンツ新規作成

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観

分子生物情報学(0) バイオインフォマティクス

Presentation transcript:

低分子化合物の結合情報を含む高精度タンパク質立体構造予測データベースを全世界に公開－創薬研究の効率化や新規機能性生体物質の創製に向けて－ 2006.9.28　2:00PM 独立行政法人　理化学研究所ゲノム科学総合研究センタータンパク質構造・機能研究グループ

アミノ酸（20種類）がつながり、3次元的な「立体構造」（形）をとったものタンパク質とはアミノ酸（20種類）がつながり、3次元的な「立体構造」（形）をとったものアミノ酸配列 Glu ＲＮＡ X線結晶解析 NMRなどから得られた立体構造情報ＤＮＡ遺伝子配列 1

ホモロジーモデリングとはホモロジーモデリング医薬品開発など標的タンパク質の立体構造予測（モデリング）コンピュータを用いた立体構造未知のタンパク質（目的タンパク質）の立体構造を、類似のアミノ酸配列をもつ立体構造既知のタンパク質（参照タンパク質）を参照して予測する方法 X線結晶解析 NMRなどから得られた立体構造情報コンピュータを用いたホモロジーモデリングアミノ酸配列目的タンパク質（立体構造未知）参照タンパク質（立体構造既知）標的タンパク質の立体構造予測（モデリング）医薬品開発など

CHIMERAとFAMSを統合したウェブユーザーフェースシステムホモロジーモデリング法の開発 CHIMERA FAMS 　様々な情報や研究者の工夫を入れながら、対話的にモデリングできるシステム。　CHIMERAの工程の自動化を目指して開発されたシステム。ゲノムワイドなモデリングに適している。 SKE-CHIMERA CHIMERAとFAMSを統合したウェブユーザーフェースシステム　モデリングの際に参考になる様々な情報をデータベース化し、自動化できる部分は自動化されているため、簡便に大量な情報を取り入れながら対話的にモデリングを行うことができるシステム。創薬などにおいて求められる高精度なモデルを構築するのに適している。　タンパク質の機能、リガンドとの相互作用などを考える際に、側鎖のコンフォメーションは非常に重要。そこで、主鎖構造のみならず、側鎖構造も精度良く予測できることを目指した。

データベース構築の流れ SKE-CHIMERA RIKEN FAMSBASE 構造未知タンパク質のアミノ酸配列 CHIMERA FAMS （インタラクティブ） FAMS （全自動システム）アライメント繰り返しデータベースモデルモデル構築モデリング情報、低分子化合物情報などを含めたデータベース、およびこれらの情報を最新の状態に維持するためのシステムを構築した。 RIKEN FAMSBASE ・モデリングされたタン　パク質データの評価値・高精度なタンパク質立体　構造予測(モデリング)情報・タンパク質に結合する　低分子化合物情報・ヒト遺伝子モデリングデータ・ラット、マウス実験動物遺伝子モデリングデータ・全タンパク質モデリングデータ・全２７７生物種遺伝子モデリングデータ・タンパク質の説明

RIKEN FAMSBASEのホームページ http://famshelp.gsc.riken.jp/famsbase/ 全277生物種遺伝子モデリングデータ全タンパク質モデリングデータラット、マウス遺伝子モデリングデータヒト遺伝子モデリングデータ

検索画面ゲノム名検索遺伝子番号検索タンパク質構造番号検索期待値検索配列相同性検索キーワード検索アミノ酸配列検索

検索結果画面の例 GDT_TS=90 GDT_TS=48 評価値 GDT_TS : Global Distance Test Total Score

検索結果画面の例 GDT_TS=90 GDT_TS=48 評価値 GDT_TS : Global Distance Test Total Score

RIKEN FAMSBASEの使い方ーアミノ酸配列からモデリングする場合ーまず、 http://famshelp.gsc.riken.jp/famsbase/ を経由してRIKEN FAMSBASE http://famshelp.gsc.riken.jp/famsbase/famsbase.html に入ります。一方、ブラウザの別ウインドウで、http://www.ncbi.nlm.nih.gov サイトを開いて調べたい立体構造未知のタンパク質のアミノ酸配列を入手する。 Searchウインドウに、目的タンパク質名、例えば「human multidrug resistance protein MDR1」を入力して「Go」をクリックします。 P08183 を選択します。「Human FAMSBASE」を選択します。最初はDisplay: 「GenPept」のページが現れるので、Display のプルダウンメニューから「FASTA」を選択します。 FASTA のページが現れます。 RIKEN FAMSBASEの検索画面の Sequence Search (BLAST) にアミノ酸配列をペーストし、直下の「BLAST search」ボタンをクリックします。目的タンパク質表示されたアミノ酸配列を範囲選択＆コピーします。次頁へ

前頁からタンパク質立体構造ビューワーソフトでダウンロードされた構造情報ファイル（この例では MDR1 のモデルと reference PDB: 1Z2R の重ね合わせ）を読み込み、ビューワーソフトの表示方法を操作すると、このようなタンパク質立体構造を見ることができます。 BLAST の結果画面で Score の値が最高値を示している「2484」の部分をクリックします BLAST の結果の詳細が表示されます。 BLAST の結果画面で「NP_000918.2」をクリックします。「Superimpose」ボタンをクリックすると、RIKEN FAMSBASE の検索画面（前頁）でアミノ酸配列入力をした目的タンパク質 (human multidrug resistance protein MDR1) のモデルと、モデルを作る土台となるタンパク質の立体構造（reference PDB）を重ね合わせた構造情報ファイル（拡張子pdb）が自動的にダウンロードされます。 reference PDBの PDBID 「1Z2R」をクリックします上段には立体構造データファイルのダウンロードのボタン等、中段には reference PDB のアミノ酸配列との比較、配列比較の下にはリガンド情報が表示されます。モデリングデータや評価値の一覧表が表示されます。 RIKEN FAMSBASE トップページの上段の「Simple Japanese explanation to use RIKEN FAMSBASE from a journal site」から簡単な日本語マニュアルが、また、「Searching examples for Riken Famsbase」から詳しい使い方や実例を紹介したファイルがダウンロードできます。 RIKEN FAMSBASE トップページの下段の Links に、タンパク質立体構造ビューワーソフト (PYMOLなど) へのリンクが貼ってあります。

モデリングから得られた立体構造とモデリングに使用した参照タンパク質の立体構造を重ね合わせた例数字は評価値 GDT_TS (Global Distance Test Total Score)。評価値が高いほど重ね合わせた構造はよく一致している。 60

タンパク質立体構造予測の国際コンテスト Critical Assessment of Techniques for Protein Structure Prediction Round 6 (CASP6) http://predictioncenter.org/casp6/Casp6.html 　タンパク質立体構造予測の精度を競う国際 blind コンテスト　　　　　　　　　実験的に立体構造が解明（公開）される直前のタンパク質　　　　　　　　　のアミノ酸配列が出題される。　　　　　　　　　参加者は、予測モデルを期限日までに提出する。　　　CASP6（2004年）　SKE-CHIMERAを用いて本研究室も参加　　　　　　　6月7日～9月2日　コンテスト開催　　　　　　　　　　出題ターゲット数　：　64　（90ドメイン）　　　　　　　　　　参加グループ数　：　266 　　　　　　　12月4日～8日　結果発表会　（Gaeta in Italy）　　　　　　　　　　主催者側から成績が発表される。　　　　　　　　　　成績が優秀であった上位入賞グループは、招待講演を行う。

December 5th: Homology Based Modeling Day http://predictioncenter.org/casp6/meeting/presentations/CASP6_Program.doc 9:00 CM/easy, CM/hard Alfonso Valencia 10:00 FR/H Roland Dunbrack 11:10 Group 450 Ginalski Krzysztof Ginalski 11:30 Group 176 Skolnick-Zhang Jeffrey Skolnick 11:50 Group 591 VENCLOVAS Ceslovas Venclovas 12:10 Group 272 CBRC-3D Kentaro Tomii 12:30 Group 454 CHIMERA Mayuko Takeda-Shitaka 12:50 Group 35 GeneSilico-Group Marcin Feder 18:30 Group 242 ZHOUSPARKS2 Yaoqi Zhou 18:50 Group 400 ACE Ming Li assessorによる評価招待講演（human predictor) 招待講演（server) 　独自に開発したシステムを用いて参加し、250を超える参加グループの中で、予測構造の正確さで国際的に高い評価を得ることができた。 Takeda-Shitaka M. et al., Proteins, 61 Suppl 7, 122-127 (2005).

コンテストに使われたタンパク質の例 Target 229_2 (37%) TM0919, T. maritima (CM/easy) psipred :CEEEECCCEEEEEECCCCEEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCCEEEEEEEEEE sam-t02-dssp :CEEEECSTCEEEEEETTSEEEEECCCHHTTTCTCCCCHHHHHHHHHHHHHHHHHHHHHHHTTCCCCCEEEEEEEEEECCTTSCCEEEEEEEEEEE sam-t02-stride :CEEEEETTTEEEEEETTTEEEEEETTTTTTTTTTCCCHHHHHHHHHHHHHHHHHHHHHHHHCCCCCTTEEEEEEEEECTTTTTTEEEEEEEEEEE robetta-jufo-3d :CEEEEECCEEEEEEECCCCEEECCCCCCCCCCCCCCCCHHHHHHHCCCCCHHHHHHHHHHHCCCCCCEEEEEEEEEEECCCCCCCEEEEEEEEEE profsec :CEEEEECCCEEEEECCCCCEEEECCCCCCCCCCCCCCHHHHHHHHHHHHHHHHHHHHHHHCCCCCCCCEEEEEEEEEECCCCCCEEEEEEEEEEE T0229 :MQARWIGNMMFHVRTDSNHDVLMDTKEEVGGKDAAPRPLELVLTGLMGCTGMDVVSILRKMKVIDQMKDFRIEIEYERTEEHPRIFTKVHLKYIF :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGN----SGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGR--QDVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQ--DVVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDGNS----GDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQD--VVDCEVKLTSERRE---RLFTHINLHFIV :ARVKWVEGLTFLGESASGHQILMDG----NSGDKAPSPMEMVLMAAGGCSAIDVVSILQKGRQDV--VDCEVKLTSERRE---RLFTHINLHFIV psipred :EECCCCCHHHHHHHHHHHCCCCCCEEEECCCCCEEEEEEEECC sam-t02-dssp :ECSSCCCHHHHHHHHHHHHHHHHHHHHHHTTCCEEEEEEEEEC sam-t02-stride :ECTTTCCHHHHHHHHHHHHHTCCCHHHHHTTTEEEEEEEEECC robetta-jufo-3d :EEECCCCHHHHHHHHHHHCCCCCCCCCHHCCCEEEEEEEEECC profsec :EECCCCCHHHHHHHHHHHHHCCCCCEEEECCCCEEEEEEEECC T0229 :KFDGEPPKDKVEKAVQLSQEKYCSVSAILKCSSKVTYEIVYEN :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRD-LKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGRDL-KDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVVA :TGR-DLKDAAVARAVDLSAEKYCSVALMLEKAVNITHSYEVV model native: 1vla GDT_TS = 80.15 The highest score among the participants.

タンパク質立体構造情報に基づく合理的薬剤設計（SBDD：Structure-Based Drug Design）タンパク質の機能は，特異的に結合する分子（基質）との相互作用により制御され，この結合には立体構造的な相補性が重要な役割を果たす．一方，疾病の多くは，タンパク質の正常な活動からの逸脱に起因すると考えられる．したがって，ある疾病関連タンパク質が特定された場合，その立体構造から引き出される情報を利用することにより，合理的な薬剤設計を行うことが可能となる．また，PCクラスター等大規模計算機システムとの組み合わせにより，短期間・低コストでの創薬が期待できる．ゲノム情報の解読実験による立体構造決定計算による立体構造予測計算によるヒット化合物探索実験によるリード化合物探索計算によるリード化合物最適化創薬ターゲットの選定実験によるリード化合物最適化薬剤候補物質立体構造解析活性部位化合物探索化合物最適化