ORI-GENE A Tool for Gene Classification and Prediction of Function Based on Evolutionary Tree Hideaki Mizuno, Yoshimasa Tanaka, Kenta Nakai, Akinori Sarai.

Slides:



Advertisements
Similar presentations
第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
Advertisements

理化学研究所 発生・再生科学総合研究センター 発生・再生科学総合研究センター. 発生メカニズムの解明 1つの受精卵からどの様にして複雑な個体が発生 するのか。 再生メカニズムの解明 生物はどのようなメカニズムで、怪我や病気、加齢で失った 組織や臓器を再生するのか。 再生医療への学術基盤の構築 細胞移植を中心としたヒトの再生医療に応用可能な発生・再生メカニズムの.
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
生命情報学基礎論 (2) 配列の比較と相同性検索
Drosophila solexa Tag analysis 2/25
Building text features for object image classification
UIUCへの研究訪問について ュ イ     于 漪   D2 イニシャテッブ報告会 2008年3月11日.
低分子化合物の結合情報を含む高精度タンパク質 立体構造予測データベースを全世界に公開 -創薬研究の効率化や新規機能性生体物質の創製に向けて-
初めてサテライトラボを利用する学生は1-4のステップが必要です。
植物系統分類学・第13回 分子系統学の基礎と実践
製 品 案 内 株式会社RNAi 〒 東京都文京区本郷4-1-4コスモス本郷ビル10F
How to Measure Genetic Heterogeneity
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
嫌気性生物ろ床における排水からの窒素除去機構
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
マウス表現型解析プロトコルの国際的共有 データベースの開発
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
生命情報学入門 タンパク質立体構造予測演習2011年5月31日
内科学教授 森實敏夫 Toshio Morizane, MD
MATLAB測位プログラミングの 基礎とGT (1)
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
京都大学 化学研究所 バイオインフォマティクスセンター
生命情報解析 第4回 シグナル配列の統計解析(3)
PTLV-1の起源と進化 ~ニホンザルに感染してるSTLV-1の系統学的位置の解明 ~
ゲノムネットについて 北陸先端科学技術大学院大学 知識科学研究科 佐藤賢二.
機能の獲得?喪失? 分子機械の複雑化における原動力
P4-21 ネットワーク上の経路に対する 回帰問題について
色素体の起源と進化 ラン藻と色素体の系統関係 色素体ゲノム装置の不連続進化 東京大学大学院総合文化研究科 生命環境科学系  佐藤直樹.
生命情報学基礎論 (5) タンパク質立体構造予測
遺伝子の機能は、どのようにしてわかるのか
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~
ゲノムネットの利用法に関する講習会 北陸先端科学技術大学院大学 知識科学研究科 佐藤賢二.
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
Keigo Gohda / CAMM-Kansai
Anja von Heydebreck et al. 発表:上嶋裕樹
烏骨鶏のミトコンドリア 全長塩基配列について
分子生物情報学(2) 配列のマルチプルアライメント法
ソースコードの静的特性を用いた Javaプログラム間類似度測定ツールの試作
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
ガウシアン確率伝搬法の 近似精度に対する理論解析
コーディングパターンの あいまい検索の提案と実装
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
親子鑑定に見る尤度比を 角度を変えて眺めてみる
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
Amicus: A Group Abstraction for Mobile Group Communications
Webページタイプによるクラスタ リングを用いた検索支援システム
遺伝統計学 集中講義 (6) 終わりに.
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
慶應義塾大学 政策・メディア研究科 修士課程 2年 間 博人
多様性の生物学 第11回 多様性の整理 和田 勝 東京医科歯科大学教養部.
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
配列解析アルゴリズム特論 配列アライメントI
分子生物情報学(0) バイオインフォマティクス
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

ORI-GENE A Tool for Gene Classification and Prediction of Function Based on Evolutionary Tree Hideaki Mizuno, Yoshimasa Tanaka, Kenta Nakai, Akinori Sarai Bioinformatics. 2001, 17:167-73.

目的 ゲノム情報を処理する上で有用な 計算機手法・ツールを開発する

遺伝子の配列を決定した後に・・・ 相同性検索 ...MGAPRSLLLALAAGLAVA RPPNIVLIFADDLGYGDLGCY GHPSSTTPNLDQLAAGGLRFT DFYVPVSLCTPSRAALLTGRL PVRMGMYPGVLVPSSRGGLPL EEVTVAEVLAARGYLTGMAGK WHLGVGPEGAFLPPHQGFHRF LGIPYSHDQGPCQNLTCFPPA TPCDGGCDQGLVPIPLLANLS VEAQPPWLPGLEARYMAFAHD LMADAQRQDRPFFLYYASHHT HYPQFSGQSFAERSGRGPFGD SLMELDAAVGTLMTAIGDLGL LEELVIFTADNGPETMRMSRG GCSGLLRCGKGTTYEG... 相同性検索

検索結果の一般的な解釈法 どのような機能遺伝子と相同性があるか? 機能既知遺伝子と類似≒類似の機能を持つ gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 どのような機能遺伝子と相同性があるか? 機能既知遺伝子と類似≒類似の機能を持つ

検索結果の一般的な解釈法 どのような機能遺伝子と相同性があるか? 機能既知遺伝子と相同性がなければ 手がかりは得られない! gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 どのような機能遺伝子と相同性があるか? 機能既知遺伝子と相同性がなければ 手がかりは得られない!

まだ情報は眠っている! どんな生物の遺伝子と相同性があるか? 手がかりを得ることができるのでは? -> Organism A gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 -> Organism A -> Organism B -> Organism C -> Organism D どんな生物の遺伝子と相同性があるか? 手がかりを得ることができるのでは?

系統樹を利用することで・・・ 遺伝子の伝播についての情報 遺伝子の機能についての情報 Organism A Organism B Organism C Organism D 遺伝子の伝播についての情報 遺伝子の機能についての情報

開発言語 C言語 機能 類似遺伝子の「分布パターン」を系統樹上で可視化する機能 分布パターンに基づいて遺伝子を 分類する機能

参照系統樹 *NCBI taxonomy ~35,000 species “Virus”, ”Unidentified”等は除去 *NCBI = National Center for Biotechnology Information

ORI-GENEの構成

類似遺伝子の「分布パターン」を 系統樹上で可視化する機能

archea Tubulinβ bacteria protozoa fungi animalia plantae

RubisCO cyanobacteria proteobacteria Euglenozoa Rodophyta plantae

検索結果を投影すれば・・・ 遺伝子の伝播についての情報 gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 ORI-GENE 遺伝子の伝播についての情報

分布パターンに基づいて 遺伝子を分類する機能

Classification Algorithm gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 -> Organism A -> Organism B -> Organism C -> Organism D “origin” Organism A Organism B Organism C Organism D

GENE A GENE B GENE C 複数の相同性検索結果を・・・ ORI-GENE gb:AL031601 Human DNA sequence *** SE... 100 2e-20 gb:AA153745 mq60c08.r1 Soares 2NbMT M... 98 6e-20 gb:AV069448 Mus musculus adult male s... 93 3e-18 gb:AA542446 fa07a06.s1 Zebrafish ICRF... 89 3e-17 gb:DZ81468 Caenorhabditis elegans cos... 76 7e-14 gb:U67465 Methanococcus jannaschii se... 42 1.0 gb:M19229 Yeast (S.cerevisiae) 28S la... 36 1.6 GENE B gb:X16162 Human DNA homologous to hum... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:F046247 Mus musculus clone OST167 05. 93 3e-18 gb:R75112 MDB1061 Mus musculus cDNA 3'.. 93 3e-18 gb:G39050 Z11732 Zebrafish AB Danio r... 93 3e-18 gb:A21198 S.cerevisiae DNA sequence. 78 2e-10 gb:D83536 Escherichia coli genome, 4.... 50 0.03 gb:U67460 Methanococcus jannaschii se... 36 1.6 ORI-GENE GENE C gb:R75532 MDB0729R Mus musculus cDNA ... 93 3e-18 gb:X78898 C. elegans cosmid C29E4 76 7e-14 gb:AI031518 S.cerevisiae DNA of chrom... 89 3e-17 gb:D90750 Escherichia coli genomic DN... 36 1.6

GENE A GENE B GENE C CLASS A CLASS B CLASS C Organism A B C D E F gb:AL031601 Human DNA sequence *** SE... 100 2e-20 gb:AA153745 mq60c08.r1 Soares 2NbMT M... 98 6e-20 gb:AV069448 Mus musculus adult male s... 93 3e-18 gb:AA542446 fa07a06.s1 Zebrafish ICRF... 89 3e-17 gb:DZ81468 Caenorhabditis elegans cos... 76 7e-14 gb:U67465 Methanococcus jannaschii se... 42 1.0 gb:M19229 Yeast (S.cerevisiae) 28S la... 36 1.6 gb:X16162 Human DNA homologous to hum... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:F046247 Mus musculus clone OST167 05. 93 3e-18 gb:R75112 MDB1061 Mus musculus cDNA 3'.. 93 3e-18 gb:G39050 Z11732 Zebrafish AB Danio r... 93 3e-18 gb:A21198 S.cerevisiae DNA sequence. 78 2e-10 gb:D83536 Escherichia coli genome, 4.... 50 0.03 gb:U67460 Methanococcus jannaschii se... 36 1.6 gb:R75532 MDB0729R Mus musculus cDNA ... 93 3e-18 gb:X78898 C. elegans cosmid C29E4 76 7e-14 gb:AI031518 S.cerevisiae DNA of chrom... 89 3e-17 gb:D90750 Escherichia coli genomic DN... 36 1.6 Organism A B C D E F CLASS A CLASS B CLASS C

どこを閾値とすればよいのか? gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 ? ? ?

閾値の設定 相同性検索 機能が同じ遺伝子のグループ

) ( e 閾値の設定(cont.) 1 score > 176.5 * 1- score query length 157.5 query length

S. cerevisiae 6,225遺伝子の網羅的解析 Program: BLAST2 Database: GenBank Algorithm: TBLASTN(AA vs DNA) Matrix: BLOSUM62 Filter: none Output line#: 10000

”origin”に基づく S. cerevisiae 遺伝子分類 860 446 330 646 15 555 56 63 41 3213 Saccharomyces cerevisiae C. albicans root Animalia S. pombe Plantae Protozoa Bacteria

*MIPS functional catalogueとの比較 CLASS B GENE A GENE B GENE C … GENE X GENE Y GENE Z *MIPS = Munich Information Centre for Protein Sequences

各クラスターの遺伝子構成 UNCLASSIFIED METABOLISM ENERGY PROTEINS 5 10 15 20 (%) 30 5 10 15 20 (%) METABOLISM 30 40 50 UNCLASSIFIED PROTEINS 20 40 60 80 (%) Saccharomyces cerevisiae Fungi/Metazoa group Ascomycota eukaryote crown group Eukaryota root Total

各クラスターの遺伝子構成(cont.) INTRACELLULAR SIGNAL TRANSPORT TRANSDUCTION Saccharomyces cerevisiae Fungi/Metazoa group Ascomycota eukaryote crown group Eukaryota root Total 5 10 15 20 5 10 15 (%) (%)

各クラスターの構成遺伝子の機能は 進化を反映している 生物の進化を考えることで遺伝子の 機能を予測できる

機能既知遺伝子と相同性がなくても・・・ 遺伝子の機能についての情報 gb:AA153745 mq60c08.r1 Soares 2NbMT M... 100 2e-20 gb:AC006401 *** SEQUENCING IN PROGRES... 98 6e-20 gb:AQ024197 HS_2069_B2_A08_MR CIT App... 93 3e-18 gb:AA066688 mm55a07.r1 Stratagene mou... 89 3e-17 gb:AQ642719 AQ642719 RPCI93-DpnII-26P... 76 7e-14 gb:AQ651581 AQ651581 Sheared DNA-5J24... 42 1.0 gb:AA445712 AA445712 vc62b06.s1 Knowl... 36 1.6 ORI-GENE 遺伝子の機能についての情報

Summary 今後のゲノム解析に威力を発揮 ゲノム情報を処理するためのツールORI-GENEを開発した。 分布パターンを系統樹上で可視化する機能は、遺伝子の伝播についての解析に役立つ。 分布パターンに基づき遺伝子を分類する機能は、進化の観点からの機能予測に役立つ。 今後のゲノム解析に威力を発揮

今後の課題 配列の問題について 本当に遺伝子が無いものと、配列が決まっていないだけのものを区別する手法を開発。 系統樹の問題について 複数の系統樹を用意し、比較解析できるようにする。 閾値の問題について 類似性スコアだけでなく、他の条件を加味することで精度を上げる。

Available at: http://gibk26.bio.kyutech.ac.jp/jouhou/ORI-GENE3/