分子生物情報学(0) バイオインフォマティクス

分子生物情報学(0) バイオインフォマティクス
阿久津　達也京都大学　化学研究所バイオインフォマティクスセンター

バイオインフォマティクス（１）生物学＋情報技術（IT）１９９０年代に大きく発展 ← ゲノム計画の急速な進展
　　　←　ゲノム計画の急速な進展　　　　　（既に１００種類程度以上の生物種のゲノムが決定）情報解析の必要性 DNA配列⇔プログラムのオブジェクトコード意味の解析が必要配列以外のデータ解析も重要立体構造、遺伝子発現データ、代謝パスウェイなど

バイオインフォマティクス（２）主要トピック分野としての特徴データベース構築遺伝子発見、遺伝子制御領域推定
配列検索、配列比較、進化系統樹たんぱく質／RNA構造予測、機能予測、相互作用予測遺伝子発現データ解析分野としての特徴多くのデータベース・ソフトウェアがWEBなどから利用可能研究成果が（生物学研究への）応用に直結

バイオインフォマティクスにおけるデータベース
多くの重要なデータベースが無償でWEBからアクセス可能 DNA配列：　GenBank, EMBL, DDBJ タンパク質配列：　Swissprot タンパク質立体構造： PDB モチーフ： Prosite, Pfam, … 代謝パスウェイ： KEGG

Bioinformatics Center
バイオインフォマティクスセンター Bioinformatics Center 京都大学　化学研究所　附属 2001年4月設立現在、４研究室金久研: KEGG 藤研:　分子進化馬見塚研: データマイニング阿久津研: アルゴリズム

研究室の研究内容研究方針研究トピック数理的原理に基づく生命情報解析手法の開発生命システムの数理的理解相互作用推定
タンパク質―タンパク質、遺伝子―遺伝子などスケールフリーネットワーク配列解析（文字列解析）アルゴリズムタンパク質立体構造解析（比較・予測）化学情報解析（ケモインフォマティクス）生物データ解析のための統計的手法 HMM、サポートベクタマシン

遺伝子と蛋白質遺伝情報の流れ遺伝子ゲノムタンパク質 DNA⇒RNA⇒タンパク DNA配列中で直接的に機能する部分
染色体全体（半数体）遺伝情報の総体タンパク質アミノ酸（２０種類）の鎖

DNAとアミノ酸 DNAはA,C,G,Tの４文字の並び DNAは二重ラセン構造⇒相補鎖塩基：DNA１文字、残基：アミノ酸１文字
　（アミノ酸は２０種類）

アミノ酸と蛋白質アミノ酸：２０種類蛋白質：アミノ酸の鎖（短いものはペプチドと呼ばれる）

側鎖の例

計算量情報科学では、入力データのサイズ(n)に対して、計算時間がどのように変化するかを理論的に解明することが重要
O(n): かなり速い（文字列検索など） O(n log n): 結構速い（ソートなど） O(n2): まあまあ速い（アライメントなど） O(n3): ちょっと遅い（RNA二次構造予測など） O(n4): 結構遅い（Pseudo-knotつきRNA二次構造予測など） NP困難：すごく遅い（マルチプルアライメント、スレッディングなど) P=NP は理論計算機科学における最大の難問 P≠NPならば、NP困難問題に対する理論的に効率的なアルゴリズム（多項式時間アルゴリズム）は存在しないしかし、タンパク質配列などは n ≦ 1000 くらいなので、実用アルゴリズムを開発できる可能性はある

講義内容ペアワイズアライメント法（動的計画法）マルチプルアライメント法確率モデル(HMM)に基づく配列解析進化系統樹推定法
RNAおよびタンパク質の高次構造推定遺伝子発現データの情報解析法スケールフリーネットワーク

分子生物情報学(0) バイオインフォマティクス

Similar presentations

Presentation on theme: "分子生物情報学(0) バイオインフォマティクス"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

分子生物情報学(0) バイオインフォマティクス

Similar presentations

Presentation on theme: "分子生物情報学(0) バイオインフォマティクス"— Presentation transcript:

Similar presentations

About project

フィードバック