集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観

Slides:



Advertisements
Similar presentations
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.
Advertisements

奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
情報生命科学特別講義III (5)配列アラインメント
生命情報学基礎論 (2) 配列の比較と相同性検索
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (1) 文字列マッチング
低分子化合物の結合情報を含む高精度タンパク質 立体構造予測データベースを全世界に公開 -創薬研究の効率化や新規機能性生体物質の創製に向けて-
植物系統分類学・第13回 分子系統学の基礎と実践
タンパク質相互作用ネットワークの スケールフリーモデル
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
生命情報学入門 タンパク質立体構造予測演習2011年5月31日
奈良女子大集中講義 バイオインフォマティクス (1) 分子生物学概観
生命情報学入門 機械学習を用いたタンパク質の分類法 2011年6月7日
京都大学 化学研究所 バイオインフォマティクスセンター
セントラルドグマ 遺伝情報の流れ DNA→RNA→蛋白質→代謝などの生命活動 DNA→遺伝情報を記録した「設計図」 全部の「設計図」→ゲノム
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
京都大学 化学研究所 バイオインフォマティクスセンター
分子生物情報学(7) 遺伝子発現データの情報解析法 スケールフリーネットワーク
タンパク3000プロジェクト個別的解析プログラム
京都大学 化学研究所 バイオインフォマティクスセンター
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
生命情報学入門 タンパク質の分類法演習 2011年6月14日
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(4) ブーリアンネットワーク
生命情報学基礎論 (5) タンパク質立体構造予測
生命情報学入門 配列のつなぎ合わせと再編成
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による 化合物の性質予測(3) 配列アライメント
九州大学大学院 情報学専攻特別講義 (9) ブーリアンネットワークの 解析と制御
膜タンパク質の 立体構造予測.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)
数理科学特別講義 バイオインフォマティクスにおける 確率モデル
神奈川科学技術アカデミー バイオインフォマティクスコース 蛋白質立体構造予測 I,II,演習
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
Keigo Gohda / CAMM-Kansai
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
京都大学 化学研究所 バイオインフォマティクスセンター
明治大学大学院理工学研究科 総合講義C バイオインフォマティクスにおける 数理的手法
烏骨鶏のミトコンドリア 全長塩基配列について
Central Dogma Epigenetics
分子生物情報学(2) 配列のマルチプルアライメント法
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
植物系統分類学・第14回 分子系統学の基礎と実践
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
研究科横断型教育プログラム(Bタイプ) 統計遺伝学 全5回
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
京都大学 化学研究所 バイオインフォマティクスセンター
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
遺伝統計学 集中講義 (6) 終わりに.
生命情報学 (8) 生物情報ネットワークの構造解析
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
配列解析アルゴリズム特論 配列アライメントI
分子生物情報学(0) バイオインフォマティクス
北大MMCセミナー 第100回 附属社会創造数学センター主催 Date: 2019年7月11日(木) 16:30~18:00
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観 集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター

バイオインフォマティクス(1) 生物学+情報技術(IT) 1990年代に大きく発展 ← ゲノム計画の急速な進展    ← ゲノム計画の急速な進展      (既に100種類以上の生物種のゲノムが決定) 情報解析の必要性 DNA配列⇔プログラムのオブジェクトコード 意味の解析が必要 配列以外のデータ解析も重要 立体構造、遺伝子発現データ、代謝パスウェイなど

バイオインフォマティクス(2) 主要トピック 分野としての特徴 データベース構築 遺伝子発見、遺伝子制御領域推定 配列検索、配列比較、進化系統樹 タンパク質構造予測、機能予測、相互作用予測 遺伝子発現データ解析 ネットワーク構造解析 化合物の性質推定 分野としての特徴 多くのデータベース・ソフトウェアがWEBなどから利用可能 研究成果が(生物学研究への)応用に直結

バイオインフォマティクスにおける データベース 多くの重要なデータベースが無償でWEBからアクセス可能 DNA配列: GenBank, EMBL, DDBJ タンパク質配列: Swissprot タンパク質立体構造: PDB モチーフ: Prosite, Pfam, … 代謝パスウェイ: KEGG

Bioinformatics Center バイオインフォマティクスセンター Bioinformatics Center 京都大学 化学研究所 附属 2001年4月設立 現在、4研究室 金久研: KEGG 馬見塚研: データマイニング 阿久津研: アルゴリズム 人材養成ユニット(藤研): 分子進化

KEGG: Kyoto Encyclopedia of Genes and Genomes 金久研が開発しているデータベース 様々な生物情報データを格納 代謝パスウェイ 化合物、代謝反応式 ゲノム配列 遺伝子発現データ DBGET (統合データベースシステム) GenBnak, PDB, SwissProt, …

KEGG: Top page

KEGG中の代謝パスウェイの例

KEGG/LIGAND中の代謝反応式の例

研究室の研究内容 研究方針 研究トピック 数理的原理に基づく生命情報解析手法の開発 生命システムの数理的理解 相互作用推定 タンパク質―タンパク質、遺伝子―遺伝子など スケールフリーネットワーク 配列解析(文字列解析)アルゴリズム タンパク質立体構造解析(比較・予測) 化学情報解析(ケモインフォマティクス) 生物データ解析のための統計的手法 HMM、サポートベクタマシン

遺伝子と蛋白質 遺伝情報の流れ 遺伝子 ゲノム タンパク質 DNA⇒RNA⇒タンパク DNA配列中で直接的に 機能する部分 染色体全体(半数体) 遺伝情報の総体 タンパク質 アミノ酸(20種類)の鎖

DNAとアミノ酸 DNAはA,C,G,Tの4文字の並び DNAは二重ラセン構造⇒相補鎖 塩基:DNA1文字、 残基:アミノ酸1文字  (アミノ酸は20種類)

アミノ酸と蛋白質 アミノ酸:20種類 蛋白質:アミノ酸の鎖(短いものはペプチドと呼ばれる)

側鎖の例

計算量 情報科学では、入力データのサイズ(n)に対して、計算時間がどのように変化するかを理論的に解明することが重要 O(n): かなり速い(文字列検索など) O(n log n): 結構速い(ソートなど) O(n2): まあまあ速い(アライメントなど) O(n3): ちょっと遅い(RNA二次構造予測など) O(n4): 結構遅い(Pseudo-knotつきRNA二次構造予測など) NP困難: すごく遅い (マルチプルアライメント、スレッディングなど) P=NP は理論計算機科学における最大の難問 P≠NPならば、NP困難問題に対する理論的に効率的なアルゴリズム(多項式時間アルゴリズム)は存在しない しかし、タンパク質配列などは n ≦ 1000 くらいなので、実用アルゴリズムを開発できる可能性はある

講義内容 スケールフリーネットワーク 配列アライメント タンパク質立体構造予測 遺伝子発現データ解析 タンパク質-リガンド・ドッキング カーネル法を用いた化合物の性質予測 おわりに+21世紀COE「ゲノム科学の知的情報基盤・研究拠点形成」