集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観

Slides:

Advertisements

Similar presentations

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（ 1 ）スケールフリーネットワーク阿久津達也京都大学化学研究所バイオインフォマティクスセンター.

Advertisements

奈良女子大集中講義バイオインフォマティクス (3) 配列アラインメント

日本バイオインフォマティクス学会バイオインフォマティクスカリキュラム中間報告

情報生命科学特別講義III （5）配列アラインメント

生命情報学基礎論（２）配列の比較と相同性検索

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

情報生命科学特別講義III （１）文字列マッチング

低分子化合物の結合情報を含む高精度タンパク質立体構造予測データベースを全世界に公開－創薬研究の効率化や新規機能性生体物質の創製に向けて－

植物系統分類学・第13回分子系統学の基礎と実践

タンパク質相互作用ネットワークのスケールフリーモデル

奈良女子大集中講義バイオインフォマティクス (8) タンパク質立体構造予測

分子生物情報学動的計画法に基づく配列比較法 (ペアワイズアライメント法)

奈良女子大集中講義バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル

生命情報学入門タンパク質立体構造予測演習2011年5月31日

奈良女子大集中講義バイオインフォマティクス (1) 分子生物学概観

生命情報学入門機械学習を用いたタンパク質の分類法 2011年6月7日

京都大学化学研究所バイオインフォマティクスセンター

セントラルドグマ遺伝情報の流れ DNA→RNA→蛋白質→代謝などの生命活動 DNA→遺伝情報を記録した「設計図」全部の「設計図」→ゲノム

生物科学科(高分子機能学) 生体高分子解析学講座（第3）スタッフ教授新田勝利助教授出村誠助手相沢智康

京都大学化学研究所バイオインフォマティクスセンター

分子生物情報学(7) 遺伝子発現データの情報解析法スケールフリーネットワーク

タンパク3000プロジェクト個別的解析プログラム

京都大学化学研究所バイオインフォマティクスセンター

奈良女子大集中講義バイオインフォマティクス (10) スケールフリーネットワーク

生命情報学入門タンパク質の分類法演習 2011年6月14日

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（４）ブーリアンネットワーク

生命情報学基礎論（５）タンパク質立体構造予測

生命情報学入門配列のつなぎ合わせと再編成

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（３）配列アライメント

九州大学大学院情報学専攻特別講義（９）ブーリアンネットワークの解析と制御

膜タンパク質の立体構造予測.

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)

数理科学特別講義バイオインフォマティクスにおける確率モデル

神奈川科学技術アカデミーバイオインフォマティクスコース蛋白質立体構造予測 I,II,演習

2017年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

2018年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

2017年度植物バイオサイエンス情報処理演習第1回情報検索(1) ビッグデータを眺める

植物系統分類学・第15回比較ゲノミクスの基礎と実践

Keigo Gohda / CAMM-Kansai

ゲノム科学概論～ゲノム科学における統計学の役割～ (遺伝統計学)

京都大学化学研究所バイオインフォマティクスセンター

明治大学大学院理工学研究科総合講義C バイオインフォマティクスにおける数理的手法

烏骨鶏のミトコンドリア全長塩基配列について

Central Dogma Epigenetics

分子生物情報学(2) 配列のマルチプルアライメント法

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

植物系統分類学・第14回分子系統学の基礎と実践

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

九州大学大学院情報学専攻特別講義（６）固定パラメータアルゴリズムと部分k木

生物情報ソフトウェア特論（２）たたみ込みとハッシュに基づくマッチング

研究科横断型教育プログラム(Bタイプ) 統計遺伝学全５回

2017年度植物バイオサイエンス情報処理演習第11回系統樹

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

京都大学化学研究所バイオインフォマティクスセンター

2018年度植物バイオサイエンス情報処理演習第12回次世代シーケンシング・RNA

奈良女子大集中講義バイオインフォマティクス (7) 進化系統樹

生命情報学特論（６）固定パラメータアルゴリズムと部分k木

遺伝統計学集中講義（６）終わりに.

生命情報学（８）生物情報ネットワークの構造解析

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

情報生命科学特別講義III （３）たたみ込みとハッシュに基づくマッチング

2018年度植物バイオサイエンス情報処理演習第1回ビッグデータを眺める

生物情報ソフトウェア特論（１０）固定パラメータアルゴリズムと部分k木

2018年度植物バイオサイエンス情報処理演習第9回公共データバンクの代謝パスウェイ情報

配列解析アルゴリズム特論配列アライメントI

分子生物情報学(0) バイオインフォマティクス

北大ＭＭＣセミナー第100回附属社会創造数学センター主催 Date: 2019年7月11日（木） 16:30～18:00

2019年度植物バイオサイエンス情報処理演習第1回ビッグデータを眺める

Presentation transcript:

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観阿久津　達也京都大学　化学研究所バイオインフォマティクスセンター

バイオインフォマティクス（１）生物学＋情報技術（IT）１９９０年代に大きく発展 ← ゲノム計画の急速な進展　　　←　ゲノム計画の急速な進展　　　　　（既に１００種類以上の生物種のゲノムが決定）情報解析の必要性 DNA配列⇔プログラムのオブジェクトコード意味の解析が必要配列以外のデータ解析も重要立体構造、遺伝子発現データ、代謝パスウェイなど

バイオインフォマティクス（２）主要トピック分野としての特徴データベース構築遺伝子発見、遺伝子制御領域推定配列検索、配列比較、進化系統樹タンパク質構造予測、機能予測、相互作用予測遺伝子発現データ解析ネットワーク構造解析化合物の性質推定分野としての特徴多くのデータベース・ソフトウェアがWEBなどから利用可能研究成果が（生物学研究への）応用に直結

バイオインフォマティクスにおけるデータベース多くの重要なデータベースが無償でWEBからアクセス可能 DNA配列：　GenBank, EMBL, DDBJ タンパク質配列：　Swissprot タンパク質立体構造： PDB モチーフ： Prosite, Pfam, … 代謝パスウェイ： KEGG

Bioinformatics Center バイオインフォマティクスセンター Bioinformatics Center 京都大学　化学研究所　附属 2001年4月設立現在、４研究室金久研: KEGG 馬見塚研: データマイニング阿久津研: アルゴリズム人材養成ユニット（藤研）:　分子進化

KEGG: Kyoto Encyclopedia of Genes and Genomes 金久研が開発しているデータベース様々な生物情報データを格納代謝パスウェイ化合物、代謝反応式ゲノム配列遺伝子発現データ DBGET (統合データベースシステム) GenBnak, PDB, SwissProt, …

KEGG: Top page

KEGG中の代謝パスウェイの例

KEGG/LIGAND中の代謝反応式の例

研究室の研究内容研究方針研究トピック数理的原理に基づく生命情報解析手法の開発生命システムの数理的理解相互作用推定タンパク質―タンパク質、遺伝子―遺伝子などスケールフリーネットワーク配列解析（文字列解析）アルゴリズムタンパク質立体構造解析（比較・予測）化学情報解析（ケモインフォマティクス）生物データ解析のための統計的手法 HMM、サポートベクタマシン

遺伝子と蛋白質遺伝情報の流れ遺伝子ゲノムタンパク質 DNA⇒RNA⇒タンパク DNA配列中で直接的に機能する部分染色体全体（半数体）遺伝情報の総体タンパク質アミノ酸（２０種類）の鎖

DNAとアミノ酸 DNAはA,C,G,Tの４文字の並び DNAは二重ラセン構造⇒相補鎖塩基：DNA１文字、残基：アミノ酸１文字　（アミノ酸は２０種類）

アミノ酸と蛋白質アミノ酸：２０種類蛋白質：アミノ酸の鎖（短いものはペプチドと呼ばれる）

側鎖の例

計算量情報科学では、入力データのサイズ(n)に対して、計算時間がどのように変化するかを理論的に解明することが重要 O(n): かなり速い（文字列検索など） O(n log n): 結構速い（ソートなど） O(n2): まあまあ速い（アライメントなど） O(n3): ちょっと遅い（RNA二次構造予測など） O(n4): 結構遅い（Pseudo-knotつきRNA二次構造予測など） NP困難：すごく遅い（マルチプルアライメント、スレッディングなど) P=NP は理論計算機科学における最大の難問 P≠NPならば、NP困難問題に対する理論的に効率的なアルゴリズム（多項式時間アルゴリズム）は存在しないしかし、タンパク質配列などは n ≦ 1000 くらいなので、実用アルゴリズムを開発できる可能性はある

講義内容スケールフリーネットワーク配列アライメントタンパク質立体構造予測遺伝子発現データ解析タンパク質-リガンド・ドッキングカーネル法を用いた化合物の性質予測おわりに＋２１世紀COE「ゲノム科学の知的情報基盤・研究拠点形成」