分子生物情報学(0) バイオインフォマティクス

Slides:



Advertisements
Similar presentations
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.
Advertisements

奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
情報生命科学特別講義III (5)配列アラインメント
生命情報学基礎論 (2) 配列の比較と相同性検索
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (1) 文字列マッチング
植物系統分類学・第13回 分子系統学の基礎と実践
タンパク質相互作用ネットワークの スケールフリーモデル
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
生命情報学入門 タンパク質立体構造予測演習2011年5月31日
奈良女子大集中講義 バイオインフォマティクス (1) 分子生物学概観
生命情報学入門 機械学習を用いたタンパク質の分類法 2011年6月7日
HMM:隠れマルコフモデル 電子情報工学科 伊庭 斉志 奈良女子大集中講義 バイオインフォマティクス (6)
京都大学 化学研究所 バイオインフォマティクスセンター
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
京都大学 化学研究所 バイオインフォマティクスセンター
分子生物情報学(7) 遺伝子発現データの情報解析法 スケールフリーネットワーク
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生命情報学入門 タンパク質の分類法演習 2011年6月14日
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(4) ブーリアンネットワーク
生命情報学基礎論 (5) タンパク質立体構造予測
生命情報学入門 配列のつなぎ合わせと再編成
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による 化合物の性質予測(3) 配列アライメント
九州大学大学院 情報学専攻特別講義 (9) ブーリアンネットワークの 解析と制御
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)
数理科学特別講義 バイオインフォマティクスにおける 確率モデル
神奈川科学技術アカデミー バイオインフォマティクスコース 蛋白質立体構造予測 I,II,演習
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
Keigo Gohda / CAMM-Kansai
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
京都大学 化学研究所 バイオインフォマティクスセンター
明治大学大学院理工学研究科 総合講義C バイオインフォマティクスにおける 数理的手法
烏骨鶏のミトコンドリア 全長塩基配列について
Central Dogma Epigenetics
分子生物情報学(2) 配列のマルチプルアライメント法
情報生命科学特別講義III (13) 固定パラメータアルゴリズムと 部分k木
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
植物系統分類学・第14回 分子系統学の基礎と実践
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
研究科横断型教育プログラム(Bタイプ) 統計遺伝学 全5回
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
京都大学 化学研究所 バイオインフォマティクスセンター
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
生命情報学 (8) 生物情報ネットワークの構造解析
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
配列解析アルゴリズム特論 配列アライメントI
北大MMCセミナー 第100回 附属社会創造数学センター主催 Date: 2019年7月11日(木) 16:30~18:00
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

分子生物情報学(0) バイオインフォマティクス 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター

バイオインフォマティクス(1) 生物学+情報技術(IT) 1990年代に大きく発展 ← ゲノム計画の急速な進展    ← ゲノム計画の急速な進展      (既に100種類程度以上の生物種のゲノムが決定) 情報解析の必要性 DNA配列⇔プログラムのオブジェクトコード 意味の解析が必要 配列以外のデータ解析も重要 立体構造、遺伝子発現データ、代謝パスウェイなど

バイオインフォマティクス(2) 主要トピック 分野としての特徴 データベース構築 遺伝子発見、遺伝子制御領域推定 配列検索、配列比較、進化系統樹 たんぱく質/RNA構造予測、機能予測、相互作用予測 遺伝子発現データ解析 分野としての特徴 多くのデータベース・ソフトウェアがWEBなどから利用可能 研究成果が(生物学研究への)応用に直結

バイオインフォマティクスにおける データベース 多くの重要なデータベースが無償でWEBからアクセス可能 DNA配列: GenBank, EMBL, DDBJ タンパク質配列: Swissprot タンパク質立体構造: PDB モチーフ: Prosite, Pfam, … 代謝パスウェイ: KEGG

Bioinformatics Center バイオインフォマティクスセンター Bioinformatics Center 京都大学 化学研究所 附属 2001年4月設立 現在、4研究室 金久研: KEGG 藤研: 分子進化 馬見塚研: データマイニング 阿久津研: アルゴリズム

研究室の研究内容 研究方針 研究トピック 数理的原理に基づく生命情報解析手法の開発 生命システムの数理的理解 相互作用推定 タンパク質―タンパク質、遺伝子―遺伝子など スケールフリーネットワーク 配列解析(文字列解析)アルゴリズム タンパク質立体構造解析(比較・予測) 化学情報解析(ケモインフォマティクス) 生物データ解析のための統計的手法 HMM、サポートベクタマシン

遺伝子と蛋白質 遺伝情報の流れ 遺伝子 ゲノム タンパク質 DNA⇒RNA⇒タンパク DNA配列中で直接的に 機能する部分 染色体全体(半数体) 遺伝情報の総体 タンパク質 アミノ酸(20種類)の鎖

DNAとアミノ酸 DNAはA,C,G,Tの4文字の並び DNAは二重ラセン構造⇒相補鎖 塩基:DNA1文字、 残基:アミノ酸1文字  (アミノ酸は20種類)

アミノ酸と蛋白質 アミノ酸:20種類 蛋白質:アミノ酸の鎖(短いものはペプチドと呼ばれる)

側鎖の例

計算量 情報科学では、入力データのサイズ(n)に対して、計算時間がどのように変化するかを理論的に解明することが重要 O(n): かなり速い(文字列検索など) O(n log n): 結構速い(ソートなど) O(n2): まあまあ速い(アライメントなど) O(n3): ちょっと遅い(RNA二次構造予測など) O(n4): 結構遅い(Pseudo-knotつきRNA二次構造予測など) NP困難: すごく遅い (マルチプルアライメント、スレッディングなど) P=NP は理論計算機科学における最大の難問 P≠NPならば、NP困難問題に対する理論的に効率的なアルゴリズム(多項式時間アルゴリズム)は存在しない しかし、タンパク質配列などは n ≦ 1000 くらいなので、実用アルゴリズムを開発できる可能性はある

講義内容 ペアワイズアライメント法(動的計画法) マルチプルアライメント法 確率モデル(HMM)に基づく配列解析 進化系統樹推定法 RNAおよびタンパク質の高次構造推定 遺伝子発現データの情報解析法 スケールフリーネットワーク