分子生物情報学(0) バイオインフォマティクス

Slides:

Advertisements

Similar presentations

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（ 1 ）スケールフリーネットワーク阿久津達也京都大学化学研究所バイオインフォマティクスセンター.

Advertisements

奈良女子大集中講義バイオインフォマティクス (3) 配列アラインメント

日本バイオインフォマティクス学会バイオインフォマティクスカリキュラム中間報告

情報生命科学特別講義III （5）配列アラインメント

生命情報学基礎論（２）配列の比較と相同性検索

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

情報生命科学特別講義III （１）文字列マッチング

植物系統分類学・第13回分子系統学の基礎と実践

タンパク質相互作用ネットワークのスケールフリーモデル

奈良女子大集中講義バイオインフォマティクス (8) タンパク質立体構造予測

分子生物情報学動的計画法に基づく配列比較法 (ペアワイズアライメント法)

奈良女子大集中講義バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル

生命情報学入門タンパク質立体構造予測演習2011年5月31日

奈良女子大集中講義バイオインフォマティクス (1) 分子生物学概観

生命情報学入門機械学習を用いたタンパク質の分類法 2011年6月7日

HMM:隠れマルコフモデル電子情報工学科伊庭斉志奈良女子大集中講義バイオインフォマティクス (6)

京都大学化学研究所バイオインフォマティクスセンター

生物統計学・第2回注目要素を決めるまず木を見る、各種グラフ、ウェブツール

生物科学科(高分子機能学) 生体高分子解析学講座（第3）スタッフ教授新田勝利助教授出村誠助手相沢智康

京都大学化学研究所バイオインフォマティクスセンター

分子生物情報学(7) 遺伝子発現データの情報解析法スケールフリーネットワーク

奈良女子大集中講義バイオインフォマティクス (10) スケールフリーネットワーク

生物統計学・第2回全体を眺める（１）各種グラフ、ヒストグラム、分布

生命情報学入門タンパク質の分類法演習 2011年6月14日

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（４）ブーリアンネットワーク

生命情報学基礎論（５）タンパク質立体構造予測

生命情報学入門配列のつなぎ合わせと再編成

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（３）配列アライメント

九州大学大学院情報学専攻特別講義（９）ブーリアンネットワークの解析と制御

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)

数理科学特別講義バイオインフォマティクスにおける確率モデル

神奈川科学技術アカデミーバイオインフォマティクスコース蛋白質立体構造予測 I,II,演習

2017年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

2018年度植物バイオサイエンス情報処理演習第5回公共データバンクの遺伝子情報

2017年度植物バイオサイエンス情報処理演習第1回情報検索(1) ビッグデータを眺める

植物系統分類学・第15回比較ゲノミクスの基礎と実践

Keigo Gohda / CAMM-Kansai

ゲノム科学概論～ゲノム科学における統計学の役割～ (遺伝統計学)

ゲノム科学概論～ゲノム科学における統計学の役割～ (遺伝統計学)

京都大学化学研究所バイオインフォマティクスセンター

明治大学大学院理工学研究科総合講義C バイオインフォマティクスにおける数理的手法

烏骨鶏のミトコンドリア全長塩基配列について

Central Dogma Epigenetics

分子生物情報学(2) 配列のマルチプルアライメント法

情報生命科学特別講義III （13）固定パラメータアルゴリズムと部分k木

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

植物系統分類学・第14回分子系統学の基礎と実践

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

2018年度植物バイオサイエンス情報処理演習第12回情報解析（2）配列相同性解析・DNA

九州大学大学院情報学専攻特別講義（６）固定パラメータアルゴリズムと部分k木

生物情報ソフトウェア特論（２）たたみ込みとハッシュに基づくマッチング

研究科横断型教育プログラム(Bタイプ) 統計遺伝学全５回

期末レポートの内容使うデータ「biostat18finaldata.txt」遺伝子発現データ

2017年度植物バイオサイエンス情報処理演習第11回系統樹

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

京都大学化学研究所バイオインフォマティクスセンター

2018年度植物バイオサイエンス情報処理演習第12回次世代シーケンシング・RNA

奈良女子大集中講義バイオインフォマティクス (7) 進化系統樹

生命情報学特論（６）固定パラメータアルゴリズムと部分k木

生命情報学（８）生物情報ネットワークの構造解析

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

情報生命科学特別講義III （３）たたみ込みとハッシュに基づくマッチング

2018年度植物バイオサイエンス情報処理演習第1回ビッグデータを眺める

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観

2018年度植物バイオサイエンス情報処理演習第9回公共データバンクの代謝パスウェイ情報

配列解析アルゴリズム特論配列アライメントI

北大ＭＭＣセミナー第100回附属社会創造数学センター主催 Date: 2019年7月11日（木） 16:30～18:00

2019年度植物バイオサイエンス情報処理演習第1回ビッグデータを眺める

Presentation transcript:

分子生物情報学(0) バイオインフォマティクス阿久津　達也京都大学　化学研究所バイオインフォマティクスセンター

バイオインフォマティクス（１）生物学＋情報技術（IT）１９９０年代に大きく発展 ← ゲノム計画の急速な進展　　　←　ゲノム計画の急速な進展　　　　　（既に１００種類程度以上の生物種のゲノムが決定）情報解析の必要性 DNA配列⇔プログラムのオブジェクトコード意味の解析が必要配列以外のデータ解析も重要立体構造、遺伝子発現データ、代謝パスウェイなど

バイオインフォマティクス（２）主要トピック分野としての特徴データベース構築遺伝子発見、遺伝子制御領域推定配列検索、配列比較、進化系統樹たんぱく質／RNA構造予測、機能予測、相互作用予測遺伝子発現データ解析分野としての特徴多くのデータベース・ソフトウェアがWEBなどから利用可能研究成果が（生物学研究への）応用に直結

バイオインフォマティクスにおけるデータベース多くの重要なデータベースが無償でWEBからアクセス可能 DNA配列：　GenBank, EMBL, DDBJ タンパク質配列：　Swissprot タンパク質立体構造： PDB モチーフ： Prosite, Pfam, … 代謝パスウェイ： KEGG

Bioinformatics Center バイオインフォマティクスセンター Bioinformatics Center 京都大学　化学研究所　附属 2001年4月設立現在、４研究室金久研: KEGG 藤研:　分子進化馬見塚研: データマイニング阿久津研: アルゴリズム

研究室の研究内容研究方針研究トピック数理的原理に基づく生命情報解析手法の開発生命システムの数理的理解相互作用推定タンパク質―タンパク質、遺伝子―遺伝子などスケールフリーネットワーク配列解析（文字列解析）アルゴリズムタンパク質立体構造解析（比較・予測）化学情報解析（ケモインフォマティクス）生物データ解析のための統計的手法 HMM、サポートベクタマシン

遺伝子と蛋白質遺伝情報の流れ遺伝子ゲノムタンパク質 DNA⇒RNA⇒タンパク DNA配列中で直接的に機能する部分染色体全体（半数体）遺伝情報の総体タンパク質アミノ酸（２０種類）の鎖

DNAとアミノ酸 DNAはA,C,G,Tの４文字の並び DNAは二重ラセン構造⇒相補鎖塩基：DNA１文字、残基：アミノ酸１文字　（アミノ酸は２０種類）

アミノ酸と蛋白質アミノ酸：２０種類蛋白質：アミノ酸の鎖（短いものはペプチドと呼ばれる）

側鎖の例

計算量情報科学では、入力データのサイズ(n)に対して、計算時間がどのように変化するかを理論的に解明することが重要 O(n): かなり速い（文字列検索など） O(n log n): 結構速い（ソートなど） O(n2): まあまあ速い（アライメントなど） O(n3): ちょっと遅い（RNA二次構造予測など） O(n4): 結構遅い（Pseudo-knotつきRNA二次構造予測など） NP困難：すごく遅い（マルチプルアライメント、スレッディングなど) P=NP は理論計算機科学における最大の難問 P≠NPならば、NP困難問題に対する理論的に効率的なアルゴリズム（多項式時間アルゴリズム）は存在しないしかし、タンパク質配列などは n ≦ 1000 くらいなので、実用アルゴリズムを開発できる可能性はある

講義内容ペアワイズアライメント法（動的計画法）マルチプルアライメント法確率モデル(HMM)に基づく配列解析進化系統樹推定法 RNAおよびタンパク質の高次構造推定遺伝子発現データの情報解析法スケールフリーネットワーク