動的計画法を用いたアラインメント 0240501 小菅孝史.

Slides:



Advertisements
Similar presentations
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
Advertisements

情報生命科学特別講義III (5)配列アラインメント
生命情報学基礎論 (2) 配列の比較と相同性検索
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
プログラムのパタン演習 解説.
Data Clustering: A Review
C言語 配列 2016年 吉田研究室.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
原子動力工学特論 課題 3、4 交通電子機械工学専攻   齋藤 泰治.
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
C言語 配列 2016年 吉田研究室.
1DS04168E 梅根綾花 1DS04184E 清 泰裕 1DS04197P 福井千尋
IT入門B2 ー 連立一次方程式 ー.
アルゴリズムとデータ構造 補足資料7-3 「単純選択ソートselsort.c」
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
第 七 回 双対問題とその解法 山梨大学.
京都大学 化学研究所 バイオインフォマティクスセンター
数値解析シラバス C言語環境と数値解析の概要(1回) 方程式の根(1回) 連立一次方程式(2回) 補間と近似(2回) 数値積分(1回)
プログラミング演習Ⅰ 課題2 10進数と2進数 2回目.
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(5) 木構造データ間の編集距離
情報生命科学特別講義III (7)進化系統樹推定
配列および化合物データ解析のためのカーネル法
第6章 カーネル法 修士2年 藤井 敬士.
二分探索木によるサーチ.
情報生命科学特別講義III (11) RNA二次構造予測
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
生命情報学基礎論 (5) タンパク質立体構造予測
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による 化合物の性質予測(3) 配列アライメント
決定木とランダムフォレスト 和田 俊和.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
数理科学特別講義 バイオインフォマティクスにおける 確率モデル
情報生命科学特別講義III (12) タンパク質立体構造の比較と予測
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
群知能を適用した アクセス制御システム 木下研究室 久保直也                                                     
生  物  数  学 斉木 里恵.
分子生物情報学(2) 配列のマルチプルアライメント法
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
算法数理工学 第10回 定兼 邦彦.
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
岩村雅一 知能情報工学演習I 第12回(C言語第6回) 岩村雅一
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
九州大学大学院 情報学専攻特別講義 (2) 配列アラインメント
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
15.cons と種々のデータ構造.
九州大学大学院 情報学専攻特別講義 (5)タンパク質立体構造の比較と予測
経営学研究科 M1年 学籍番号 speedster
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
第16章 動的計画法 アルゴリズムイントロダクション.
行列式 方程式の解 Cramerの公式 余因数展開.
データ解析 静岡大学工学部 安藤和敏
プログラミング言語論 第10回 情報工学科 篠埜 功.
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
ヒープソート.
Locally-Weighted Partial Least Squares LWPLS 局所PLS
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
プログラミング基礎a 第5回 C言語によるプログラミング入門 配列と文字列
第4回 配列.
配列解析アルゴリズム特論 配列アライメントI
第5回 配列.
プログラミング演習I 補講用課題
Presentation transcript:

動的計画法を用いたアラインメント 0240501 小菅孝史

アラインメントとは何か? 配列を要素ごとに対応づける事、比較 配列の類似度を計算する 2本 →ペアワイズアラインメント 2本   →ペアワイズアラインメント 3本以上→マルチプルアラインメント アラインメントでは、配列要素をそのまま対応づけるだけでなく、進化の過程で生じ得る配列要素の挿入・欠損を扱うため、ギャップを対応づける

グローバル(全体的)アラインメントと ローカル(局所的)アラインメント グローバル(全体的)アラインメントと      ローカル(局所的)アラインメント 配列1:MIGMMIT 配列2:MMIGPIT 全体的に見ると・・・MーIGMMIT               MMIGPーIT   局所的に見ると・・・MIGMMIT               ーーーMMIGPIT

アラインメントから分かる事 類似性から進化系統樹(生物がどのような順番で枝分かれしてきたか)を作成する事が可能

動的計画法を用いた計算法 動的計画法・・・ある段階で得られた最適解(最大or最小)をもとに次の段階の最適解を求める アラインメントに対して点数(スコア)をつけ、スコアを最大にする事を目標とする

スコアについて 配列要素1つ1つのペアに定義される類似度 配列要素とギャップとを対応づけるときは 、スコアペナルティー 「d」を適用する 最も単純なスコアは, s(a,b)の値をa=bのとき「1」, a=bでないとき「0」とする定義である. 塩基配列には, このスコアが一般に用いられる  アミノ酸配列については統計的に関連性のある要素が対になる確率を整数化したものを用いる  

2つの配列x=x1x2... xmとy=y1y2... ynのアラインメントを求める(グローバル) Fを(m+1)×(n+1)行列             F(0,0)=0, F(i,0)=id, F(0,j)=jd, F(i,j)=max(A,B,C) A=F(i-1,j-1)+s(xi, xj) B=F(i-1,j)+d C=F(i,j-1)+d

続き xi-1 xi yi yj-1 F(i-1,j-1) F(i,j-1) F(i-1,j) F(i,j) F(i-1,j-1)→F(i,j) xiとyiのアラインメントをとる (Aの場合) F(i-1,j-1) → F(i-1,j)→F(i,j) xi-1とyjが対応。xiとギャップを対応づける (Bの場合) F(i-1,j-1) → F(i,j-1)→F(i,j) xiとyj-1が対応。yjとギャップを対応付ける (Cの場合) xi-1 xi yj-1 F(i-1,j-1) F(i,j-1) yi F(i-1,j) F(i,j)

2つのアミノ酸配列の 最適アラインメント 配列1:HEAGAWGHEE 配列2:PAWHEAE の最適アラインメントを求める。 2つのアミノ酸配列の          最適アラインメント 配列1:HEAGAWGHEE 配列2:PAWHEAE の最適アラインメントを求める。 ただし、d=-8(ギャップが起きた場合のスコアペナルティー)  

グローバルアラインメント

2つの配列x=x1x2... xmとy=y1y2... ynのアラインメントを求める(ローカル) F(i,j)=max(A,B,C,0) A=F(i-1,j-1)+s(xi, xj) B=F(i-1,j)+d C=F(i,j-1)+d ただし、F(0,0)=F(i,0)=F(0,j)=0 負のスコア値の場合、アラインメントを新しく始める

ローカルアラインメント