Download presentation
Presentation is loading. Please wait.
1
生 物 数 学 斉木 里恵
2
生物数学について・・・ これから話す内容の中では、分子生物学の中で、DNAやタンパク質などを扱いやすくするために数学的に表す。
生物学を学ぶ人にとっては新しい考え方や発見ができる。 数学を学ぶ人にとっては数学が実際にどのように活用されているかを知ることができる。
3
大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成
4
例えば・・・ S1:ATTGCGTATGCC S2:AATGCCTAAGCC S3:AATGCCTAAGGC ↓
5
進化系統樹 <大原則>Bifurcating(分岐する) 1つの内点に3つのedgeが集結する。 (根には2つのedgeが集結する。)
6
位相的に同じ
7
U P G M A FitchMargoliashアルゴリズム 近 隣 結 合 法
3つの進化系統樹作成法 U P G M A FitchMargoliashアルゴリズム 近 隣 結 合 法
8
UPGMA ※分子時計を仮定する。 ①一番近い2つのtaxaを結合。 ②その2つのtaxaを1つとみなして、また一番近いtaxaを結合。
③これを繰り返す。 S1 S2 S3 S4 4 2 6
9
3点の公式 3点A,B,Cについて、それぞれの2点間の距離がわかっているとき、 x=(dAB+dAC-dBC)/2
3点A,B,Cについて、それぞれの2点間の距離がわかっているとき、 x=(dAB+dAC-dBC)/2 y=(dAB+dBC-dAC)/2 z=(dAC+dBC-dAB)/2 が成り立つ。
10
FMアルゴリズム ※分子時計を仮定せず、よりデータに近い系統樹を作成。
①1番近い2つのtaxaとそれ以外のすべてのtaxaについて3点の公式を使う。 S1 S2 S3 S4 6 3 7 8
11
S1-3 S2 S4 13/2 15/2 7 ②さっきの2つのtaxaを 1つのグループにし、もう1度表を作り直す。そのあとはまた①の手順を繰り返す。
12
完成
13
近隣結合法 UPGMAやFMアルゴリズムでは距離が1番近いtaxaを選んでいた。 ↓ 左図の場合S1とS2を結合させてしまう。
UPGMAやFMアルゴリズムでは距離が1番近いtaxaを選んでいた。 ↓ 左図の場合S1とS2を結合させてしまう。 neighborsを結合させるような方法が必要。
14
neighborsなら・・・ d(S1,S2)+d(Si,Sj)<d(S1,Si)+d(S2,Sj) ↓
(N-3)d(S1,S2)+∑j=3,j≠id(Si,Sj) <(N-3)d(S1,Si)+∑j=3,j≠id(S2,Sj) (N-2)d(S1,S2)+Rⅰ<(N-2)d(S1,Si)+R2
15
(N-2)d(S1,S2)+Rⅰ<(N-2)d(S1,Si)+R2
↓ (N-2)d(S1,S2)-R1-R2 <(N-2)d(S1,Si)-R1-Rⅰ M(S1,S2)<M(S1,Si) つまり、 SnとSmがneighborsなら、全てのk≠mに対して、 M(Sn,Sm)<M(Sn,Sk) が成り立つ。
16
近隣結合法の手順 ①N個のtaxaに対し、Mの値の表を作る。Mの値が最も小さくなるSi、Sjを選ぶ。
②Si、Sj以外のtaxaを1つのグループGとする。3点の公式を使ってd(Si,V)、d(Sj,V)を求める。 ③Sk∈Gに対して3点の公式を使ってd(Sk,V)をそれぞれ求める。 それを新しい距離データの表とする。 ④これらの操作をtaxaが3つになるまで繰り返す。3つになったら3点の公式を使って終わり。
17
大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成
18
塩基置換の行列モデル 初期の塩基配分・・・P0=(PA,PG,PC,PT) 条件付確率・・・・・・・Pi|j=P(S1=i|S0=j)
遷移行列 PA|APA|GPA|CPA|T M=PG|APG|GPG|CPG|T PC|APC|GPC|CPC|T PT|APT|GPT|CPT|T 1単位時間後の塩基配分 MP0=P1
19
マルコフモデル マルコフ行列とは、成分が全て0以上で、列の和が1の行列。 ※成分が正のマルコフ行列はいつも狭義最大固有値λ=1を持つ。
マルコフ行列とは、成分が全て0以上で、列の和が1の行列。 ※成分が正のマルコフ行列はいつも狭義最大固有値λ=1を持つ。 ※λ=1に対応する固有ベクトルはただ1つ存在する。 ∵フロベニウスの定理。
20
Jukes-Cantorモデル 全ての塩基置換が同じ確率で起こる。 P0=(1/4,1/4,1/4,1/4) その変異率をαとすると、
1-α α/3 α/3 α/3 M=α/3 1-α α/3 α/3 α/3 α/3 1-α α/3 α/3 α/3 α/3 1-α
21
木村2,3パラメータモデル 木村2パラメータモデル * β γ γ M=β * γ γ γ γ * β γ γ β * *=1-β-γ
* β γ γ M=β * γ γ γ γ * β γ γ β * *=1-β-γ 木村3パラメータモデル * β γ δ M=β * δ γ γ δ * β δ γ β * *=1-β-γ-δ
22
Jukes-Cantor距離 d=t×α =(経過時間)×(変異率) =(経過時間)×(siteごとの塩基置換の数)
=(経過時間)×(変異率) =(経過時間)×(siteごとの塩基置換の数) =(経過時間内でのsiteごとの塩基置換の数) dは経過時間に比例する。dを進化の距離ととらえる。
23
いろいろな距離公式 Jukes-Cantor距離 dJC(S0,S1)= -3/4ln(1-4p/3) 木村2パラメータ距離
dK2(S0,S1)=-1/2ln(1-2p1-p2) -1/4ln(1-2p2) 木村3パラメータ距離 dK3(S0,S1)=-1/4(ln(1-2β-2γ) +ln(1-2β-2δ)+ln(1-2γ-2δ)) Log-det距離 dLD(S0,S1)=-1/4(ln(det(F))-1/2ln(g0g1))
24
大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.