Presentation is loading. Please wait.

Presentation is loading. Please wait.

生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹

Similar presentations


Presentation on theme: "生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹"— Presentation transcript:

1 生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹
情報科学講究II (5) 生物分類と配列 分類・系統樹とは     遺伝・相同性・系統樹

2 今回の目標 遺伝子解析が、生物分類・系統樹に どう使われるか理解する 生物分類・系統樹の考え方が 遺伝子解析でどう変わったか理解する
遺伝子解析が、生物分類・系統樹に  どう使われるか理解する 生物分類・系統樹の考え方が  遺伝子解析でどう変わったか理解する 今日のタネ本は Lesk著 バイオインフォマティクス基礎講義    2章ゲノムの構成と進化、4章アラインメントと系統樹 宮田隆著 分子進化学への招待(講談社ブルーバックス) 郷通子編集 基礎と実習 バイオインフォマティクス   4章 タンパク質の進化とデザイン 講究II (7) 2007/10/19

3 生物分類の考え方の流れ 生物は多様 ⇒ 分類してグループに分けたい ⇒形態や機能から分類
生物は多様 ⇒ 分類してグループに分けたい   ⇒形態や機能から分類 ダーウィンの進化論  ⇒ 形態や機能は遺伝するはずなので    グループ間には遺伝的な関係があるはず   ⇒ 系統樹(ヘッケル) 分子進化学  (1970年代から)  ⇒ 分子レベルでの「関係」の証拠 講究II (7) 2007/10/19

4 系統(分子生物学以前) ダーウィンの進化論  (種の起源 1859) ⇒ 形態や機能が遺伝   「進化によって部分的     に変わる」     =(突然変異+自然淘汰)説 ⇒ 進化の「樹」(系統樹)      (ヘッケル) (注)メンデルのえんどう豆の    実験は1866 講究II (7) 2007/10/19

5 樹=トリー構造 根があるとは限らない 距離を考えることも できる 現在の種に無い 進化の程度により (蛇足) 進化収束もあり得る
(蛇足) 進化収束もあり得る 講究II (7) 2007/10/19

6 分子生物学後の「進化・系統」 遺伝=DNAの複製、 進化=遺伝子の変化
加えて、遺伝子間の違いを数量的に評価  ← これが「距離」になる 更に分子的進化「時計」によって年代推定も可 距離を時間に換算する 講究II (7) 2007/10/19

7 DNAレベルで見た突然変異 出典 根井:「分子進化遺伝学」
単塩基レベルの変化 ランダムなコピーミス、外因(化学的・物理的…) アミノ酸への変換が冗長なので影響は減少 非コード領域では? 遺伝子全体の変化(染色体レベル) 繋ぎ合せミスなど  ⇒ 長さが変わったり… 講究II (7) 2007/10/19

8 分子レベル ~ 塩基変化の種類 塩基の置換え 塩基の欠失 塩基の挿入 塩基の逆位 変化の単位は1塩基~数千塩基(いろいろ)
X X Y U W X Y Y X Y U W 変化の単位は1塩基~数千塩基(いろいろ) 欠失と挿入は読取枠(3塩基ずつ)が狂う 1~少数は主に複製時のコピーミス(分子レベル) 多数は主に不等交叉やDNAの転座(染色体レベル) 講究II (7) 2007/10/19

9 アミノ酸への変換の縮退 変換(コドン表)には 縮退(多⇒1)が多い DNA塩基誤りの一部は、アミノ酸変換後は変わらない
変換(コドン表)には 縮退(多⇒1)が多い TTT, TTC ⇒ フェニルアラニン TCT, TCC, TCA, TCG ⇒ セリン DNA塩基誤りの一部は、アミノ酸変換後は変わらない 講究II (7) 2007/10/19

10 アミノ酸への変換の縮退 表の上で29%が同義になる 第3位置の塩基が縮退が多い(72%同義) (各変換の発生率を考慮しないとして)
第1位置は多少縮退がある(5%同義) 第2位置は縮退がない(どういう効果?) 講究II (7) 2007/10/19

11 非コード領域での影響? DNAには非コード領域(イントロン)が存在 ⇒ 「非コードなのだから書き換わっても 影響なし」なのか?
非コード領域は 直接アミノ酸配列を生み出すわけではないが 部分によって、タンパク質発現に大きく影響する アミノ酸への変換機構の開始を制御する部分がある あまりよくわかっていない(らしい) 講究II (7) 2007/10/19

12 染色体レベル 染色体上のDNA配列が大きな塊で変化 交叉 転座(移動) 1点交差 転座
AGCT列 AGCT列 AGCT列 AGCT列 染色体上のDNA配列が大きな塊で変化 交叉 転座(移動) おまけ: 情報科学での 「遺伝アルゴリズム」(GA Genetic Algorithm)は 交差の仕組を模擬したもの 1点交差 AGCT列 AGCT列 転座 講究II (7) 2007/10/19

13 DNA変化の影響は? コピーミスを補修する機構がある 上位の切捨て(淘汰)作用もある これらのフィルタを通り抜けたものが残る
アミノ酸変換(単発)ミスのかなりの部分を捨てるらしい 上位の切捨て(淘汰)作用もある 細胞単位での切捨て(生き延びない) 個体単位での切捨て(生き延びない) これらのフィルタを通り抜けたものが残る 講究II (7) 2007/10/19

14 自然淘汰説と中立説 (参考 宮田 分子進化学への招待)
自然淘汰説と中立説              (参考 宮田 分子進化学への招待) 突然変異が集団に固定していく機構の違い 自然淘汰説(ダーウィン 1859) 生存に有利な、子孫を多く残せる変異が選択され、集団に広まる 中立説(木村資生 1968) 生存にとって不利な変異は、自然淘汰によって集団から除去される(自然淘汰説と同じ)が、 それ以外(分子の進化に寄与する変異)は 偶然に集団に固定する 講究II (7) 2007/10/19

15 距離(=配列間の違い)を考える (DNA)配列のマッチング ⇒ 結果、配列の違いの個数を数えられる
違っている個数や、全体に対する割合を数える ことができる 違いが多い  ⇒ 起こった変異の数が多い (「遠い」)   ⇒ 世代交代時に一定確率で変異すると       すれば、世代数に比例    ⇒ 世代∝時間なら、「時間が経っている」 講究II (7) 2007/10/19

16 例) ウマ・ミンククジラ・アカカンガルー (Lesk 「バイオインフォマティクス基礎講義」 p.24 例1.2)
ウマ (Equus cabalus pancleatic ribonuclease) 1 kespamkfer qhmdsgstss snptycnqmm krrnmtqgwc kpvntfvhep ladvqaiclq 61 knitckngqs ncyqssssmh itdcrltsgs kypncayqts qkerhiivac egnpyvpvhf 121 dasvevst ミンククジラ (Balaenoputera acutorostrata pancleatic ribonuclease) 1 respamkfqr qhmdsgnspg nnpnycnqmm mrrkmtqgrc kpvntfvhes ledvkavcsq 61 knvlckngrt ncyesnstmh itdcrqtgss kypncaykts qkekhiivac egnpyvpvhf 121 dnsv アカカンガルー (Macropus rufus pancleatic ribonuclease) 1 etpaekfqrq hmdtehstas ssnycnlmmk ardmtsgrck plntfihepk svvdavchqe 61 nvtckngrtn cyksnsrlsi tncrqtgask ypncqyetsn lnkqiivace gqyvpvhfda 121 yv 講究II (7) 2007/10/19

17 続) CLUSTAL W (1.83) Multiple Sequence Alignments
Sequence 1: RNP_HORSE aa Sequence 2: RNP_BALAC aa Sequence 3: RNP_MACRU aa RNP_HORSE KESPAMKFERQHMDSGSTSSSNPTYCNQMMKRRNMTQGWCKPVNTFVHEPLADVQAICLQ 60 RNP_BALAC RESPAMKFQRQHMDSGNSPGNNPNYCNQMMMRRKMTQGRCKPVNTFVHESLEDVKAVCSQ 60 RNP_MACRU ETPAEKFQRQHMDTEHSTASSSNYCNLMMKARDMTSGRCKPLNTFIHEPKSVVDAVCHQ 59 *:** **:*****: :......*** ** *.**.* ***:***:**. *.*:* * RNP_HORSE KNITCKNGQSNCYQSSSSMHITDCRLTSGSKYPNCAYQTSQKERHIIVACEGNPYVPVHF 120 RNP_BALAC KNVLCKNGRTNCYESNSTMHITDCRQTGSSKYPNCAYKTSQKEKHIIVACEGNPYVPVHF 120 RNP_MACRU ENVTCKNGRTNCYKSNSRLSITNCRQTGASKYPNCQYETSNLNKQIIVACEG-QYVPVHF 118 :*: ****::***:*.* : **:** *..****** *:**: :::******* ****** RNP_HORSE DASVEVST 128 RNP_BALAC DNSV RNP_MACRU DAYV * * Sequences (1:2) Aligned. Score: 76 Sequences (1:3) Aligned. Score: 61 Sequences (2:3) Aligned. Score: 67 講究II (7) 2007/10/19

18 距離 ⇒ 時間 (変異個数の議論に) 時間要因を追加して考えてみる
単位時間当りに発生する変異数が どの変異にも共通で、昔から一定とすれば 種AとBの配列の違い(変異数)から  いつ分岐したか推定できるはず 講究II (7) 2007/10/19

19 距離 ⇒ 時間 変異発生は一定か? 化石から得られている 分岐年代と、変異数を 対照比較 ⇒ 「一致」 (ズッカーカンドル& ポーリング)
化石から得られている 分岐年代と、変異数を 対照比較 ⇒ 「一致」  (ズッカーカンドル&    ポーリング) 一定 ⇒ 「分子時計」 宮田: 分子進化学への招待(69ページ) 講究II (7) 2007/10/19

20 距離 ⇒ 時間 細かく見ると一致しない場合がたくさんある 配列上の部位によって変異発生率が異なる 分子によっては変動の激しいものがある
分岐時間に依存する 脊椎動物の「綱」レベルでは一定性があるが 細かなレベルでは成り立たない場合がある 配列上の部位によって変異発生率が異なる 重要でないところほど発生率が高い傾向がある  (淘汰の影響) 講究II (7) 2007/10/19

21 変異しやすいvsしにくい座位 たんぱく質の働きにとって重要な部位の アミノ酸は変わりにくい
たんぱく質の働きにとって重要な部位の  アミノ酸は変わりにくい 例)ヘモグロビンは酸素を運ぶのに鉄が必要だが、その鉄をタンパク質に結合させるヒスチジンの部位が必要 宮田: 分子進化学への招待(73ページ) 講究II (7) 2007/10/19

22 変異しやすいvsしにくい部分(続) ヒスチジンは進化の過程で保存されている
他のアミノ酸に置き換わる変異は、ヘモグロビンの機能を損ない、結局個体の生存に有害になる。 数世代もすると、その変異を持った個体は死に絶え、集団から消えてしまう だから進化の長い期間を通じて、保存される(と見える) 宮田: 分子進化学への招待(75ページ) 講究II (7) 2007/10/19

23 (時間があれば) 座位による置き換わりやすさ(1)
様々な要因があるが (全部は未解明?) 特定の機能実現 ~ ヘモグロビンの例 アミノ酸のサイズと極性 極端にサイズが違うアミノ酸に置き換わると  タンパク質全体の形状が変化 ⇒ 機能阻害 極性が違うアミノ酸に置き換わると  (周囲の他の原子までの距離が変わるので)  タンパク質全体の形状が変化 ⇒ 機能阻害 その他 (たとえばタンパク質内の位置?) 講究II (7) 2007/10/19

24 (時間があれば) 座位による置き換わりやすさ(2)
アミノ酸のサイズと極性(宮田: 分子進化学への招待) アミノ酸XとYが置換するとして サイズ+極性で決まる大きさの差 置換の実際の発生頻度 大きさの差が大きいと 頻度が少ない 講究II (7) 2007/10/19

25 タンパク質による違いの例 タンパク質によって変化しやすさが異なる
フィブリノペプチド フィブリノーゲンから 切捨てられる部分で 自身は機能を持たない 変異しても支障ない ヒストン DNAにくっつき、どの座位のアミノ酸も重要で 変異できる場所がない 宮田: 分子進化学への招待(88ページ) 講究II (7) 2007/10/19

26 距離から樹を作る ~ クラスタリング 計算で樹の形を決められるはず 樹の形 例) 4つの種で出来る樹の形の例 D D C A A B C D
距離から樹を作る ~ クラスタリング 計算で樹の形を決められるはず 樹の形 例) 4つの種で出来る樹の形の例 D D C A A B C D A B B C 講究II (7) 2007/10/19

27 距離から樹を作る クラスタリング(続) 単純化した例(p212、例4.7)
距離から樹を作る クラスタリング(続) 単純化した例(p212、例4.7) 距離行列 ~ 1つ変化するとカウント1   全ての対に対して「距離」を求める ATCC ATGC ATCC ATGC TTCG TCGG 1 2 4 3 ATCC TTGC ATCC TCGG 講究II (7) 2007/10/19

28 距離から樹を作る クラスタリング(続) 最も近い距離1の2つをグループ化 このグループと他の要素との距離を、 個々の距離の平均値とする
距離から樹を作る クラスタリング(続) 最も近い距離1の2つをグループ化 {ATCC, ATGC} このグループと他の要素との距離を、  個々の距離の平均値とする ATCCと TTCG間 は距離2 {ATCC,ATGC} TTCG TCGG 2.5 3.5 2 ATGCと TTCG間 は距離3 講究II (7) 2007/10/19

29 距離から樹を作る クラスタリング(続) 次に最も近い距離は2で、TTCGとTCGGの間 ⇒ これらをグループ化
距離から樹を作る クラスタリング(続) 次に最も近い距離は2で、TTCGとTCGGの間   ⇒ これらをグループ化 このグループと他の要素との距離を、  個々の距離の平均値とする {ATCC,ATGC} {TTCG, TCGG} 3 {TTCG,TCGG} 講究II (7) 2007/10/19

30 距離から樹を作る クラスタリング(続) 全体をまとめると、樹が描ける ATCC ATGC TTCG TCGG 3.0 1.5 1.5 0.5
距離から樹を作る クラスタリング(続) 全体をまとめると、樹が描ける 3.0 1.5 1.5 0.5 0.5 1.0 1.0 1.0 2.0 ATCC ATGC TTCG TCGG 講究II (7) 2007/10/19

31 おまけ 古典的な分類・系統学 一応知っておいた方が… 体系的分類 ~ リンネ(1707~1778) 階層的 界・門・綱・目・科・属・種
おまけ 古典的な分類・系統学 一応知っておいた方が… 体系的分類 ~ リンネ(1707~1778) 階層的  界・門・綱・目・科・属・種 細かくは高校参考書など 講究II (7) 2007/10/19

32 分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6
分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの「分類学」の項が面白いので紹介 まず、種。 まず、生物は種に分かれている。つまり、まず、生物には細部にわたって同じ構造、機能をもつ個体が複数存在し、それらが生殖によって同じ構造・機能を持つ個体を再生産している。しかも、それらとは違った構造・機能を持ち、同様の個体を再生産する群も存在し、それらの間にはっきりと見分けがつく。このような群を種と呼ぶわけである。 講究II (7) 2007/10/19

33 分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6
分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの続き 次に、グループ化。 次に、種はそれぞれに固有の特徴を持つが、種を互いに比べたとき、基本的な部分は似ているが、細部で異なった種が見つけられる。それらをまとめることで、ある程度基本的には似ている種をまとめられる。それを属と呼んだり、科と呼んだり、とにかくそうして作ったグループを見比べると、それをさらにまとめることが出来、このようにして次第に大きな群を作ることが出来る。 講究II (7) 2007/10/19

34 分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6
分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの続き 最後のコメント 実際には、すべての場合にこのようなことが見られるとは言い難いが、大部分の場合にはそうである。このような事柄は、生物以外のものではなかなか成立するものではない(再生産されることをのぞいてもである)。分類学者は、そこに何らかの意味が存在することを認め、正しい分類をすれば、生物の分類群間の正しい関係を見つけることが出来ることを確信する。その関係のことを類縁関係と呼ぶ。類縁関係を進化と言う現象によって理解し、分類体系を再構成しようという考え方が進化分類学である。 (現在の世界にも進化論を受け入れない人々がおり、彼等はまた異なる考え方をする。) 講究II (7) 2007/10/19

35 上位の分類(界)は議論があった 2界説(リンネ) 動物界と植物界 3界説(ヘッケル) 動物界・植物界・原生生物界
2界説(リンネ) 動物界と植物界 動物界:動いて餌を取るもの、植物界:それ以外 3界説(ヘッケル) 動物界・植物界・原生生物界 原生生物界: 動物とも植物とも取れる原始的な生物 4界説 動物界・植物界・原生生物界・菌界 菌界: カビやキノコのなかま 5界説(ホイタッカー)   動物界・植物界・原生生物界・菌界・モネラ界 モネラ界(原核生物界):細胞核を持たない原核生物 講究II (7) 2007/10/19


Download ppt "生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹"

Similar presentations


Ads by Google