生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹

Slides:



Advertisements
Similar presentations
第 14 章 競争を生き抜く 生物多様性の創造における進化と絶 滅 ガラパゴス諸島の異なる島々から得られたフィ ンチ.ダーウィンによるオリジナルの挿絵.
Advertisements

第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
動的計画法を用いたアラインメント  小菅孝史.
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
◎ 本章  化学ポテンシャルという概念の導入   ・部分モル量という種類の性質の一つ   ・混合物の物性を記述するために,化学ポテンシャルがどのように使われるか   基本原理        平衡では,ある化学種の化学ポテンシャルはどの相でも同じ ◎ 化学  互いに反応できるものも含めて,混合物を扱う.
植物系統分類学・第13回 分子系統学の基礎と実践
遺伝子の解析 第2弾 DNAシークエンス法.
遺伝的アルゴリズム  新川 大貴.
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
RNA i (RNA interference).
特論B 細胞の生物学 第2回 転写 和田 勝 東京医科歯科大学教養部.
分布の非正規性を利用した行動遺伝モデル開発
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
生物学 第3回 生物は進化した 和田 勝.
多様性の生物学 第9回 多様性を促す内的要因 和田 勝 東京医科歯科大学教養部.
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
Geneticsから Epigeneticsへ
インフレはなぜ止まらないのか?.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
個体と多様性の 生物学 第5回 突然変異とDNA修復機構 和田 勝 東京医科歯科大学教養部.
個体と多様性の 生物学 第6回 体を守る免疫機構Ⅰ 和田 勝 東京医科歯科大学教養部.
◎ 本章  化学ポテンシャルという概念の導入   ・部分モル量という種類の性質の一つ   ・混合物の物性を記述するために,化学ポテンシャルがどのように使われるか   基本原理        平衡では,ある化学種の化学ポテンシャルはどの相でも同じ ◎ 化学  互いに反応できるものも含めて,混合物を扱う.
原子核物理学 第4講 原子核の液滴模型.
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
緩衝液-buffer solution-.
メンデルの分離の法則 雑種第1世代どうしを交配すると草丈の高いものが787個体、草丈の低いものが277個体であった。
Fuzzy c-Means法による クラスター分析に関する研究
MPIを用いた並列処理 ~GAによるTSPの解法~
絶滅危惧種サギソウの遺伝的分化 保全生態学研究室   鈴木雅之.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
1DS05175M 安東遼一 1DS05213M 渡邉光寿 指導教員: 高木先生
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
生命科学基礎C 第8回 免疫Ⅰ 和田 勝 東京医科歯科大学教養部.
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
烏骨鶏のミトコンドリア 全長塩基配列について
コードクローンの動作を比較するためのコードクローン周辺コードの解析
生  物  数  学 斉木 里恵.
Central Dogma Epigenetics
分子生物情報学(2) 配列のマルチプルアライメント法
個体と多様性の 生物学 第3回 突然変異とDNA修復機構 和田 勝 東京医科歯科大学教養部.
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
個体と多様性の 生物学 第6回 体を守る免疫機構Ⅰ 和田 勝 東京医科歯科大学教養部.
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
遺伝性疾患・先天性疾患  染色体・遺伝子の異常とその分類  遺伝性疾患  先天性疾患.
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
Data Clustering: A Review
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
親子鑑定に見る尤度比を 角度を変えて眺めてみる
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
村石悠介・橋口岳史 農学部資源生物科学科1回生
α decay of nucleus and Gamow penetration factor ~原子核のα崩壊とGamowの透過因子~
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
多様性の生物学 第11回 多様性の整理 和田 勝 東京医科歯科大学教養部.
情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター 安田豊.
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
分子生物情報学(0) バイオインフォマティクス
各種荷重を受ける 中空押出形成材の構造最適化
Presentation transcript:

生物分類と配列 分類・系統樹とは 遺伝・相同性・系統樹 情報科学講究II (5) 生物分類と配列 分類・系統樹とは     遺伝・相同性・系統樹

今回の目標 遺伝子解析が、生物分類・系統樹に どう使われるか理解する 生物分類・系統樹の考え方が 遺伝子解析でどう変わったか理解する 遺伝子解析が、生物分類・系統樹に  どう使われるか理解する 生物分類・系統樹の考え方が  遺伝子解析でどう変わったか理解する 今日のタネ本は Lesk著 バイオインフォマティクス基礎講義    2章ゲノムの構成と進化、4章アラインメントと系統樹 宮田隆著 分子進化学への招待(講談社ブルーバックス) 郷通子編集 基礎と実習 バイオインフォマティクス   4章 タンパク質の進化とデザイン 講究II (7) 2007/10/19

生物分類の考え方の流れ 生物は多様 ⇒ 分類してグループに分けたい ⇒形態や機能から分類 生物は多様 ⇒ 分類してグループに分けたい   ⇒形態や機能から分類 ダーウィンの進化論  ⇒ 形態や機能は遺伝するはずなので    グループ間には遺伝的な関係があるはず   ⇒ 系統樹(ヘッケル) 分子進化学  (1970年代から)  ⇒ 分子レベルでの「関係」の証拠 講究II (7) 2007/10/19

系統(分子生物学以前) ダーウィンの進化論  (種の起源 1859) ⇒ 形態や機能が遺伝   「進化によって部分的     に変わる」     =(突然変異+自然淘汰)説 ⇒ 進化の「樹」(系統樹)      (ヘッケル) (注)メンデルのえんどう豆の    実験は1866 講究II (7) 2007/10/19

樹=トリー構造 根があるとは限らない 距離を考えることも できる 現在の種に無い 進化の程度により (蛇足) 進化収束もあり得る (蛇足) 進化収束もあり得る 講究II (7) 2007/10/19

分子生物学後の「進化・系統」 遺伝=DNAの複製、 進化=遺伝子の変化 加えて、遺伝子間の違いを数量的に評価  ← これが「距離」になる 更に分子的進化「時計」によって年代推定も可 距離を時間に換算する 講究II (7) 2007/10/19

DNAレベルで見た突然変異 出典 根井:「分子進化遺伝学」 単塩基レベルの変化 ランダムなコピーミス、外因(化学的・物理的…) アミノ酸への変換が冗長なので影響は減少 非コード領域では? 遺伝子全体の変化(染色体レベル) 繋ぎ合せミスなど  ⇒ 長さが変わったり… 講究II (7) 2007/10/19

分子レベル ~ 塩基変化の種類 塩基の置換え 塩基の欠失 塩基の挿入 塩基の逆位 変化の単位は1塩基~数千塩基(いろいろ) X X Y U W X Y Y X Y U W 変化の単位は1塩基~数千塩基(いろいろ) 欠失と挿入は読取枠(3塩基ずつ)が狂う 1~少数は主に複製時のコピーミス(分子レベル) 多数は主に不等交叉やDNAの転座(染色体レベル) 講究II (7) 2007/10/19

アミノ酸への変換の縮退 変換(コドン表)には 縮退(多⇒1)が多い DNA塩基誤りの一部は、アミノ酸変換後は変わらない 変換(コドン表)には 縮退(多⇒1)が多い TTT, TTC ⇒ フェニルアラニン TCT, TCC, TCA, TCG ⇒ セリン DNA塩基誤りの一部は、アミノ酸変換後は変わらない 講究II (7) 2007/10/19

アミノ酸への変換の縮退 表の上で29%が同義になる 第3位置の塩基が縮退が多い(72%同義) (各変換の発生率を考慮しないとして) 第1位置は多少縮退がある(5%同義) 第2位置は縮退がない(どういう効果?) 講究II (7) 2007/10/19

非コード領域での影響? DNAには非コード領域(イントロン)が存在 ⇒ 「非コードなのだから書き換わっても 影響なし」なのか? 非コード領域は 直接アミノ酸配列を生み出すわけではないが 部分によって、タンパク質発現に大きく影響する アミノ酸への変換機構の開始を制御する部分がある あまりよくわかっていない(らしい) 講究II (7) 2007/10/19

染色体レベル 染色体上のDNA配列が大きな塊で変化 交叉 転座(移動) 1点交差 転座 AGCT列 AGCT列 AGCT列 AGCT列 染色体上のDNA配列が大きな塊で変化 交叉 転座(移動) おまけ: 情報科学での 「遺伝アルゴリズム」(GA Genetic Algorithm)は 交差の仕組を模擬したもの 1点交差 AGCT列 AGCT列 転座 講究II (7) 2007/10/19

DNA変化の影響は? コピーミスを補修する機構がある 上位の切捨て(淘汰)作用もある これらのフィルタを通り抜けたものが残る アミノ酸変換(単発)ミスのかなりの部分を捨てるらしい 上位の切捨て(淘汰)作用もある 細胞単位での切捨て(生き延びない) 個体単位での切捨て(生き延びない) これらのフィルタを通り抜けたものが残る 講究II (7) 2007/10/19

自然淘汰説と中立説 (参考 宮田 分子進化学への招待) 自然淘汰説と中立説              (参考 宮田 分子進化学への招待) 突然変異が集団に固定していく機構の違い 自然淘汰説(ダーウィン 1859) 生存に有利な、子孫を多く残せる変異が選択され、集団に広まる 中立説(木村資生 1968) 生存にとって不利な変異は、自然淘汰によって集団から除去される(自然淘汰説と同じ)が、 それ以外(分子の進化に寄与する変異)は 偶然に集団に固定する 講究II (7) 2007/10/19

距離(=配列間の違い)を考える (DNA)配列のマッチング ⇒ 結果、配列の違いの個数を数えられる 違っている個数や、全体に対する割合を数える ことができる 違いが多い  ⇒ 起こった変異の数が多い (「遠い」)   ⇒ 世代交代時に一定確率で変異すると       すれば、世代数に比例    ⇒ 世代∝時間なら、「時間が経っている」 講究II (7) 2007/10/19

例) ウマ・ミンククジラ・アカカンガルー (Lesk 「バイオインフォマティクス基礎講義」 p.24 例1.2) ウマ (Equus cabalus pancleatic ribonuclease) 1 kespamkfer qhmdsgstss snptycnqmm krrnmtqgwc kpvntfvhep ladvqaiclq 61 knitckngqs ncyqssssmh itdcrltsgs kypncayqts qkerhiivac egnpyvpvhf 121 dasvevst ミンククジラ (Balaenoputera acutorostrata pancleatic ribonuclease) 1 respamkfqr qhmdsgnspg nnpnycnqmm mrrkmtqgrc kpvntfvhes ledvkavcsq 61 knvlckngrt ncyesnstmh itdcrqtgss kypncaykts qkekhiivac egnpyvpvhf 121 dnsv アカカンガルー (Macropus rufus pancleatic ribonuclease) 1 etpaekfqrq hmdtehstas ssnycnlmmk ardmtsgrck plntfihepk svvdavchqe 61 nvtckngrtn cyksnsrlsi tncrqtgask ypncqyetsn lnkqiivace gqyvpvhfda 121 yv 講究II (7) 2007/10/19

続) CLUSTAL W (1.83) Multiple Sequence Alignments Sequence 1: RNP_HORSE 128 aa Sequence 2: RNP_BALAC 124 aa Sequence 3: RNP_MACRU 122 aa RNP_HORSE KESPAMKFERQHMDSGSTSSSNPTYCNQMMKRRNMTQGWCKPVNTFVHEPLADVQAICLQ 60 RNP_BALAC RESPAMKFQRQHMDSGNSPGNNPNYCNQMMMRRKMTQGRCKPVNTFVHESLEDVKAVCSQ 60 RNP_MACRU -ETPAEKFQRQHMDTEHSTASSSNYCNLMMKARDMTSGRCKPLNTFIHEPKSVVDAVCHQ 59 *:** **:*****: :......*** ** *.**.* ***:***:**. *.*:* * RNP_HORSE KNITCKNGQSNCYQSSSSMHITDCRLTSGSKYPNCAYQTSQKERHIIVACEGNPYVPVHF 120 RNP_BALAC KNVLCKNGRTNCYESNSTMHITDCRQTGSSKYPNCAYKTSQKEKHIIVACEGNPYVPVHF 120 RNP_MACRU ENVTCKNGRTNCYKSNSRLSITNCRQTGASKYPNCQYETSNLNKQIIVACEG-QYVPVHF 118 :*: ****::***:*.* : **:** *..****** *:**: :::******* ****** RNP_HORSE DASVEVST 128 RNP_BALAC DNSV---- 124 RNP_MACRU DAYV---- 122 * * Sequences (1:2) Aligned. Score: 76 Sequences (1:3) Aligned. Score: 61 Sequences (2:3) Aligned. Score: 67 講究II (7) 2007/10/19

距離 ⇒ 時間 (変異個数の議論に) 時間要因を追加して考えてみる 単位時間当りに発生する変異数が どの変異にも共通で、昔から一定とすれば 種AとBの配列の違い(変異数)から  いつ分岐したか推定できるはず 講究II (7) 2007/10/19

距離 ⇒ 時間 変異発生は一定か? 化石から得られている 分岐年代と、変異数を 対照比較 ⇒ 「一致」 (ズッカーカンドル& ポーリング) 化石から得られている 分岐年代と、変異数を 対照比較 ⇒ 「一致」  (ズッカーカンドル&    ポーリング) 一定 ⇒ 「分子時計」 宮田: 分子進化学への招待(69ページ) 講究II (7) 2007/10/19

距離 ⇒ 時間 細かく見ると一致しない場合がたくさんある 配列上の部位によって変異発生率が異なる 分子によっては変動の激しいものがある 分岐時間に依存する 脊椎動物の「綱」レベルでは一定性があるが 細かなレベルでは成り立たない場合がある 配列上の部位によって変異発生率が異なる 重要でないところほど発生率が高い傾向がある  (淘汰の影響) 講究II (7) 2007/10/19

変異しやすいvsしにくい座位 たんぱく質の働きにとって重要な部位の アミノ酸は変わりにくい たんぱく質の働きにとって重要な部位の  アミノ酸は変わりにくい 例)ヘモグロビンは酸素を運ぶのに鉄が必要だが、その鉄をタンパク質に結合させるヒスチジンの部位が必要 宮田: 分子進化学への招待(73ページ) 講究II (7) 2007/10/19

変異しやすいvsしにくい部分(続) ヒスチジンは進化の過程で保存されている 他のアミノ酸に置き換わる変異は、ヘモグロビンの機能を損ない、結局個体の生存に有害になる。 数世代もすると、その変異を持った個体は死に絶え、集団から消えてしまう だから進化の長い期間を通じて、保存される(と見える) 宮田: 分子進化学への招待(75ページ) 講究II (7) 2007/10/19

(時間があれば) 座位による置き換わりやすさ(1) 様々な要因があるが (全部は未解明?) 特定の機能実現 ~ ヘモグロビンの例 アミノ酸のサイズと極性 極端にサイズが違うアミノ酸に置き換わると  タンパク質全体の形状が変化 ⇒ 機能阻害 極性が違うアミノ酸に置き換わると  (周囲の他の原子までの距離が変わるので)  タンパク質全体の形状が変化 ⇒ 機能阻害 その他 (たとえばタンパク質内の位置?) 講究II (7) 2007/10/19

(時間があれば) 座位による置き換わりやすさ(2) アミノ酸のサイズと極性(宮田: 分子進化学への招待) アミノ酸XとYが置換するとして サイズ+極性で決まる大きさの差 置換の実際の発生頻度 大きさの差が大きいと 頻度が少ない 講究II (7) 2007/10/19

タンパク質による違いの例 タンパク質によって変化しやすさが異なる フィブリノペプチド フィブリノーゲンから 切捨てられる部分で 自身は機能を持たない 変異しても支障ない ヒストン DNAにくっつき、どの座位のアミノ酸も重要で 変異できる場所がない 宮田: 分子進化学への招待(88ページ) 講究II (7) 2007/10/19

距離から樹を作る ~ クラスタリング 計算で樹の形を決められるはず 樹の形 例) 4つの種で出来る樹の形の例 D D C A A B C D 距離から樹を作る ~ クラスタリング 計算で樹の形を決められるはず 樹の形 例) 4つの種で出来る樹の形の例 D D C A A B C D A B B C 講究II (7) 2007/10/19

距離から樹を作る クラスタリング(続) 単純化した例(p212、例4.7) 距離から樹を作る クラスタリング(続) 単純化した例(p212、例4.7) 距離行列 ~ 1つ変化するとカウント1   全ての対に対して「距離」を求める ATCC ATGC ATCC ATGC TTCG TCGG 1 2 4 3 ATCC TTGC ATCC TCGG 講究II (7) 2007/10/19

距離から樹を作る クラスタリング(続) 最も近い距離1の2つをグループ化 このグループと他の要素との距離を、 個々の距離の平均値とする 距離から樹を作る クラスタリング(続) 最も近い距離1の2つをグループ化 {ATCC, ATGC} このグループと他の要素との距離を、  個々の距離の平均値とする ATCCと TTCG間 は距離2 {ATCC,ATGC} TTCG TCGG 2.5 3.5 2 ATGCと TTCG間 は距離3 講究II (7) 2007/10/19

距離から樹を作る クラスタリング(続) 次に最も近い距離は2で、TTCGとTCGGの間 ⇒ これらをグループ化 距離から樹を作る クラスタリング(続) 次に最も近い距離は2で、TTCGとTCGGの間   ⇒ これらをグループ化 このグループと他の要素との距離を、  個々の距離の平均値とする {ATCC,ATGC} {TTCG, TCGG} 3 {TTCG,TCGG} 講究II (7) 2007/10/19

距離から樹を作る クラスタリング(続) 全体をまとめると、樹が描ける ATCC ATGC TTCG TCGG 3.0 1.5 1.5 0.5 距離から樹を作る クラスタリング(続) 全体をまとめると、樹が描ける 3.0 1.5 1.5 0.5 0.5 1.0 1.0 1.0 2.0 ATCC ATGC TTCG TCGG 講究II (7) 2007/10/19

おまけ 古典的な分類・系統学 一応知っておいた方が… 体系的分類 ~ リンネ(1707~1778) 階層的 界・門・綱・目・科・属・種 おまけ 古典的な分類・系統学 一応知っておいた方が… 体系的分類 ~ リンネ(1707~1778) 階層的  界・門・綱・目・科・属・種 細かくは高校参考書など 講究II (7) 2007/10/19

分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの「分類学」の項が面白いので紹介 まず、種。 まず、生物は種に分かれている。つまり、まず、生物には細部にわたって同じ構造、機能をもつ個体が複数存在し、それらが生殖によって同じ構造・機能を持つ個体を再生産している。しかも、それらとは違った構造・機能を持ち、同様の個体を再生産する群も存在し、それらの間にはっきりと見分けがつく。このような群を種と呼ぶわけである。 講究II (7) 2007/10/19

分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの続き 次に、グループ化。 次に、種はそれぞれに固有の特徴を持つが、種を互いに比べたとき、基本的な部分は似ているが、細部で異なった種が見つけられる。それらをまとめることで、ある程度基本的には似ている種をまとめられる。それを属と呼んだり、科と呼んだり、とにかくそうして作ったグループを見比べると、それをさらにまとめることが出来、このようにして次第に大きな群を作ることが出来る。 講究II (7) 2007/10/19

分類に対する考え方 http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 分類に対する考え方    http://ja.wikipedia.org/wiki/%E5%88%86%E9%A1%9E%E5%AD%A6 ウィキペディアの続き 最後のコメント 実際には、すべての場合にこのようなことが見られるとは言い難いが、大部分の場合にはそうである。このような事柄は、生物以外のものではなかなか成立するものではない(再生産されることをのぞいてもである)。分類学者は、そこに何らかの意味が存在することを認め、正しい分類をすれば、生物の分類群間の正しい関係を見つけることが出来ることを確信する。その関係のことを類縁関係と呼ぶ。類縁関係を進化と言う現象によって理解し、分類体系を再構成しようという考え方が進化分類学である。 (現在の世界にも進化論を受け入れない人々がおり、彼等はまた異なる考え方をする。) 講究II (7) 2007/10/19

上位の分類(界)は議論があった 2界説(リンネ) 動物界と植物界 3界説(ヘッケル) 動物界・植物界・原生生物界 2界説(リンネ) 動物界と植物界 動物界:動いて餌を取るもの、植物界:それ以外 3界説(ヘッケル) 動物界・植物界・原生生物界 原生生物界: 動物とも植物とも取れる原始的な生物 4界説 動物界・植物界・原生生物界・菌界 菌界: カビやキノコのなかま 5界説(ホイタッカー)   動物界・植物界・原生生物界・菌界・モネラ界 モネラ界(原核生物界):細胞核を持たない原核生物 講究II (7) 2007/10/19