色素体の起源と進化 ラン藻と色素体の系統関係 色素体ゲノム装置の不連続進化 東京大学大学院総合文化研究科 生命環境科学系 佐藤直樹
ラン藻と色素体の系統関係
これまでの研究 葉緑体がシアノバクテリアによる細胞内共生によって生じたという仮説は,顕微鏡が生物の観察に用いられ,さまざまな生物の観察が行われた19世紀初頭にはすでに先駆的な学者によって提唱されていた。しかし,これは単に見かけが似ていること以上のものではなかった。その後,20世紀後半になって,電子顕微鏡による細胞内構造の観察や,生化学的な分析,光合成のしくみの詳しい解析などが進むにつれ,シアノバクテリアと葉緑体の類似性が指摘されるようになった。これを受けて,L. Margulisが1970年前後に葉緑体を含むいくつかの細胞内小器官の細胞内共生由来説を出版した。さらに,1980年代に入り,葉緑体ゲノムにコードされた遺伝子がシアノバクテリアの対応する遺伝子ときわめてよく似ていることが指摘されるようになった。また,分子進化の中立説(1970年木村資生)に支えられた分子系統解析がコンピュータの発達とともに活発に行われるようになった。16S rRNA配列に基づく系統解析の結果,葉緑体ゲノムが単系統であり,シアノバクテリアゲノムに由来することが確実と考えられるようになった。 1995年のNelissenらの研究では,単系統である葉緑体ゲノムが,シアノバクテリアの最も根元に近いところから分岐することが示された。さらに,1999年にはTurnerらによって多数の新たな配列を加えた解析が行われ,この結果がさらに支持されることとなった。
An NJ tree of plastids and cyanobacteria
Gloeobacter as a root for plastids and cyanobacteria 多数の種を加えたrRNAに基づく系統樹 Gloeobacter as a root for plastids and cyanobacteria Anabaena, Synechocystis, Thermosynechococcus, and Trichodesmium are paraphyletic. Turner et al. (1999) J. Eukaryot. Microbiol. 46: 327-338
これらのrRNA系統樹では たしかに葉緑体は単系統で,シアノバクテリアの根元から分岐しているが,そのときのシアノバクテリア部分の系統関係は大きく異なっていた。さらに,葉緑体ゲノムに保存されているタンパク質配列を使った解析も行われるようになると,rRNA配列による解析とは,シアノバクテリア部分の分岐の仕方が大きく異なることが判ってきた。 これまではシアノバクテリアは比較的根元の方で,多数のグループに分岐していたが,タンパク質配列による系統樹では,大きく2つに分岐することが特徴である。 どちらが正しいのか,判らなくなってきた。
NJ tree of 27 conserved protein sequences of cyanobacteria and plastids
A protein tree (BI法)
Various trees
どうしてこんなに違うのだろう? 系統解析の方法は難しく,本当にどの分岐パターンが正しいのか,なかなか決められない。16S rRNAをもちいたNelissen et al. (1995,NJ法), Turner et al. (1999,最尤法)などの解析では,シアノの分岐の根元から色素体が分岐するとされてきた。しかし,タンパク質配列を使うと,海洋性シアノだけで別の系統を構成するような系統樹ができる。 しかし,同じ配列を使ってやってみると,どうも同じ結果が得られない。NJ法は距離を使うだけの簡便法であり,最尤法は配列数が多いとすべての場合を尽くしきれない。最近,Bayes法を用いたMarkov Chain Monte Carlo (MCMC)法が実用化され,配列数が多くても,効率的に最尤系統樹に到達できるようになった。
Bayes Inference calculation Software: MrBayes version 3.1 + MPI version 2 RNA Data: 16S rRNA (from RDP + GenBank) Protein Data: GenBank genomes Protein alignment (gclust, clustalw) Use only sites with gaps < 0.2 (siseq-getclu) Convert to DNA alignment (siseq-nucaln) Exclude the 3rd positions Model selection: model test (GTR, invgamma); lnL values of MrBayes with various parameters (nst=1,2 and 6; equal, propinv, gamma, adgamma, invgamma) Parameters: unlink parameters for all genes; 4x4 model, except double model for base-paired sites of 16S rRNA Generations: 800,000 to 50,000,000 Machines: PM G5 dual 2.5 MHz (2 CPU), HGC Sun Fire 15000 (8 CPU): 1 to 5 days
An example of BI calculation (16S rRNA) Cx5r4.nex 16S rRNA base-pair 20 speciess with S63 unlink nst1 invgamma 800,000 0.038938 -9041.75 (Bact,Glv,((Tel,(S63,Mar)),(Syn,Ana),Plastid2)) nst2 invgamma 800,000 0.008462 -8989.44 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2))) nst6 invgamma 800,000 0.021006 -8955.80 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2))) 800,000 0.015661 -8955.65 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2))) 1,200,000 0.005053 -8958.62 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2))) 2,000,000 0.005498 -8955.44 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid2))) nst6 equal 800,000 0.002734 -10211.94 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid))) nst6 propinv 800,000 0.004554 -9368.61 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid))) nst6 gamma 800,000 0.011108 -8988.76 (Bact,Glv,((Tel,(S63,Mar)),((Syn,Ana),Plastid3)))
List of homologs 27 proteins conserved in plastids and cyanobacteria housekeeping proteins (cyano + plastids + bacteria) 16 photosynthesis proteins (cyano + plastids) 27 proteins conserved in plastids and cyanobacteria
An example of BI calculation (16S rRNA + 11 proteins)
16S rRNA 不用意にたくさんの配列を入れて計算すると,右の図のようにおかしな形になる。特にSynechococcus C9やPseudanabaena6903が入ると,計算ごとに結果が異なってくるので,これらの配列自体に問題がありそうである。使う配列の数,使う遺伝子の種類をさまざまに変えたとき,同じになるようなデータを使うべきである。
11 proteins and 16S rRNA これら20種を使ったとき,タンパク質(左)でもrRNA(前ページ左)でもほぼ類似の結果が得られる。そこでこれらをあわせて解析したのが,右の結果である。
16 or 27 proteins 光合成関連タンパク質でやった結果(左:細菌を含まない)も前ページでも使った保存タンパク質11種類を加えた結果(右)も,大筋でまえの結果を支持する。
系統解析の結果 これらの系統樹からわかることは,シアノバクテリアの系統が,最初に分岐したGloeobacterを除いて大きく2つの系統になるということである。一方は,海洋性の単細胞シアノバクテリアと淡水性のSynechococcusを含み,他方は糸状性のAnabaenaなどとSynechocystisなどを含む系統である。 色素体は単系統であるが,灰色藻がもとから分岐したのか,それとも緑色と紅色の分岐が先であり灰色藻がそのどちらかの姉妹群であるのかは,これまでの計算では確定できない。 色素体は,上記のシアノバクテリアの2大系統のうち,後のグループから分岐したことが,あらゆるデータから支持される。 従って,次のページの図のようになる。
Phylogeny of cyanobacteria, algae and plants
色素体ゲノム装置の不連続進化
概要1 シアノバクテリアの共生によって,たくさんの遺伝子が原始藻類細胞に持ち込まれたはずである。その中には,現在も植物・藻類で使われているタンパク質(CPRENDOs: chloroplast proteins of endosymbiont origin. 比較ゲノムの説明を参照)もあるが,多くのタンパク質の遺伝子は失われた。オルガネラのゲノム装置を構成する成分でも,DNAポリメラーゼは全く別のものに置き換えられた(森山君が研究している)他,RNAポリメラーゼのシグマ因子は細胞核コードに変わった。シアノバクテリアの転写因子もほとんどが失われたが,紅藻系統では,DnaB, HU, OmpR型転写因子などが色素体ゲノムまたは核ゲノムコードとして残っている。一方,緑色系統ではほとんど完全にこれらも失われ,原核由来の制御因子は何もなくなってしまった。これは,原始藻類細胞の中という環境が,独立生物としてのシアノバクテリアの環境に比べ,著しく安定になったことを反映している。同様のことは,寄生性のバクテリアであるBuchnera, Chlamidiaなどでもゲノム縮小として表れている。 この段階では,転写因子はないが,RNAプロセシングの酵素が導入された。これにより,転写ではなく転写後の調節を行うという葉緑体で知られる遺伝子発現の特徴が生まれた。
概要2 ところが,緑藻が陸に上がって陸上植物が誕生すると状況が一変する。陸上では,非常に強い環境ストレスのため,植物は多細胞化して細胞が分業するようになった。さらに,生活環を持つようになって,栄養成長に不都合な時には休眠するようになった。コケ植物やシダ植物の胞子,種子植物の種子などである。これらの休眠細胞では,クロロフィルをもつと光ダメージを受けるおそれがあるため,色素も持たなくなった。そうすると,今度は,休眠細胞から光合成細胞を分化する際に葉緑体を発達させることになった。葉緑体が先で,原色素体は後からできたのであるが,発達段階の説明では逆の順になっていることに注意。 そこで,被子植物では,最初に色素体ゲノムのスイッチを入れるため,これまでミトコンドリアで使っていた核コードRNAポリメラーゼを重複させて色素体でも使うようにした。これがNEP(nuclear-encoded RNA polymerase)である。これに対して,葉緑体ゲノムにコードされるものをPEPと呼ぶ。この他,環境や細胞分化に応じて色素体はさまざまな機能・形態の分化を行うが,それを制御するために多数の新たな転写因子が葉緑体に送り込まれた。すでに原核由来の因子の遺伝子は失われているので,これら新たな転写因子は,真核細胞で使われていたものを転用して使うことになった。たとえば,亜硫酸還元酵素(SiR)は,葉緑体DNAに結合してその転写活性を著しく低下させるが,これは可逆的である。従って,葉緑体発達の最初にDNAがたくさん複製されたとき,それがすぐに転写されてはこまるので,SiRによって転写しないように抑えている。その後,葉緑体の発達にあわせてSiRがはずれていく。これらの過程をまとめると次ページの図になる。
Discontinuous evolution of plastid genomic machinery(1) DNA polymerase Adapted from N. Sato (2001) Trends in Plant Science 6: 151-156