Presentation is loading. Please wait.

Presentation is loading. Please wait.

RNAの研究が熱い! そもそもどういう背景で細胞内に多数のRNAがあることが判明したか なぜRNAが重要と考えられるのか

Similar presentations


Presentation on theme: "RNAの研究が熱い! そもそもどういう背景で細胞内に多数のRNAがあることが判明したか なぜRNAが重要と考えられるのか"— Presentation transcript:

1 RNAの研究が熱い! そもそもどういう背景で細胞内に多数のRNAがあることが判明したか なぜRNAが重要と考えられるのか
完全長cDNAのゲノムへのマッピング FANTOMプロジェクト なぜRNAが重要と考えられるのか miRNA、アンチセンスRNA RNAの解析を進める上でどんな手法があるか 二次構造解析

2 RNA二次構造予測(2) 生命情報解析 2007年10月25日

3 RNAの二次構造の解析 RNAは一本鎖なので、折れ曲がって自分自身と結合を作りやすい
二次構造が機能と大きく関わっているため、機能を知る手がかりに? 5’ 3’

4 二次構造の抽出 複数の配列を並べると… 一次配列の保存性 … 配列パターン
二次構造の保存性 … 配列パターンでは見えにくい場合がある (RNAの構造など)

5 RNA二次構造による 塩基間相互作用 C C C C C C C C C C C C C C C C C C C C AT TA CG GC
A G GC (a) (b) (c) (d) (e) (a) ATGCTACCCCTAGCTA (b) TAGATACCCCTATCTA (c) TAGGTACCCCTACCTA (d) TAGTTACCCCTAACTA (e) TAGATACCCCTAGCTA

6 結合エントロピー (1) 2つの情報源から組み合わせとして得られる情報の情報量の期待値 サイコロ1と2を考える
サイコロ1が”6”の目… -log1/6の情報量 サイコロ2が”3”の目 …-log1/6の情報量 両方のサイコロを振ったとき、サイコロ1が”6”の目で、サイコロ2が”3”の目 … -log1/36の情報量

7 結合エントロピー (2) サイコロ1(情報源X, 情報xiが出力される)とサイコロ2 (情報源Y, 情報yjが出力される)の目を組み合わせとして考える サイコロ1の目がxiである確率をP(X=xi)、サイコロ2の目がyjである確率をP(Y=yj)とする (省略してP(xi)、 P(yj)と表す) サイコロ1の目がxiのときにサイコロ2の目がyjである確率をP(X=xi, Y=yj)とする (省略してP(xi, yj)と表す) サイコロ1の目のエントロピーH(X)は-∑iP(xi)log P(xi) サイコロ2の目のエントロピーH(Y)は-∑jP(yj)log P(yj) P(X=xi)をP(xi)と表す

8 結合エントロピー (3) 2つのサイコロを同時に振って、サイコロ1の目がxi、2の目がyjであることが分かったときに得られる情報量は、-log P(xi, yj) 期待値を取って 但し、∑∑P(xi, yj) = 1, ∑iP(xi, yj) = P(yj), ∑jP(xi, yj) = P(xi)

9 結合エントロピーの計算 U V U V U V A A A C A G A T C A C C C G C T G A G C G G
G T T A T C T G T T A C A G C G C T G T G A T A T C A C C G G T T A (a)のケースでは、 AAの頻度P(ua,va) = 1/16 ACの頻度P(ua,vc) = 1/16 : TTの頻度P(ut,vt) = 1/16 従って列UとVの結合エントロピーH(U, V)は、 -P(ua,va)log P(ua, va)-P(ua,vc)log P(ua,vc) - … -P(ut,vt)log P(ut, vt) = 4 (a) (b) (c)

10 結合エントロピーの性質 H(U, V) = H(V, U) 0 ≦ H(U, V) ≦ H(U) + H(V)

11 相互情報量 (1) 一方の情報源Xから情報を得たときに、他方の情報源Yのことがどれくらい分かるか
一方の列Uの列が塩基uiと判明したとき、他方の列Vの列の塩基の種類に関する情報はどれくらい得られる?

12 相互情報量 (2) 情報量の加法性より、 列Vの塩基がvjであることが判明したときに得られる情報量 = 列Uの塩基がuiであることが判明したときに得られる列Vに関する情報量 +その上でさらに列Vの塩基がvjであることが判明したときの情報量 式で表すと、-log P(vi) = I(vi//ui) + -log P(ui,vj)/P(ui) 従って、 I(vi//ui) = -log P(vi) --log P(ui,vj)/P(ui) = log P(ui,vj)/(P(ui) P(vi))

13 相互情報量 (3) U, Vについて期待値を計算して、 列UとVの塩基間の関連性の強さを定量的にとらえている

14 相互情報量の性質 I(U // V) = I(V // U) I(U // V) ≧ 0
I(U // V) = H(U) + H(V) – H(U, V)

15 相互情報量の計算 U V U V U V A A A C A G A T C A C C C G C T G A G C G G G T
T A T C T G T T A C A G C G C T G T G A T A T C A C C G G T T A (a)のケースでは、 H(U)=2, H(V)=2, H(U,V)=4 従って、 I(U//V) = H(U)+H(V)-H(U,V) = 0 (a) (b) (c)

16 演習問題 U V A A A G A T C C C G C T 列U,Vにおける塩基間の相互情報量を求めよ。

17 tRNAの二次構造 A H G B F C D E 3’ 5’ GC AU GU CG GC GC C A C G U G U A U G
UGCCC GCGGG G C A A C G CUUG GAAU U U C G F U U A U A C G CG UA GC G G D E C C U A G C U

18 A B C D E F G H aspU GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspV GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspT GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA ileV AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileU AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileT AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA valV GCGTTCATAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGTTGGTTCGAGTCCAATTGAACGCACCA valW GCGTCCGTAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGGTGGTTCGAGTCCACTCGGACGCACCA alaU GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaT GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaV GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaX GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA alaW GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA hisR GGTGGCTATAGCTCAG-TTGGT-AGAGCCCTGGATTGTGATTCCAGTTGTCGTGGGTTCGAATCCCATTAGCCACCCCA pheV GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA pheU GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA thrW GCCGATATAGCTCAG-TTGGT-AGAGCAGCGCATTCGTAATGCGAAGGTCGTAGGTTCGACTCCTATTATCGGCACCA asnT TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnW TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnU TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnV TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA glyW TGCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyV GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyX GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyY GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA thrV GCTGATATGGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCCCCAGTTCGACTCTGGGTATCAGCACCA thrT GCTGATATAGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCGGCAGTTCGAATCTGCCTATCAGCACCA thrU GCCGACTTAGCTCAG-TAGGT-AGAGCAACTGACTTGTAATCAGTAGGTCACCAGTTCGATTCCGGTAGTCGGCACCA metU GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA metT GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA lysT GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysW GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysY GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysZ GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysQ GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysV GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA ileY GGCCCTTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAAGGGCCACCA ileX GGCCCCTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAGGGGCCACCA valT GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valZ GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valU GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA

19 C E G H A B D F

20 演習問題 を示せ。


Download ppt "RNAの研究が熱い! そもそもどういう背景で細胞内に多数のRNAがあることが判明したか なぜRNAが重要と考えられるのか"

Similar presentations


Ads by Google