Download presentation
Presentation is loading. Please wait.
1
RNAの研究が熱い! そもそもどういう背景で細胞内に多数のRNAがあることが判明したか なぜRNAが重要と考えられるのか
完全長cDNAのゲノムへのマッピング FANTOMプロジェクト なぜRNAが重要と考えられるのか miRNA、アンチセンスRNA RNAの解析を進める上でどんな手法があるか 二次構造解析
2
RNA二次構造予測(2) 生命情報解析 2007年10月25日
3
RNAの二次構造の解析 RNAは一本鎖なので、折れ曲がって自分自身と結合を作りやすい
二次構造が機能と大きく関わっているため、機能を知る手がかりに? 5’ 3’
4
二次構造の抽出 複数の配列を並べると… 一次配列の保存性 … 配列パターン
二次構造の保存性 … 配列パターンでは見えにくい場合がある (RNAの構造など)
5
RNA二次構造による 塩基間相互作用 C C C C C C C C C C C C C C C C C C C C AT TA CG GC
A G GC (a) (b) (c) (d) (e) (a) ATGCTACCCCTAGCTA (b) TAGATACCCCTATCTA (c) TAGGTACCCCTACCTA (d) TAGTTACCCCTAACTA (e) TAGATACCCCTAGCTA
6
結合エントロピー (1) 2つの情報源から組み合わせとして得られる情報の情報量の期待値 サイコロ1と2を考える
サイコロ1が”6”の目… -log1/6の情報量 サイコロ2が”3”の目 …-log1/6の情報量 両方のサイコロを振ったとき、サイコロ1が”6”の目で、サイコロ2が”3”の目 … -log1/36の情報量
7
結合エントロピー (2) サイコロ1(情報源X, 情報xiが出力される)とサイコロ2 (情報源Y, 情報yjが出力される)の目を組み合わせとして考える サイコロ1の目がxiである確率をP(X=xi)、サイコロ2の目がyjである確率をP(Y=yj)とする (省略してP(xi)、 P(yj)と表す) サイコロ1の目がxiのときにサイコロ2の目がyjである確率をP(X=xi, Y=yj)とする (省略してP(xi, yj)と表す) サイコロ1の目のエントロピーH(X)は-∑iP(xi)log P(xi) サイコロ2の目のエントロピーH(Y)は-∑jP(yj)log P(yj) P(X=xi)をP(xi)と表す
8
結合エントロピー (3) 2つのサイコロを同時に振って、サイコロ1の目がxi、2の目がyjであることが分かったときに得られる情報量は、-log P(xi, yj) 期待値を取って 但し、∑∑P(xi, yj) = 1, ∑iP(xi, yj) = P(yj), ∑jP(xi, yj) = P(xi)
9
結合エントロピーの計算 U V U V U V A A A C A G A T C A C C C G C T G A G C G G
G T T A T C T G T T A C A G C G C T G T G A T A T C A C C G G T T A (a)のケースでは、 AAの頻度P(ua,va) = 1/16 ACの頻度P(ua,vc) = 1/16 : TTの頻度P(ut,vt) = 1/16 従って列UとVの結合エントロピーH(U, V)は、 -P(ua,va)log P(ua, va)-P(ua,vc)log P(ua,vc) - … -P(ut,vt)log P(ut, vt) = 4 (a) (b) (c)
10
結合エントロピーの性質 H(U, V) = H(V, U) 0 ≦ H(U, V) ≦ H(U) + H(V)
11
相互情報量 (1) 一方の情報源Xから情報を得たときに、他方の情報源Yのことがどれくらい分かるか
一方の列Uの列が塩基uiと判明したとき、他方の列Vの列の塩基の種類に関する情報はどれくらい得られる?
12
相互情報量 (2) 情報量の加法性より、 列Vの塩基がvjであることが判明したときに得られる情報量 = 列Uの塩基がuiであることが判明したときに得られる列Vに関する情報量 +その上でさらに列Vの塩基がvjであることが判明したときの情報量 式で表すと、-log P(vi) = I(vi//ui) + -log P(ui,vj)/P(ui) 従って、 I(vi//ui) = -log P(vi) --log P(ui,vj)/P(ui) = log P(ui,vj)/(P(ui) P(vi))
13
相互情報量 (3) U, Vについて期待値を計算して、 列UとVの塩基間の関連性の強さを定量的にとらえている
14
相互情報量の性質 I(U // V) = I(V // U) I(U // V) ≧ 0
I(U // V) = H(U) + H(V) – H(U, V)
15
相互情報量の計算 U V U V U V A A A C A G A T C A C C C G C T G A G C G G G T
T A T C T G T T A C A G C G C T G T G A T A T C A C C G G T T A (a)のケースでは、 H(U)=2, H(V)=2, H(U,V)=4 従って、 I(U//V) = H(U)+H(V)-H(U,V) = 0 (a) (b) (c)
16
演習問題 U V A A A G A T C C C G C T 列U,Vにおける塩基間の相互情報量を求めよ。
17
tRNAの二次構造 A H G B F C D E 3’ 5’ GC AU GU CG GC GC C A C G U G U A U G
UGCCC GCGGG G C A A C G CUUG GAAU U U C G F U U A U A C G CG UA GC G G D E C C U A G C U
18
A B C D E F G H aspU GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspV GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA aspT GGAGCGGTAGTTCAG-TCGGTTAGAATACCTGCCTGTCACGCAGGGGGTCGCGGGTTCGAGTCCCGTCCGTTCCGCCA ileV AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileU AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA ileT AGGCTTGTAGCTCAG-GTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCGGTGGTTCAAGTCCACTCAGGCCTACCA valV GCGTTCATAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGTTGGTTCGAGTCCAATTGAACGCACCA valW GCGTCCGTAGCTCAG-TTGGTTAGAGCACCACCTTGACATGGTGGGGGTCGGTGGTTCGAGTCCACTCGGACGCACCA alaU GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaT GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaV GGGGCTATAGCTCAG-CTGGG-AGAGCGCCTGCTTTGCACGCAGGAGGTCTGCGGTTCGATCCCGCATAGCTCCACCA alaX GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA alaW GGGGCTATAGCTCAG-CTGGG-AGAGCGCTTGCATGGCATGCAAGAGGTCAGCGGTTCGATCCCGCTTAGCTCCACCA hisR GGTGGCTATAGCTCAG-TTGGT-AGAGCCCTGGATTGTGATTCCAGTTGTCGTGGGTTCGAATCCCATTAGCCACCCCA pheV GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA pheU GCCCGGATAGCTCAG-TCGGT-AGAGCAGGGGATTGAAAATCCCCGTGTCCTTGGTTCGATTCCGAGTCCGGGCACCA thrW GCCGATATAGCTCAG-TTGGT-AGAGCAGCGCATTCGTAATGCGAAGGTCGTAGGTTCGACTCCTATTATCGGCACCA asnT TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnW TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnU TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA asnV TCCTCTGTAGTTCAG-TCGGT-AGAACGGCGGACTGTTAATCCGTATGTCACTGGTTCGAGTCCAGTCAGAGGAGCCA glyW TGCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyV GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyX GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA glyY GCGGGAATAGCTCAG-TTGGT-AGAGCACGACCTTGCCAAGGTCGGGGTCGCGAGTTCGAGTCTCGTTTCCCGCTCCA thrV GCTGATATGGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCCCCAGTTCGACTCTGGGTATCAGCACCA thrT GCTGATATAGCTCAG-TTGGT-AGAGCGCACCCTTGGTAAGGGTGAGGTCGGCAGTTCGAATCTGCCTATCAGCACCA thrU GCCGACTTAGCTCAG-TAGGT-AGAGCAACTGACTTGTAATCAGTAGGTCACCAGTTCGATTCCGGTAGTCGGCACCA metU GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA metT GGCTACGTAGCTCAG-TTGGTTAGAGCACATCACTCATAATGATGGGGTCACAGGTTCGAATCCCGTCGTAGCCACCA lysT GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysW GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysY GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysZ GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysQ GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA lysV GGGTCGTTAGCTCAG-TTGGT-AGAGCAGTTGACTTTTAATCAATTGGTCGCAGGTTCGAATCCTGCACGACCCACCA ileY GGCCCTTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAAGGGCCACCA ileX GGCCCCTTAGCTCAG-TGGTT-AGAGCAGGCGACTCATAATCGCTTGGTCGCTGGTTCAAGTCCAGCAGGGGCCACCA valT GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valZ GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA valU GGGTGATTAGCTCAG-CTGGG-AGAGCACCTCCCTTACAAGGAGGGGGTCGGCGGTTCGATCCCGTCATCACCCACCA
19
C E G H A B D F
20
演習問題 を示せ。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.