Drosophila solexa Tag analysis 2/25 ahsan
論点 転写開始点の修正 転写開始点は1つでなく、分布する 分布の定量化とグループ分け 発現量の定量化 広いダイナミックレンジ 発現量の定量化 広いダイナミックレンジ Differential display young vs old, male vs female 進化的な保存度と発現量の関係
タグの統計 ゲノム上での位置 fly 冗長を許したタグ数 YM 530,040 3,526,380 S2 322,442 3,895,955 タグの統計 ゲノム上での位置 fly ゲノム上の位置で非冗長に分類した場合 冗長を許したタグ数 YM 530,040 3,526,380 S2 322,442 3,895,955 OF 574,849 3,523,169 OM 488,094 3,661,542 YF 337,835 2,587,129 Em 286,983 3,123,723 Larva 249,438 3,148,532 前回は N が入っているタグを除いてアラインメントした。 今回は、3回まで N が含まれている5endTag も入れて再びアラインメントした.
転写開始点 正規分布に近い分布 単一のピークをとる分布 FBtr0077965 gene in Young Male
一様に分布して場合 FBtr0077965 gene in all stage
転写開始点の転写の分布 正規分布 % 一様分布 YM 4471 32.7 2732 19.9 S2 3776 27.6 1665 12.1 OF 4321 31.6 2150 15.7 OM 4456 32.6 2568 18.7 YF 4689 34.3 1752 12.8 Em 4573 33.4 1801 13.1 La 4080 29.8 1768 12.9
代表的な転写開始点 5UTR領域の上流500bp以下から翻訳開始点(TIS)の間に転写産物の中、最大の転写量を持つ点を代表的な転写開始点と定義する。
遺伝子の総数に占める カラム1+2の割合(%) 代表転写開始点 従来のTSSと 一致する 一致しないが -500bp ~TIS に存在する 遺伝子の総数に占める カラム1+2の割合(%) 1,133 7,784 65 508 6,268 50 761 7,118 58 1,033 7,664 64 804 7,325 60 863 7,112 844 6,698 55 遺伝子の総数 13,662
高い再現性 広いダイナミックレンジ 同じYoung Female データを2回取った ときの再現性 Young Female 高い再現性 広いダイナミックレンジ 同じYoung Female データを2回取った ときの再現性 Young Female ( solexa Read2) Young Female( solexa Read1)
Differential display の考え方 YMvOM OMvOF YFvOF YMvYF YM(1) OF(3) YF(5) OM(4) YM: young Male YF: young Female OM: old Male OF: old Female
YoungFemale と Old Female の比較 ゲノム上の各位置で厳密にグループ分け YMvOM YFvOF YMvYF ゲノム上の各位置にアラインメントされたタグ数を比較 最も厳密なタグの比較方法 遺伝子領域でグルーピングはしていない ちょっと厳しすぎるかもしれないので、次に遺伝子領域でグルーピングした結果を示す OMvOF
遺伝子領域の定義 代表的な転写開始点 Exon1 Exon2 +500bp Tag 5’End 3’End Flybase の遺伝子の転写開始点より500bp以下 の上流領域から終止コドンまでを遺伝子領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。
YoungFemale と Old Female の比較 遺伝子によるグルーピング YMvOM OMvOF YFvOF YMvYF 遺伝子領域でグルーピングした結果 相関は多少上昇している
タンパク質コード領域(CDS)の定義 TIS Tag Tag Tag Tag Tag +500bp Exon1 Exon2 CDS region 3’End 5’End Flybase の遺伝子の翻訳開始点(TIS)より終止コドンまでの 翻訳領域をCDS領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。
YoungFemale と Old Female の比較 CDSによるグルーピング YMvOM OMvOF YFvOF YMvYF タンパク質コード領域(CDS)でのグルーピング
非翻訳領域(UTR)の定義 TSS TIS Tag Tag Tag Tag Tag +500bp Exon1 Exon2 UTR region 3’End 5’End Flybase の遺伝子の転写開始点(TSS)より500bp以下 の上流領域から翻訳開始点(TIS)までをUTR領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。
YoungFemale と Old Female の比較 UTR によるグルーピング YMvOM OMvOF YFvOF YMvYF
異なる組織での遺伝子発現量の統計的検定(比率検定) 比率検定によって、優位差がある遺伝子を選ぶ r1: transcription number of gene “A” in Sample 1 n1: total transcripts in sample 1 r2: transcription number of gene “A” in Sample 2 n2: total transcripts in sample2
Young Female と Old Female で 発現に顕著な違いのある遺伝子 FlybaseTrID YFexp OFexp
ショウジョウバエの12種に 保存された遺伝子と発現量 FlybaseTrID CDS(bp) 12種に保存 YM OF OM YF
Aigaki sensei Sense – anti sense cluster Internal Exon Vs Tag and codon usage Monday: 13:00~15:00