Drosophila solexa Tag analysis 2/25

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

頻度の分析 頻度データ 着果率,発芽率,生存率 離散量と離散量の比率である 頻度データに相当しないパーセント表記 のデータ 糖度,含水率 連続量と連続量の比率である.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Statistical Genetics 7 Functionality of SNPs Graduate School of Medicine Kyoto University 2008/09/17-25 IMS-UT Ryo Yamada.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
顔表情クラスタリングによる 映像コンテンツへのタギング
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
東大医科研ヒトゲノム解析センター 中 井 謙 太
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
植物系統分類学・第13回 分子系統学の基礎と実践
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
検定 P.137.
東アジアに上陸する台風の経年変化 筆保弘徳 飯塚 聡 松浦知徳 山田琢哉 〒  茨城県つくば市天王台3-1 独立行政法人防災科学技術研究所
RNA i (RNA interference).
特論B 細胞の生物学 第2回 転写 和田 勝 東京医科歯科大学教養部.
生物統計学・第3回 全体を眺める(2) 主成分分析
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
確率・統計Ⅱ 第7回.
相対論的重イオン衝突実験PHENIX におけるシミュレーションによる charm粒子測定の可能性を探る
臨床検査のための代替キャリブレーション:ノルトリプチリン治療薬モニタリングへの応用
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
© Yukiko Abe 2008 All rights reserved.
High-amplitude, long-term X-ray variability in the solar-type star HD 81809: The beginning of an X-ray activity cycle? F. Favata, G. Micela, S.L. Baliunas,
生命情報解析 第4回 シグナル配列の統計解析(3)
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
Fuzzy c-Means法による クラスター分析に関する研究
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
COSMOSプロジェクト: z ~ 1.2 における星生成の環境依存性 急激な変化が起こっていると考えられる z ~1 に着目し、
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
分子生物情報学(2) 配列のマルチプルアライメント法
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
フレアの非熱的成分とサイズ依存性    D1 政田洋平      速報@太陽雑誌会(10/24).
遺伝統計学 集中講義 (4) SNPによる領域の評価
植物系統分類学・第14回 分子系統学の基礎と実践
1.母平均の検定:小標本場合 2.母集団平均の差の検定
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
統計的検定   1.検定の考え方 2.母集団平均の検定.
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
Department of Neurogenomics
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
MOIRCSサイエンスゼミ 銀河団銀河のMorphology-Density Relation
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
数理統計学  第6回 西山.
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
遺伝統計学 集中講義 (6) 終わりに.
統計現象 高嶋 隆一 6/26/2019.
分子生物情報学(0) バイオインフォマティクス
磁場マップstudy 1.
Presentation transcript:

Drosophila solexa Tag analysis 2/25 ahsan

論点 転写開始点の修正 転写開始点は1つでなく、分布する 分布の定量化とグループ分け 発現量の定量化 広いダイナミックレンジ 発現量の定量化 広いダイナミックレンジ Differential display young vs old, male vs female 進化的な保存度と発現量の関係

タグの統計 ゲノム上での位置 fly 冗長を許したタグ数 YM 530,040 3,526,380 S2 322,442 3,895,955 タグの統計 ゲノム上での位置 fly ゲノム上の位置で非冗長に分類した場合 冗長を許したタグ数 YM 530,040 3,526,380 S2 322,442 3,895,955 OF 574,849 3,523,169 OM 488,094 3,661,542 YF 337,835 2,587,129 Em 286,983 3,123,723 Larva 249,438 3,148,532 前回は N が入っているタグを除いてアラインメントした。 今回は、3回まで N が含まれている5endTag も入れて再びアラインメントした.

転写開始点 正規分布に近い分布 単一のピークをとる分布 FBtr0077965 gene in Young Male

一様に分布して場合 FBtr0077965 gene in all stage

転写開始点の転写の分布 正規分布 % 一様分布 YM 4471 32.7 2732 19.9 S2 3776 27.6 1665 12.1 OF 4321 31.6 2150 15.7 OM 4456 32.6 2568 18.7 YF 4689 34.3 1752 12.8 Em 4573 33.4 1801 13.1 La 4080 29.8 1768 12.9

代表的な転写開始点 5UTR領域の上流500bp以下から翻訳開始点(TIS)の間に転写産物の中、最大の転写量を持つ点を代表的な転写開始点と定義する。

遺伝子の総数に占める カラム1+2の割合(%) 代表転写開始点 従来のTSSと 一致する 一致しないが -500bp ~TIS に存在する 遺伝子の総数に占める カラム1+2の割合(%) 1,133 7,784 65 508 6,268 50 761 7,118 58 1,033 7,664 64 804 7,325 60 863 7,112 844 6,698 55 遺伝子の総数 13,662

高い再現性 広いダイナミックレンジ 同じYoung Female データを2回取った ときの再現性 Young Female 高い再現性 広いダイナミックレンジ 同じYoung Female データを2回取った ときの再現性 Young Female ( solexa Read2) Young Female( solexa Read1)

Differential display の考え方 YMvOM OMvOF YFvOF YMvYF YM(1) OF(3) YF(5) OM(4) YM: young Male YF: young Female OM: old Male OF: old Female

YoungFemale と Old Female の比較 ゲノム上の各位置で厳密にグループ分け YMvOM YFvOF YMvYF ゲノム上の各位置にアラインメントされたタグ数を比較 最も厳密なタグの比較方法 遺伝子領域でグルーピングはしていない ちょっと厳しすぎるかもしれないので、次に遺伝子領域でグルーピングした結果を示す OMvOF

遺伝子領域の定義 代表的な転写開始点 Exon1 Exon2 +500bp Tag 5’End 3’End Flybase の遺伝子の転写開始点より500bp以下 の上流領域から終止コドンまでを遺伝子領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。

YoungFemale と Old Female の比較 遺伝子によるグルーピング YMvOM OMvOF YFvOF YMvYF 遺伝子領域でグルーピングした結果 相関は多少上昇している

タンパク質コード領域(CDS)の定義 TIS Tag Tag Tag Tag Tag +500bp Exon1 Exon2 CDS region 3’End 5’End Flybase の遺伝子の翻訳開始点(TIS)より終止コドンまでの 翻訳領域をCDS領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。

YoungFemale と Old Female の比較 CDSによるグルーピング YMvOM OMvOF YFvOF YMvYF タンパク質コード領域(CDS)でのグルーピング

非翻訳領域(UTR)の定義 TSS TIS Tag Tag Tag Tag Tag +500bp Exon1 Exon2 UTR region 3’End 5’End Flybase の遺伝子の転写開始点(TSS)より500bp以下 の上流領域から翻訳開始点(TIS)までをUTR領域とする。 この領域に存在する遺伝子と同じ向きの5endtagを その遺伝子の由来とする。

YoungFemale と Old Female の比較 UTR によるグルーピング YMvOM OMvOF YFvOF YMvYF

異なる組織での遺伝子発現量の統計的検定(比率検定) 比率検定によって、優位差がある遺伝子を選ぶ r1: transcription number of gene “A” in Sample 1 n1: total transcripts in sample 1 r2: transcription number of gene “A” in Sample 2 n2: total transcripts in sample2

Young Female と Old Female で 発現に顕著な違いのある遺伝子 FlybaseTrID YFexp OFexp

ショウジョウバエの12種に 保存された遺伝子と発現量 FlybaseTrID CDS(bp) 12種に保存 YM OF OM YF

Aigaki sensei Sense – anti sense cluster Internal Exon Vs Tag and codon usage Monday: 13:00~15:00