Presentation is loading. Please wait.

Presentation is loading. Please wait.

2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報

Similar presentations


Presentation on theme: "2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報"— Presentation transcript:

1 2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報 2017年5月26日 機能ゲノム科学  尾形 善之

2 バグレポートありがとうございました いくつかのバグは、すでに対処しました。
日本語版については、要望が多かったので、開発を進めます(再開します)。 種名のリンクについて、NCBIのTaxonomyに飛ぶリンクを付けました。 ネットワークの略号について、マウスを置いて学名が出るようにしたいが、今の(私の)スキルではできていません。

3 遺伝子を扱う学術論文数の推移

4 RNA定量解析の歴史・1 ノーザンブロット:1990年代 抽出RNAを電気泳動によってゲル上に展開 同時に1~数遺伝子 Wikipedia

5 RNA定量解析の歴史・2 マイクロアレイ:2000年代 プローブと直接ハイブリダイズして蛍光を検出 数万~十数万遺伝子

6 RNA定量解析の歴史・3 RNA-Seq:2010年代 配列を直接シーケンシング 十数万遺伝子、検出数が格段に増加

7 遺伝子発現データとは… ここでは、「ゲノム規模での遺伝子の発現データ」を表すこととする。 種ごとの遺伝子数
Arabidopsis thaliana 35,374 Oryza sativa 41,070 Citrus sinensis 35,654 Prunus persica 29,012 Eucalyptus grandis 47,427 Solanum lycopersicum 36,213 Glycine max 71,677 Vitis vinifera 38,136 Nicotiana tabacum 34,630 Zea mays 58,565

8 公共データバンクの発現情報 NCBI Embl-EBI Gene Expression Omnibus
Sequence Read Archive Embl-EBI ArrayExpress

9 Gene Expression Omnibus
概要 RNA定量データ全般を扱う。 構成 GPL:プラットフォーム RNA-Seq、マイクロアレイなど GSE:実験群(実験シリーズ) 各研究に含まれる実験群 GSM:各実験

10 遺伝子発現データ Gene Expression Ominibus 種名 Homo sapiens
データ数 Homo sapiens 942,214 Caenorhabditis elegans 9,347 Escherichia coli 5,203 Mus musculus 265,586 Danio rerio 9,023 Canis lupus familiaris 5,436 Rattus norvegicus 70,539 Zea mays 8,891 Macaca mulatta 4,640 Saccharomyces cerevisiae 38,604 Bos taurus 8,488 Plasmodium falciparum 3,813 Arabidopsis thaliana 32,021 Oryza sativa 6,602 Schizosaccharomyces pombe 3,299 Drosophila melanogaster 25,305 Glycine max 6,008 Triticum aestivum 2,860 Sus scrofa 10,398 Gallus gallus 5,644 Oncorhynchus mykiss 2,233

11 GEOデータベースのツール GEO2R 実験群の中での遺伝子の発現を棒グラフで表示する。 マイクロアレイのみ。 動作がやや不安定。
操作があまり直観的でない。 いずれ改良されることが期待される。

12 Sequence Read Archive 概要 構成 次世代シーケンサーの配列データを登録 プロジェクト:実験群、GSEに相当
RNA-Seqデータ、ゲノムデータ、メタゲノムデータ 構成 プロジェクト:実験群、GSEに相当 リード:各実験、GSMに相当 ファイル:各実験のデータ ひとつのリードに複数のファイルがある場合がある

13 登録された塩基配列データ ヨタ キロヨタ メガヨタ …… ゼタ エクサ ペタ テラ ギガ メガ キロ
Sequence Read Archive, NCBI

14 SRAデータからの解析の手順 FASTQ形式の配列 FASTA形式の配列 マッピング~計測 標準化 発現解析 多型 特異的発現 共発現

15 ArrayExpress 概要 使い道 遺伝子発現データ全般を扱う。 Atlasツール:実験群の中での発現グラフ GEOとほぼ同様。
GEO:84,678実験群、ArrayExpress:70,054実験群 検索はGEOの方がやや快適。 使い道 Atlasツール:実験群の中での発現グラフ GEO2Rと同様 一部の実験群に対応している

16 その他の遺伝子発現DB GeneVestigator eFP Browser ATTED-II 全生物対象 遺伝子発現解析プラットフォーム
植物中心、遺伝子発現ヒートマップ ATTED-II 植物のみ、遺伝子共発現解析

17 eFP Browser 概要 植物種 発現データを組織別にグラフ化している。 双子葉植物 単子葉植物 理屈抜きで見やすいし、調べやすい。
シロイヌナズナなど全10種 単子葉植物 イネなど全5種

18 ATTED-II 概要 使い道 植物9種の遺伝子発現解析。 マイクロアレイとRNA-Seqを含む。 特に、共発現解析データが特徴。
全実験データを用いた共発現解析。 使い道 共発現遺伝子を探す。

19 今日の実習と課題 注目遺伝子の発現情報を纏めなさい。 GEO2Rを使って、特異的に発現する実験を探しなさい。
eFP Browserを使って、遺伝子発現の組織特異性について調べなさい。 ATTED-IIを使って、共発現する遺伝子を探しなさい。


Download ppt "2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報"

Similar presentations


Ads by Google