2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報

Slides:



Advertisements
Similar presentations
第 14 章 競争を生き抜く 生物多様性の創造における進化と絶 滅 ガラパゴス諸島の異なる島々から得られたフィ ンチ.ダーウィンによるオリジナルの挿絵.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
理化学研究所 発生・再生科学総合研究センター 発生・再生科学総合研究センター. 発生メカニズムの解明 1つの受精卵からどの様にして複雑な個体が発生 するのか。 再生メカニズムの解明 生物はどのようなメカニズムで、怪我や病気、加齢で失った 組織や臓器を再生するのか。 再生医療への学術基盤の構築 細胞移植を中心としたヒトの再生医療に応用可能な発生・再生メカニズムの.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
DDBJing講習会 2015年7月29日 那覇 プライマーの作成・活用の実際 森 宙史 Hiroshi Mori 東京工業大学
植物系統分類学・第13回 分子系統学の基礎と実践
遺伝子の解析 第2弾 DNAシークエンス法.
Gene Constellator SystemTM
2016年1月8日 生命環境科学域 植物バイオサイエンス課程 尾形 善之
RNA i (RNA interference).
生物統計学・第3回 全体を眺める(2) 主成分分析
絶滅危惧植物シラタマホシクサの 保全に関する研究 岩井貴彦 システムマネジメント工学科 UCコース
動物への遺伝子導入 hGH 遺伝子 右:ひと成長ホルモン遺伝子を 導入したラット 左:対照ラット
「コンピュータと情報システム」 01章 コンピュータの基礎知識
2012/11/3(土) 平成24年度 第2回 データベース講習会 「創薬研究のためのデータベース講習会」
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
生命情報解析 第4回 シグナル配列の統計解析(3)
プログラム実行履歴を用いたトランザクションファンクション抽出手法
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
遺伝子の機能は、どのようにしてわかるのか
Twist DX Probe&Primerの選定方法
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
サイエンス・テクノロジー・システムズ株式会社 癸生川絵里
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
Anja von Heydebreck et al. 発表:上嶋裕樹
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
ORI-GENE A Tool for Gene Classification and Prediction of Function Based on Evolutionary Tree Hideaki Mizuno, Yoshimasa Tanaka, Kenta Nakai, Akinori Sarai.
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
○ 後藤 祥1,吉田 則裕2 ,井岡 正和1 ,井上 克郎1 1大阪大学 2奈良先端科学技術大学院大学
ソフトウェア保守のための コードクローン情報検索ツール
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
Monitoring the Expression Pattern of 1300 Arabidopsis Genes under Drought and Cold Stresses by Using a Full-Length cDNA Microarray The Plant Cell, Vol.13,
Epigenetic performers in plants Ming Chen, Shaolei Lv and Yijun Meng
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
構造的類似性を持つ半構造化文書における頻度分析
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
忙しい人のためのR/Bioconductorの基礎
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
識別子の読解を目的とした名詞辞書の作成方法の一試案
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
分子生物情報学(0) バイオインフォマティクス
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報 2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報 2018年5月25日 機能ゲノム科学  尾形 善之

遺伝子を扱う学術論文数の推移

RNA定量解析の歴史・1 ノーザンブロット:1990年代 抽出RNAを電気泳動によってゲル上に展開 同時に1~数遺伝子 Wikipedia

RNA定量解析の歴史・2 マイクロアレイ:2000年代 プローブと直接ハイブリダイズして蛍光を検出 数万~十数万遺伝子

RNA定量解析の歴史・3 RNA-Seq:2010年代 配列を直接シーケンシング 十数万遺伝子、検出数が格段に増加

チェックポイント・I RNA定量解析の歴史について、簡単に纏めなさい。

遺伝子発現データとは… ここでは、「ゲノム規模での遺伝子の発現データ」を表すこととする。 種ごとの遺伝子数 Arabidopsis thaliana 35,374 Oryza sativa 41,070 Citrus sinensis 35,654 Prunus persica 29,012 Eucalyptus grandis 47,427 Solanum lycopersicum 36,213 Glycine max 71,677 Vitis vinifera 38,136 Nicotiana tabacum 34,630 Zea mays 58,565

公共データバンクの発現情報 NCBI Embl-EBI Gene Expression Omnibus Sequence Read Archive Embl-EBI ArrayExpress

Gene Expression Omnibus 概要 RNA定量データ全般を扱う。 構成 GPL:プラットフォーム RNA-Seq、マイクロアレイなど GSE:実験群(実験シリーズ) 各研究に含まれる実験群 GSM:各実験

遺伝子発現データ 2017 Gene Expression Ominibus 種名 Homo sapiens データ数 Homo sapiens 942,214 Caenorhabditis elegans 9,347 Escherichia coli 5,203 Mus musculus 265,586 Danio rerio 9,023 Canis lupus familiaris 5,436 Rattus norvegicus 70,539 Zea mays 8,891 Macaca mulatta 4,640 Saccharomyces cerevisiae 38,604 Bos taurus 8,488 Plasmodium falciparum 3,813 Arabidopsis thaliana 32,021 Oryza sativa 6,602 Schizosaccharomyces pombe 3,299 Drosophila melanogaster 25,305 Glycine max 6,008 Triticum aestivum 2,860 Sus scrofa 10,398 Gallus gallus 5,644 Oncorhynchus mykiss 2,233

遺伝子発現データ 2018 Gene Expression Ominibus 種名 Homo sapiens データ数 Homo sapiens 942,214 1,363,298 Caenorhabditis elegans 9,347 13,414 Escherichia coli 5,203 6,627 Mus musculus 265,586 557,122 Danio rerio 9,023 15,518 Canis lupus familiaris 5,436 7,899 Rattus norvegicus 70,539 83,759 Zea mays 8,891 10,617 Macaca mulatta 4,640 9,446 Saccharomyces cerevisiae 38,604 48,688 Bos taurus 8,488 12,923 Plasmodium falciparum 3,813 5,713 Arabidopsis thaliana 32,021 49,890 Oryza sativa 6,602 11,121 Schizosaccharomyces pombe 3,299 5,069 Drosophila melanogaster 25,305 41,132 Glycine max 6,008 7,150 Triticum aestivum 2,860 3,443 Sus scrofa 10,398 14,979 Gallus gallus 5,644 9,466 Oncorhynchus mykiss 2,233 2,747

チェックポイント・II 公共データバンクの遺伝子発現データについて、どの生物のデータの増え方が大きいか。また、その理由を考えてみなさい。

GEOデータベースのツール GEO2R 実験群の中での遺伝子の発現を棒グラフで表示する。 特定の実験群の中で、注目する遺伝子がどの実験で発現しているか。 マイクロアレイのデータのみ。 動作がやや不安定で、操作が直感的でない。

Sequence Read Archive 概要 構成 次世代シーケンサーの配列データを登録 プロジェクト:実験群、GSEに相当 RNA-Seqデータ、ゲノムデータ、メタゲノムデータ 構成 プロジェクト:実験群、GSEに相当 リード:各実験、GSMに相当 ファイル:各実験のデータ ひとつのリードに複数のファイルがある場合がある

登録された塩基配列データ ヨタ キロヨタ メガヨタ …… ゼタ エクサ ペタ テラ ギガ メガ キロ Sequence Read Archive, NCBI

SRAデータからの解析の手順 FASTQ形式の配列 FASTA形式の配列 マッピング~計測 標準化 発現解析 多型 特異的発現 共発現

ArrayExpress 概要 使い道 遺伝子発現データ全般を扱う。 Atlasツール:実験群の中での発現グラフ GEOとほぼ同様。 GEO:84,678実験群、ArrayExpress:70,054実験群 検索はGEOの方がやや快適。 使い道 Atlasツール:実験群の中での発現グラフ GEO2Rと同様 一部の実験群に対応している

その他の遺伝子発現DB GeneVestigator eFP Browser ATTED-II 全生物対象 遺伝子発現解析プラットフォーム 植物中心、遺伝子発現ヒートマップ ATTED-II 植物のみ、遺伝子共発現解析

eFP Browser 概要 植物種 発現データを組織別にグラフ化している。 双子葉植物 単子葉植物 理屈抜きで見やすいし、調べやすい。 シロイヌナズナなど全10種 単子葉植物 イネなど全5種

ATTED-II 概要 使い道 植物9種の遺伝子発現解析。 マイクロアレイとRNA-Seqを含む。 特に、共発現解析データが特徴。 全実験データを用いた共発現解析。 使い道 共発現遺伝子を探す。

共発現遺伝子解析の纏め 特定の実験群の中での共発現 全実験での共発現 GEO2RやeFP Browser 特定の条件で特異的に共発現している。 予め実験情報の知見が必要となる。 全実験での共発現 ATTED-II 特定の条件は不明だが、共発現している。 実験情報の知見は必要ない。

チェックポイント・III 遺伝子発現データを解析する公共データベースやツールについて、簡単に纏めなさい。