2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
理化学研究所 発生・再生科学総合研究センター 発生・再生科学総合研究センター. 発生メカニズムの解明 1つの受精卵からどの様にして複雑な個体が発生 するのか。 再生メカニズムの解明 生物はどのようなメカニズムで、怪我や病気、加齢で失った 組織や臓器を再生するのか。 再生医療への学術基盤の構築 細胞移植を中心としたヒトの再生医療に応用可能な発生・再生メカニズムの.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
DDBJing講習会 2015年7月29日 那覇 プライマーの作成・活用の実際 森 宙史 Hiroshi Mori 東京工業大学
植物系統分類学・第13回 分子系統学の基礎と実践
遺伝子の解析 第2弾 DNAシークエンス法.
Gene Constellator SystemTM
2016年1月8日 生命環境科学域 植物バイオサイエンス課程 尾形 善之
RNA i (RNA interference).
生物統計学・第3回 全体を眺める(2) 主成分分析
絶滅危惧植物シラタマホシクサの 保全に関する研究 岩井貴彦 システムマネジメント工学科 UCコース
動物への遺伝子導入 hGH 遺伝子 右:ひと成長ホルモン遺伝子を 導入したラット 左:対照ラット
「コンピュータと情報システム」 01章 コンピュータの基礎知識
2012/11/3(土) 平成24年度 第2回 データベース講習会 「創薬研究のためのデータベース講習会」
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
生命情報解析 第4回 シグナル配列の統計解析(3)
プログラム実行履歴を用いたトランザクションファンクション抽出手法
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
絶滅危惧種サギソウの遺伝的分化 保全生態学研究室   鈴木雅之.
遺伝子の機能は、どのようにしてわかるのか
Twist DX Probe&Primerの選定方法
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
インターネット利用法実習 経営工学基礎演習a(第3週).
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
Anja von Heydebreck et al. 発表:上嶋裕樹
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
ORI-GENE A Tool for Gene Classification and Prediction of Function Based on Evolutionary Tree Hideaki Mizuno, Yoshimasa Tanaka, Kenta Nakai, Akinori Sarai.
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
Monitoring the Expression Pattern of 1300 Arabidopsis Genes under Drought and Cold Stresses by Using a Full-Length cDNA Microarray The Plant Cell, Vol.13,
vc-3. ダンプリスト,配列 (Visual Studio C++ の実用知識を学ぶシリーズ)
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
vc-2. Visual Studio C++ のデバッガー (Visual Studio C++ の実用知識を学ぶシリーズ)
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
忙しい人のためのR/Bioconductorの基礎
vc-3. ダンプリスト,配列 (Visual Studio C++ の実用知識を学ぶシリーズ)
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
分子生物情報学(0) バイオインフォマティクス
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報 2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報 2017年5月26日 機能ゲノム科学  尾形 善之

バグレポートありがとうございました いくつかのバグは、すでに対処しました。 日本語版については、要望が多かったので、開発を進めます(再開します)。 種名のリンクについて、NCBIのTaxonomyに飛ぶリンクを付けました。 ネットワークの略号について、マウスを置いて学名が出るようにしたいが、今の(私の)スキルではできていません。

遺伝子を扱う学術論文数の推移

RNA定量解析の歴史・1 ノーザンブロット:1990年代 抽出RNAを電気泳動によってゲル上に展開 同時に1~数遺伝子 Wikipedia

RNA定量解析の歴史・2 マイクロアレイ:2000年代 プローブと直接ハイブリダイズして蛍光を検出 数万~十数万遺伝子

RNA定量解析の歴史・3 RNA-Seq:2010年代 配列を直接シーケンシング 十数万遺伝子、検出数が格段に増加

遺伝子発現データとは… ここでは、「ゲノム規模での遺伝子の発現データ」を表すこととする。 種ごとの遺伝子数 Arabidopsis thaliana 35,374 Oryza sativa 41,070 Citrus sinensis 35,654 Prunus persica 29,012 Eucalyptus grandis 47,427 Solanum lycopersicum 36,213 Glycine max 71,677 Vitis vinifera 38,136 Nicotiana tabacum 34,630 Zea mays 58,565

公共データバンクの発現情報 NCBI Embl-EBI Gene Expression Omnibus Sequence Read Archive Embl-EBI ArrayExpress

Gene Expression Omnibus 概要 RNA定量データ全般を扱う。 構成 GPL:プラットフォーム RNA-Seq、マイクロアレイなど GSE:実験群(実験シリーズ) 各研究に含まれる実験群 GSM:各実験

遺伝子発現データ Gene Expression Ominibus 種名 Homo sapiens データ数 Homo sapiens 942,214 Caenorhabditis elegans 9,347 Escherichia coli 5,203 Mus musculus 265,586 Danio rerio 9,023 Canis lupus familiaris 5,436 Rattus norvegicus 70,539 Zea mays 8,891 Macaca mulatta 4,640 Saccharomyces cerevisiae 38,604 Bos taurus 8,488 Plasmodium falciparum 3,813 Arabidopsis thaliana 32,021 Oryza sativa 6,602 Schizosaccharomyces pombe 3,299 Drosophila melanogaster 25,305 Glycine max 6,008 Triticum aestivum 2,860 Sus scrofa 10,398 Gallus gallus 5,644 Oncorhynchus mykiss 2,233

GEOデータベースのツール GEO2R 実験群の中での遺伝子の発現を棒グラフで表示する。 マイクロアレイのみ。 動作がやや不安定。 操作があまり直観的でない。 いずれ改良されることが期待される。

Sequence Read Archive 概要 構成 次世代シーケンサーの配列データを登録 プロジェクト:実験群、GSEに相当 RNA-Seqデータ、ゲノムデータ、メタゲノムデータ 構成 プロジェクト:実験群、GSEに相当 リード:各実験、GSMに相当 ファイル:各実験のデータ ひとつのリードに複数のファイルがある場合がある

登録された塩基配列データ ヨタ キロヨタ メガヨタ …… ゼタ エクサ ペタ テラ ギガ メガ キロ Sequence Read Archive, NCBI

SRAデータからの解析の手順 FASTQ形式の配列 FASTA形式の配列 マッピング~計測 標準化 発現解析 多型 特異的発現 共発現

ArrayExpress 概要 使い道 遺伝子発現データ全般を扱う。 Atlasツール:実験群の中での発現グラフ GEOとほぼ同様。 GEO:84,678実験群、ArrayExpress:70,054実験群 検索はGEOの方がやや快適。 使い道 Atlasツール:実験群の中での発現グラフ GEO2Rと同様 一部の実験群に対応している

その他の遺伝子発現DB GeneVestigator eFP Browser ATTED-II 全生物対象 遺伝子発現解析プラットフォーム 植物中心、遺伝子発現ヒートマップ ATTED-II 植物のみ、遺伝子共発現解析

eFP Browser 概要 植物種 発現データを組織別にグラフ化している。 双子葉植物 単子葉植物 理屈抜きで見やすいし、調べやすい。 シロイヌナズナなど全10種 単子葉植物 イネなど全5種

ATTED-II 概要 使い道 植物9種の遺伝子発現解析。 マイクロアレイとRNA-Seqを含む。 特に、共発現解析データが特徴。 全実験データを用いた共発現解析。 使い道 共発現遺伝子を探す。

今日の実習と課題 注目遺伝子の発現情報を纏めなさい。 GEO2Rを使って、特異的に発現する実験を探しなさい。 eFP Browserを使って、遺伝子発現の組織特異性について調べなさい。 ATTED-IIを使って、共発現する遺伝子を探しなさい。