2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
Drosophila solexa Tag analysis 2/25
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
DDBJing講習会 2015年7月29日 那覇 プライマーの作成・活用の実際 森 宙史 Hiroshi Mori 東京工業大学
植物系統分類学・第13回 分子系統学の基礎と実践
Java I 第2回 (4/18)
生物統計学・第3回 全体を眺める(2) 主成分分析
動物への遺伝子導入 hGH 遺伝子 右:ひと成長ホルモン遺伝子を 導入したラット 左:対照ラット
応用情報処理V 第1回 プログラミングとは何か 2004年9月27日.
2012/11/3(土) 平成24年度 第2回 データベース講習会 「創薬研究のためのデータベース講習会」
情報科学1(G1) 2016年度.
応用情報処理V 第1回 プログラミングとは何か 2003年9月29日.
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
キンギョにおける 全身性の炎症と免疫の誘導
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
東京大学空間情報科学研究センターを 中心とした空間情報データベースの整備
第9回 GISで空間分布を捉える デジタル地理情報の構造 GISでみる地理分布 地理分布の計測 地理分布の理解.
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
絶滅危惧種サギソウの遺伝的分化 保全生態学研究室   鈴木雅之.
遺伝子の機能は、どのようにしてわかるのか
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
ソフトウェア情報学総論 基盤ソフトウェア学講座
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
烏骨鶏のミトコンドリア 全長塩基配列について
遺伝統計学 集中講義 (4) SNPによる領域の評価
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
第12回(12月15日):遺伝子診断用マイクロデバイス
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
第14回 教育研究推進センター 共同機器セミナー Agilentのゲノミクスソリューション 遺伝子発現解析のポイント〜サンプルのQCと信頼性
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
Monitoring the Expression Pattern of 1300 Arabidopsis Genes under Drought and Cold Stresses by Using a Full-Length cDNA Microarray The Plant Cell, Vol.13,
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
忙しい人のためのR/Bioconductorの基礎
Googleマップを活用した 生物調査データベースの構築
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
遺伝統計学 集中講義 (6) 終わりに.
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
分子生物情報学(0) バイオインフォマティクス
第3回Bashゼミ for文処理について 発表者 直江 宗紀.
地理情報システム論 第5回 GISによる処理技法 GIS入門(1)
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA 2018年6月29日 機能ゲノム科学  尾形 善之

今後の予定 第10回:配列相同性解析・DNA 第11回:次世代シーケンシング・DNA 第12回:次世代シーケンシング・RNA 第13回:次世代シーケンシング・16S rDNA 第14回:系統樹 第15回:遺伝子機能解析

次世代シーケンシング Why? 遺伝子の機能を知る。 DNA 遺伝子の発現を知る。 RNA 種や品種を同定する。 16S rDNA

実際の解析の手順 FASTQ形式の配列 FASTA形式の配列 マッピング~計測 標準化 発現解析 多型 特異的発現 共発現

RNA-Seqのマッピング 原理 ソフトウェア リード配列とリファレンス配列の相同性を検出 TopHatが代表的 BLASTも負けていない Linuxベースで動作(現在のMacintoshは可能) マッピング後、CuffLinksで定量化 BLASTも負けていない Magic-BLASTが登場

RNA-Seqの発現量の定量化 CuffLinks Perl言語による自作スクリプト TopHatからの連係が便利 やはりLinuxベース 定量化自体はそれほど複雑な作業ではない

RNA-Seqの発現量の特徴 発現量のダイナミックレンジが広い 低発現の精度が高い 一般的な標準化が利用できる! 検出された配列数で得られる。 マイクロアレイ:蛍光強度で評価する。 低発現の精度が高い 発現していないことを評価できる。 マイクロアレイ:低発現では、ノイズの影響を受ける。 一般的な標準化が利用できる! 標準化すると、実験間で比較できる

RNA-Seqの発現量の標準化 RPKM値の算出 なぜ100万配列に揃えるか? なぜ1000塩基に揃えるか? 100万配列について、1000塩基の遺伝子に変換してリード数を数える。 なぜ100万配列に揃えるか? 実験間でのリード数が異なるため。 なぜ1000塩基に揃えるか? 遺伝子が長い方がマッピングされやすいため。

RNA-Seqの発現量の標準化 Z値の算出 相関関係や比を調べたいのであれば… 一般的な標準化。 ピアソン相関係数に繋がる。 実験間、遺伝子間の相関関係を調べられる。 相関関係や比を調べたいのであれば… RPKM値を計算せずに、Z化で十分。

チェックポイント RNA-Seq解析とは何か? RNA-Seq解析における標準化について説明しなさい。

今日の実習の概要・1 植物試料:Arabidopsis属の葉 実験:ストレス処理 RNA-Seqデータ 実験区:1 対象区:1 もちろん、統計的には3試料ずつが必要

今日の実習の概要・2 クエリーファイル データベース マッピング データ加工 FASTQ形式の2ファイル シロイヌナズナの遺伝子 Magic-BLAST データ加工 Perlスクリプトで遺伝子ごとの発現量計測

今日の実習の概要・3 解析 エクセルで、サンプルとコントロールの発現量の比を計算 発現量の大きい順に並べて、注目遺伝子がストレス処理で特異的に発現しているかを確認