次世代DNAシーケンシングデータの可視化法

Slides:



Advertisements
Similar presentations
UGUI を 使ってみよう ( 導入・紹介?編 ) 1. uGUI とは O Unity 4.6 から使えるようになった UI (ユー ザーインターフェース)システム O 8 月: Unity4.6 β uGUI 試用版公開 O 11 月: Unity4.6 uGUI 正式版公開 正式版公開で、 機能紹介ブロ.
Advertisements

特別支援教育で使える PowerPoint の活用法 研修 最低限必要なスキルはこれでバッチリ!! ICT 活用支援員 高松 崇.
Google フォームの利用法 出欠確認表の運用実例. Google フォームとは Google に登録すると使える機能の一つ「 Google ドライブ」 インターネット上にファイル等を保存出来るスペース、 その中の機能の一つです。 問い合わせやアンケートなどを自由に作れる。 ● アンケートはテンプレートから手軽に出来る.
0 クイックスタートガイド|管理者編 スマートデバイスのビジネス活用を支援する法人向けファイル共有サービス.
第5章 JMPのインストールと基本操作 廣野元久
Web アプリをユーザー毎に カスタマイズ可能にする AOP フレームワーク
logistic regression をしたい場合の STATISTICA2000のアプリケーションの使い方について
JMP version5(以上) 日本語版のScripting Languageによる プログラミング
7-1.WEKOコンテンツ 一括登録 マニュアル Version2.5
Cornell Spectrum Imagerの使い方
4.ユーザー登録マニュアル              Version 年6月10日 国立情報学研究所.
植物系統分類学・第13回 分子系統学の基礎と実践
IT講習会 MicrosoftWord(2007ver.)編 (Wed) Edited by KON
パソコン教室(Word) ワークフロア清柳
join NASS ~つながりあうネットワーク監視システム~
Applet 岡部 祐典 鈴木 敬幸.
情報処理入門A・B 第8回 プレゼンテーション支援ツール
5.WEKOコンテンツ登録 準備 マニュアル Version 2.1
e ポートフォリオ(Mahara)の使い方
コンピュータ・リテラシ b 第12回 簡単な画像処理.
簡単な画像処理 通信教育学部 コンピュータ演習 遠藤美純.
ParaViewを用いたPHITS 計算結果の3次元表示
EGSに対応した粒子軌跡と 計算体系の3次元表示ソフト - CGVIEW -
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
Real Time Graph 指定された計測のデータを実時間収集サーバ(LABCOM)から取得し、リアルタイムにグラフとして表示する。
情報処理 第6回.
情報処理 第6回.
LogStructuredFileSystem Servey
音声処理ソフトPraatの使い方.
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
9.講習の振り返り・お役立ち情報 Version1.2
Microsoft PowerPoint Netscape Communicator
情報コミュニケーション入門b 第5回 プレゼンテーション支援ツール入門
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
情報処理概論Ⅰ 2007 第4回 2018/11/30 情報処理概論Ⅰ 第4回.
各種波形フォーマット変換 / タイミングダイアグラム描画ツール
OpenGLライブラリを用いた3次元フラクタルの描画
Broad Institute GenePattern
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
スマートデバイスのビジネス活用を支援する法人向けファイル共有サービス
MSET使用方法  一時中断したい場合には、マウスの右クリックをしてください(小ウインドウが開き一時停止します)。続行する場合には、開いた小ウインドウ以外の適当な場所を右クリックしてください。
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
PowerPoint へようこそ 簡単に操作するための 5 つのヒント.
フリーソフトでDVDのコピーをしてみよう
EGSに対応した粒子軌跡と 計算体系の3次元表示ソフト - CGVIEW -
7-0.SWORD Client for WEKO インストールマニュアル Version 2.2
遺伝統計学 集中講義 (4) SNPによる領域の評価
プロジェクト演習Ⅱ インタラクティブゲーム制作
植物系統分類学・第14回 分子系統学の基礎と実践
情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(CODH)
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
Microsoft Office クイックガイド ~基本編~
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
5.集計,ピボットテーブル(クロス集計表)
シニアPCマザーズ 平成29年度第5回会員相互勉強会 2017年11月24日(金) 13:30~ 於:雁宿公民館 発表者:吉田恭子
JSPの基本 データベース論 第2回.
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
忙しい人のためのR/Bioconductorの基礎
or-6. 待ち行列シミュレーション (オペレーションズリサーチを Excel で実習するシリーズ)
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
遺伝統計学 集中講義 (6) 終わりに.
予約システムの ご案内 予 約 (24時間) 2.まもなく予約日メール 3.予約日時を確認できます
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
計算機プログラミングI 第2回 2002年10月17日(木) 履習登録 複習 ライブラリの利用 (2.6-7) 式・値・代入 (2.6-8)
Presentation transcript:

次世代DNAシーケンシングデータの可視化法 2011.09.09 次世代DNAシーケンシングデータの可視化法 お手軽ツールIntegrative Genomics Viewer(IGV) 基礎生物学研究所・生物機能解析センター 山口勝司 NIBB CORE RESEARCH FACILITIES  FUNCTIONAL GENOMICS FACILITY

可視化ツールに求められるもの 膨大なデータを如何に直感的に理解できるようにするか ・発現レベルの数値情報 ・SNPの位置情報 ・データの精度情報 gene model / gene annotationと並べたい。 複数のデータセットを並べたい。 見比べることで比較したい。 ゲノムviewerに自分のデータを乗せる。

選択の基準  genome deta viewing に求められるもの  取捨選択の基準 1. 無料 / 有料 / 基本無料 2. 個人的レベルの使用 / コミュニティーレベルの使用 3. 見るだけ/自分から色々工夫 4.アクセスのしやすさ 導入に必要なコンピュータスペック マニュアルは分かりやすいか 利用者が多いか 5. 使い安さ 利用の簡便さ 情報の多さ

Integrative Genomics Viewer(IGV) お手軽ツール Integrative Genomics Viewer(IGV) ・アカデミックウェアで無料 ・コミュニティーでの利用者が多い ・オールプラットフォーム ・マニュアルは親切 ・WEBサーバーではなく、PCレベルでできる 共同利用に供するには誰もが簡便に使える必要がある。

IGV(Integrative genome viewer)によるデータ可視化 BAMファイルをロードするだけ http://www.broadinstitute.org/igv/ Produced by Broad Institute

簡易説明

ユーザーガイド

色々な生物種のゲノム情報は用意されている。 新たな生物種をロードすることも可能

ゲノムViewerなので次世代DNAシーケンサーのデータに限定されない。 マイクロアレイの結果や、ゲノムアノテーションの情報も随時表示できる。 対応するファイル形式に応じて、表示方法が決まる。 引用明記

.gctファイル サンプル間・遺伝子間の発現プロファイル 引用明記

Gene List View Loading/Defining Gene Lists My Lists 引用明記

Nature Biotech. 29:24–26 (2011) Supplement figureからの抜粋

Nature Biotech. 29:24–26 (2011) Supplement figureからの抜粋

公開情報のviewerとして

Human body map project

さあ、実際使ってみましょう

登録されていない生物種・配列でも、自分でimportすればOK

スケール変更 popupで情報を 見ることが可能 トラックの移動 Ctr+F gene model単位で右に移動 Ctr+B gene model単位で左に移動 Ctr+Alt+F exon単位で右に移動 マウスのドラッグ移動も可能 ← →による移動も可能

BAMファイルを読み込む (hoge.hoge) 次世代シーケンサーデータの神髄 ゲノムにマッチされたタグの集合

mutファイルを読み込む Chr1 711 711 Ler test Chr1 892 892 Ler test Chr1 956 956 Ler test Chr1 10904 10904 Ler test Chr1 32210 32210 Ler test Chr1 37388 37388 Ler test Chr1 49438 49438 Ler test Chr1 71326 71326 Ler test Chr1 71348 71348 Ler test Chr1 88300 88300 Ler test

データを全部消し、別のデータセットへ SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。    2.BEDファイルを読み込ませてみる。    3.WIGファイルを読み込ませてみる。    4.Chr1:28211145に移動    4.BAMファイルを複数並べてみる VCF file (Variant call file) ここのサンプルのSNP情報が記載されている Viewer上、青色がheteroSNP、水色がhomoSNP Samtools, Vcftoolsで作成可能

SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。    3.WIGファイルを読み込ませてみる。    4.Chr1:28211145に移動    4.BAMファイルを複数並べてみる

BEDファイルの描画 ここではトランスポゾン領域が分かるようにします。

SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。    3.WIGファイルを読み込ませてみる。    4.Chr1:28211145に移動    5.BAMファイルを複数並べてみる WIGファイル 単純なベースごとの数値データを扱う時などに用いる。 一定幅での塩基CG ratioのデータを表示させてみましょう 膨大なデータ量なので、バイナリー化すべき。  WIG -> hdf (IGV toolでできます、今回は処理済み) variableStep chrom=Chr1 52 36 53 36 54 34 55 34 56 34 57 32 58 32 59 32 60 34 61 36 62 36 63 34 64 32 65 32

SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。    3.WIGファイルを読み込ませてみる。    4.Chr1:28211145に移動    5.BAMファイルを複数並べてみて、目的領域のリード状況をみてみましょう。

View As Pairs Split Screen View メイトペアデータの場合のみ

その他の便利機能 セッションの保存 表示しているデータの読み込み状況を、それごと保存。  セッションの保存    表示しているデータの読み込み状況を、それごと保存。    セッションをロードすることで、意図した画面を表示できる。      データセットが揃っていること、フォルダー構造が同一である必要がある。  バッチ処理    重要領域の画面スナップショットを自動で取ったりできる。 new load myfile.bam snapshotDirectory mySnapshotDirectory genome hg18 goto chr1:65,289,335-65,309,335 sort position collapse snapshot goto chr1:113,144,120-113,164,120 sort base collapse snapshot

IGV紹介のまとめ 可視化ツールとして十分な機能を持つ ウェブサイトを見ながら復習して頂けたら、もっと良く分かるはず ・無料 ・比較的簡単・お手軽 ・次世代DNAシーケンサー解析の標準的ツールになりつつある ・自分で見るためにも良し、人に見せるためにも良し ・利用範囲は次世代DNAシーケンサーに限定しない 広くゲノミクスの解析に有用 ウェブサイトを見ながら復習して頂けたら、もっと良く分かるはず

当施設での実施例 時間が余っていれば。

シミュレーションデータとの比較で生データを評価 全網羅 シミュレー ション

拡大してみると、 全網羅 シミュレー ション

読めない・ユニークマッチしない領域を飛び超えたメイトペアシーケンスが必須 全網羅 シミュレー ション 読めない・ユニークマッチしない領域を飛び超えたメイトペアシーケンスが必須

RNAseq mRNAを断片化して全シーケンスする 次世代DNAシーケンサー共同利用実験  BandoG

CDS annotation region 以外へのmappingも見えてくる