Presentation is loading. Please wait.

Presentation is loading. Please wait.

次世代DNAシーケンシングデータの可視化法

Similar presentations


Presentation on theme: "次世代DNAシーケンシングデータの可視化法"— Presentation transcript:

1 次世代DNAシーケンシングデータの可視化法
次世代DNAシーケンシングデータの可視化法 お手軽ツールIntegrative Genomics Viewer(IGV) 基礎生物学研究所・生物機能解析センター 山口勝司 NIBB CORE RESEARCH FACILITIES  FUNCTIONAL GENOMICS FACILITY

2 可視化ツールに求められるもの 膨大なデータを如何に直感的に理解できるようにするか ・発現レベルの数値情報 ・SNPの位置情報
・データの精度情報 gene model / gene annotationと並べたい。 複数のデータセットを並べたい。 見比べることで比較したい。 ゲノムviewerに自分のデータを乗せる。

3 選択の基準  genome deta viewing に求められるもの  取捨選択の基準 1. 無料 / 有料 / 基本無料 2. 個人的レベルの使用 / コミュニティーレベルの使用 3. 見るだけ/自分から色々工夫 4.アクセスのしやすさ 導入に必要なコンピュータスペック マニュアルは分かりやすいか 利用者が多いか 5. 使い安さ 利用の簡便さ 情報の多さ

4 Integrative Genomics Viewer(IGV)
お手軽ツール Integrative Genomics Viewer(IGV) ・アカデミックウェアで無料 ・コミュニティーでの利用者が多い ・オールプラットフォーム ・マニュアルは親切 ・WEBサーバーではなく、PCレベルでできる 共同利用に供するには誰もが簡便に使える必要がある。

5 IGV(Integrative genome viewer)によるデータ可視化
BAMファイルをロードするだけ Produced by Broad Institute

6

7

8

9

10 簡易説明

11

12 ユーザーガイド

13

14

15 色々な生物種のゲノム情報は用意されている。
新たな生物種をロードすることも可能

16 ゲノムViewerなので次世代DNAシーケンサーのデータに限定されない。
マイクロアレイの結果や、ゲノムアノテーションの情報も随時表示できる。 対応するファイル形式に応じて、表示方法が決まる。 引用明記

17 .gctファイル サンプル間・遺伝子間の発現プロファイル
引用明記

18 Gene List View Loading/Defining Gene Lists My Lists 引用明記

19 Nature Biotech. 29:24–26 (2011) Supplement figureからの抜粋

20 Nature Biotech. 29:24–26 (2011) Supplement figureからの抜粋

21 公開情報のviewerとして

22 Human body map project

23 さあ、実際使ってみましょう

24

25 登録されていない生物種・配列でも、自分でimportすればOK

26 スケール変更 popupで情報を 見ることが可能 トラックの移動 Ctr+F gene model単位で右に移動 Ctr+B gene model単位で左に移動 Ctr+Alt+F exon単位で右に移動 マウスのドラッグ移動も可能 ← →による移動も可能

27

28 BAMファイルを読み込む (hoge.hoge)
次世代シーケンサーデータの神髄 ゲノムにマッチされたタグの集合

29 mutファイルを読み込む Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test Chr Ler test

30

31 データを全部消し、別のデータセットへ SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。
   2.BEDファイルを読み込ませてみる。    3.WIGファイルを読み込ませてみる。    4.Chr1: に移動    4.BAMファイルを複数並べてみる VCF file (Variant call file) ここのサンプルのSNP情報が記載されている Viewer上、青色がheteroSNP、水色がhomoSNP Samtools, Vcftoolsで作成可能

32 SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。
   3.WIGファイルを読み込ませてみる。    4.Chr1: に移動    4.BAMファイルを複数並べてみる

33 BEDファイルの描画 ここではトランスポゾン領域が分かるようにします。

34 SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。
   3.WIGファイルを読み込ませてみる。    4.Chr1: に移動    5.BAMファイルを複数並べてみる WIGファイル 単純なベースごとの数値データを扱う時などに用いる。 一定幅での塩基CG ratioのデータを表示させてみましょう 膨大なデータ量なので、バイナリー化すべき。  WIG -> hdf (IGV toolでできます、今回は処理済み) variableStep chrom=Chr1 52 36 53 36 54 34 55 34 56 34 57 32 58 32 59 32 60 34 61 36 62 36 63 34 64 32 65 32

35 SNPを確認してみましょう。 1.VCFファイルを読み込ませてみる。 2.BEDファイルを読み込ませてみる。
   3.WIGファイルを読み込ませてみる。    4.Chr1: に移動    5.BAMファイルを複数並べてみて、目的領域のリード状況をみてみましょう。

36

37 View As Pairs Split Screen View メイトペアデータの場合のみ

38 その他の便利機能 セッションの保存 表示しているデータの読み込み状況を、それごと保存。
 セッションの保存    表示しているデータの読み込み状況を、それごと保存。    セッションをロードすることで、意図した画面を表示できる。      データセットが揃っていること、フォルダー構造が同一である必要がある。  バッチ処理    重要領域の画面スナップショットを自動で取ったりできる。 new load myfile.bam snapshotDirectory mySnapshotDirectory genome hg18 goto chr1:65,289,335-65,309,335 sort position collapse snapshot goto chr1:113,144, ,164,120 sort base collapse snapshot

39 IGV紹介のまとめ 可視化ツールとして十分な機能を持つ ウェブサイトを見ながら復習して頂けたら、もっと良く分かるはず ・無料
・比較的簡単・お手軽 ・次世代DNAシーケンサー解析の標準的ツールになりつつある ・自分で見るためにも良し、人に見せるためにも良し ・利用範囲は次世代DNAシーケンサーに限定しない 広くゲノミクスの解析に有用 ウェブサイトを見ながら復習して頂けたら、もっと良く分かるはず

40

41 当施設での実施例 時間が余っていれば。

42 シミュレーションデータとの比較で生データを評価
全網羅 シミュレー ション

43 拡大してみると、 全網羅 シミュレー ション

44 読めない・ユニークマッチしない領域を飛び超えたメイトペアシーケンスが必須
全網羅 シミュレー ション 読めない・ユニークマッチしない領域を飛び超えたメイトペアシーケンスが必須

45 RNAseq mRNAを断片化して全シーケンスする 次世代DNAシーケンサー共同利用実験  BandoG

46 CDS annotation region 以外へのmappingも見えてくる


Download ppt "次世代DNAシーケンシングデータの可視化法"

Similar presentations


Ads by Google