Presentation is loading. Please wait.

Presentation is loading. Please wait.

2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA

Similar presentations


Presentation on theme: "2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA"— Presentation transcript:

1 2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2018年6月22日 機能ゲノム科学  尾形 善之

2 今後の予定 第10回:配列相同性解析・DNA 第11回:次世代シーケンシング・DNA 第12回:次世代シーケンシング・RNA
第13回:次世代シーケンシング・16S rDNA 第14回:系統樹 第15回:遺伝子機能解析

3 次世代シーケンシング Why? 遺伝子の機能を知る。 DNA 遺伝子の発現を知る。 RNA 種や品種を同定する。 16S rDNA

4 シーケンシングの歴史・DNA ゲノム解読 今世紀初頭:サンガー法 現在:次世代(第二世代)シーケンシング ヒトやシロイヌナズナのゲノムを解読
国際プロジェクトで数年 現在:次世代(第二世代)シーケンシング モデル生物だけでなく多くの生物のゲノムを解読 モデル生物のリシーケンシング ひとつのプロジェクトで一年 Wikipedia

5 サンガー法 ポリアクリルアミドゲル電気泳動 キャピラリー電気泳動 高速化を実現 Wikipedia

6 次世代シーケンシングの実際 大規模な並列化を実現 マルチプレックス法 イルミナ社HPより

7 シーケンサーのスループット 2.5Mb/日 3年半で1人 1.8Gb/日 2日で1人 400Gb/日 1日で130人 イルミナ社HPより

8 次世代シーケンシングのデータ解析 次世代シーケンサー(NGS)からの出力 データ解析 配列データ:FASTQ形式
ゲノム解読(リファレンスなし):アセンブリ リシーケンシング(リファレンスあり):マッピング

9 アセンブリ(アセンブル) 材料 作業 リード:NGSから出力されたFASTQ配列 短いリード配列を繋ぎ合わせて長くする
de Bruijn graphを利用するアルゴリズム こちらのサイトで説明します アセンブラーソフトはこちらで説明します

10 ゲノムマッピング 原理 ソフトウェア リード配列とゲノム配列との相同性を検出 一般には、Bowtie2やBWAが主流
ここでは、BLASTを紹介します

11 SNP解析 一塩基多型 (Single Nuleotide Polymorphism) 目的 作業
同種の系統(個体)間で、遺伝子内の一塩基置換を検出する。 作業 試料の塩基配列を同種の参照配列にマッピングして、塩基が一致しない箇所を探す。

12 SNP解析ツール GATK Magic-BLAST MagicSuite コマンドライン GUI もっとも汎用 さまざまなツー ル
ツール名 GATK Magic-BLAST MagicSuite プラットフォーム コマンドライン GUI 特徴 もっとも汎用 さまざまなツー ル 使える機能が 多すぎて…… Windowsには 対応していない NCBI提供 ショートリード のマッピング 試料によらな い (DNA, RNA, 16S rDNA) 出力データの 加工が必要 Magic-BLAST ベースで動作 目的に応じて、 出力データを 自動加工

13 SNP解析の実際・1 クエリーリード配列 データベース配列 次世代シーケンサーから出力されたFASTQファイル
NCBIのGenomeデータベースから入手したゲノムのFASTAファイル

14 SNP解析の実際・2 Magic-BLASTの実行 データベースの作成 プログラムの実行 オプション 「makeblastdb」コマンド
「-outfmt tabular」:タブ区切りで出力 「-score 数字」:ヒットする塩基数の閾値を設定

15 SNP解析の実際・3 Magic-BLAST出力ファイルの処理 出力ファイルの読み取り 出力ファイルの集計
塩基の置換・欠失・挿入のあった箇所の確認 今日の実習でやります 出力ファイルの集計 置換箇所の割合の評価 今日の実習ではやりません(MagicSuiteで)

16 出力ファイルの説明 各列の概要 1列目:クエリーのID(今回は不要) 2列目:データベースのID(染色体番号)
7,8列目(G,H列):クエリーの塩基番号 9,10列目(I,J列):データベースの塩基番号 14,15列目(N,O列):配列の方向 17列目(Q列):置換などの情報

17 染色体番号 0:第1染色体 1:第2染色体 2:第3染色体 3:第4染色体 4:第5染色体 5:ミトコンドリア 6:葉緑体

18 配列の方向 クエリーの方向(N列) データベースの方向(O列) 基本的に「plus」 「plus」と「minus」がある
注目遺伝子の方向と同じであることがポイント

19 置換などの情報 数字のみ:すべての塩基が一致 「58AG17」 他の記号 最初から58塩基と後ろから17塩基は一致
「-」:ギャップ 「^」:イントロンの塩基数 「_」:クエリーのギャップの塩基数

20 チェックポイント DNAシーケンシングの歴史について説明しなさい。 SNP解析について説明しなさい。


Download ppt "2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA"

Similar presentations


Ads by Google