2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA

Slides:



Advertisements
Similar presentations
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
Advertisements

第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
DDBJing講習会 2015年7月29日 那覇 プライマーの作成・活用の実際 森 宙史 Hiroshi Mori 東京工業大学
情報処理 第7回:Wordを用いた文書の作成 その2 June. 10, 2016.
植物系統分類学・第13回 分子系統学の基礎と実践
RNA i (RNA interference).
DNA鑑定によるコメの トレーサビリティーの確保 東京工科大学 バイオニクス学部 多田雄一.
特論B 細胞の生物学 第2回 転写 和田 勝 東京医科歯科大学教養部.
生物統計学・第3回 全体を眺める(2) 主成分分析
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
5/21~6/11 担当講師 柘植謙爾(つげ けんじ) (6)第4章 ゲノム配列の解析
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
翻訳 5’ → 3’ の方向 リボソーム上で行われる リボソームは蛋白質とrRNAの複合体 遺伝情報=アミノ酸配列
マイクロソフト Access を使ってみよう 第1回
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
情報処理 第8回:Wordを用いた文書の作成 その2 June. 8, 2018.
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
遺伝子の機能は、どのようにしてわかるのか
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による 化合物の性質予測(3) 配列アライメント
Twist DX Probe&Primerの選定方法
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
マイクロソフト Access を使ってみよう 第2回
烏骨鶏のミトコンドリア 全長塩基配列について
遺伝統計学 集中講義 (4) SNPによる領域の評価
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
植物系統分類学・第14回 分子系統学の基礎と実践
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
遺伝性疾患・先天性疾患  染色体・遺伝子の異常とその分類  遺伝性疾患  先天性疾患.
情報処理 第7回:Wordを用いた文書の作成 その2 June. 9, 2017.
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
東京工科大学 コンピュータサイエンス学部 亀田弘之
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
村石悠介・橋口岳史 農学部資源生物科学科1回生
遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
忙しい人のためのR/Bioconductorの基礎
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
配列解析アルゴリズム特論 配列アライメントI
分子生物情報学(0) バイオインフォマティクス
第3回Bashゼミ for文処理について 発表者 直江 宗紀.
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA 2018年6月22日 機能ゲノム科学  尾形 善之

今後の予定 第10回:配列相同性解析・DNA 第11回:次世代シーケンシング・DNA 第12回:次世代シーケンシング・RNA 第13回:次世代シーケンシング・16S rDNA 第14回:系統樹 第15回:遺伝子機能解析

次世代シーケンシング Why? 遺伝子の機能を知る。 DNA 遺伝子の発現を知る。 RNA 種や品種を同定する。 16S rDNA

シーケンシングの歴史・DNA ゲノム解読 今世紀初頭:サンガー法 現在:次世代(第二世代)シーケンシング ヒトやシロイヌナズナのゲノムを解読 国際プロジェクトで数年 現在:次世代(第二世代)シーケンシング モデル生物だけでなく多くの生物のゲノムを解読 モデル生物のリシーケンシング ひとつのプロジェクトで一年 Wikipedia

サンガー法 ポリアクリルアミドゲル電気泳動 キャピラリー電気泳動 高速化を実現 Wikipedia

次世代シーケンシングの実際 大規模な並列化を実現 マルチプレックス法 イルミナ社HPより

シーケンサーのスループット 2.5Mb/日 3年半で1人 1.8Gb/日 2日で1人 400Gb/日 1日で130人 イルミナ社HPより

次世代シーケンシングのデータ解析 次世代シーケンサー(NGS)からの出力 データ解析 配列データ:FASTQ形式 ゲノム解読(リファレンスなし):アセンブリ リシーケンシング(リファレンスあり):マッピング

アセンブリ(アセンブル) 材料 作業 リード:NGSから出力されたFASTQ配列 短いリード配列を繋ぎ合わせて長くする de Bruijn graphを利用するアルゴリズム こちらのサイトで説明します アセンブラーソフトはこちらで説明します

ゲノムマッピング 原理 ソフトウェア リード配列とゲノム配列との相同性を検出 一般には、Bowtie2やBWAが主流 ここでは、BLASTを紹介します

SNP解析 一塩基多型 (Single Nuleotide Polymorphism) 目的 作業 同種の系統(個体)間で、遺伝子内の一塩基置換を検出する。 作業 試料の塩基配列を同種の参照配列にマッピングして、塩基が一致しない箇所を探す。

SNP解析ツール GATK Magic-BLAST MagicSuite コマンドライン GUI もっとも汎用 さまざまなツー ル ツール名 GATK Magic-BLAST MagicSuite プラットフォーム コマンドライン GUI 特徴 もっとも汎用 さまざまなツー ル 使える機能が 多すぎて…… Windowsには 対応していない NCBI提供 ショートリード のマッピング 試料によらな い (DNA, RNA, 16S rDNA) 出力データの 加工が必要 Magic-BLAST ベースで動作 目的に応じて、 出力データを 自動加工

SNP解析の実際・1 クエリーリード配列 データベース配列 次世代シーケンサーから出力されたFASTQファイル NCBIのGenomeデータベースから入手したゲノムのFASTAファイル

SNP解析の実際・2 Magic-BLASTの実行 データベースの作成 プログラムの実行 オプション 「makeblastdb」コマンド 「-outfmt tabular」:タブ区切りで出力 「-score 数字」:ヒットする塩基数の閾値を設定

SNP解析の実際・3 Magic-BLAST出力ファイルの処理 出力ファイルの読み取り 出力ファイルの集計 塩基の置換・欠失・挿入のあった箇所の確認 今日の実習でやります 出力ファイルの集計 置換箇所の割合の評価 今日の実習ではやりません(MagicSuiteで)

出力ファイルの説明 各列の概要 1列目:クエリーのID(今回は不要) 2列目:データベースのID(染色体番号) 7,8列目(G,H列):クエリーの塩基番号 9,10列目(I,J列):データベースの塩基番号 14,15列目(N,O列):配列の方向 17列目(Q列):置換などの情報

染色体番号 0:第1染色体 1:第2染色体 2:第3染色体 3:第4染色体 4:第5染色体 5:ミトコンドリア 6:葉緑体

配列の方向 クエリーの方向(N列) データベースの方向(O列) 基本的に「plus」 「plus」と「minus」がある 注目遺伝子の方向と同じであることがポイント

置換などの情報 数字のみ:すべての塩基が一致 「58AG17」 他の記号 最初から58塩基と後ろから17塩基は一致 「-」:ギャップ 「^」:イントロンの塩基数 「_」:クエリーのギャップの塩基数

チェックポイント DNAシーケンシングの歴史について説明しなさい。 SNP解析について説明しなさい。