生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール 生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール 2016年10月4日 生命環境科学域 応用生命科学類 尾形 善之
まずは先週のリマインド 全体を眺める みんなを納得させる 木を見て森を見てまた木を見る
この実習で利用するデータ 生物データセットの説明をします シロイヌナズナとは…… シロイヌナズナの遺伝子発現データを使います モデル植物:植物で初めてゲノムが読まれた 染色体5本(普通は10数本)でも、ちゃんと植物です いろいろ実験がしやすい
遺伝子発現とは 遺伝子が転写されること つまり遺伝子が働いていること 複製:DNAをもうひとつ作る 転写:DNAからRNAを作る
遺伝子発現解析 どうやって調べるか ゲノム規模なら「マイクロアレイ」 マイクロアレイとは…… 最近は「次世代シーケンシング」ですが…… 遺伝子の発現量が分かる
マイクロアレイ、もう少し詳しく マイクロアレイの実験手順 ハイブリダイズ DNAが二重鎖になりやすい特性を利用している ATG -> AUG AUG -> TAC TAC=ATG ハイブリダイズ DNAが二重鎖になりやすい特性を利用している 2万本以上!!
シロイヌナズナのマイクロアレイデータ NCBIのGEOで入手できる NCBI: National Center for biotechnology information GEO: Gene Expression Omnibus 現在12,015実験分のデータが入手可能 今回使うのは、そのうち「わずか」237実験分です
生物データセット シロイヌナズナのマイクロアレイデータ 79実験条件 組織、発達段階 3反復 合計237実験
なぜ3反復するのか? 237種類の実験ができたのに…… 統計解析のためです データが3つあると統計指標をつけられます ばらつき(広がり)を評価できます もともと生物データには、ばらつきが大きいです
期末レポートの内容 使うデータ 「biostat16finaldata.txt」 遺伝子発現データ 生物統計学の「期末レポート」の「遺伝子発現データ」のテキストの絵を右クリックして保存する。 遺伝子発現データ でもマイクロアレイではありません。 次世代シーケンサーを使った「RNA-Seq」解析のデータです。
試料 シロイヌナズナの4系統 Col-0とSei-0コントロール(野生種) FcsとFsc:Col-0とSei-0との交雑種 菌感染の耐性が高いとされている(雑種強勢)。
実験の概要 菌の感染 時系列データ Pseudomonas syringae (Pst DC3000) 感染後:1日目、2日目、3日目 感染すると、過敏感細胞死が誘導される。 時系列データ 感染後:1日目、2日目、3日目
データの説明 36実験の遺伝子発現データ シロイヌナズナ 4系統、時系列3時点、3反復 提供するのは反復なしの12実験のデータです。
データの概要 データの概要 次世代シーケンサー(Illumina社HiSeq2000) 塩基長:76塩基 配列数:900,224,946配列(900メガ配列、9億配列)
研究目的 雑種の菌感染時に特異的に発現する遺伝子を探す。 主成分分析(第11~13回)を使って探す。 これらの遺伝子は菌感染に関係がある可能性がある。
チェックポイント・I シロイヌナズナとはどんな植物ですか? マイクロアレイは何を調べる道具ですか? 生物データセットではなぜ反復実験をするのですか?
いろいろなグラフ 円グラフ 折れ線グラフ 棒グラフ そのほかのグラフ 全体の中での割合を見る 変化を見る、量の変化は棒グラフ 量を比べる、量の変化を見る そのほかのグラフ
生物データとグラフ At1g56650の遺伝子発現データ 79実験条件 折れ線でいいの?
生物データとグラフ At1g56650と似た遺伝子発現データをもつ遺伝子群 こうなると折れ線でないと眺めにくい
これも森を見るためのグラフです 枯れていく葉で高発現
チェックポイント・II 円グラフ、折れ線グラフ、棒グラフの使い分けは? シロイヌナズナのある遺伝子の組織別の発現データ全体を眺める方法は?
本日の実習 注目する遺伝子を選ぶ 詳しくは手順書を参照。 ウェブでのグラフ解析 折れ線グラフを作る。 各組織の模式図にマッピングする。
本日の課題 注目する遺伝子についてウェブツールで解析した結果について、 どの手順で注目する遺伝子を選んだか。 注目する遺伝子のIDを書く。 ウェブツールの結果を読み取る。 結果を踏まえて、この遺伝子の発現の特徴について考察する。