生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
理化学研究所 発生・再生科学総合研究センター 発生・再生科学総合研究センター. 発生メカニズムの解明 1つの受精卵からどの様にして複雑な個体が発生 するのか。 再生メカニズムの解明 生物はどのようなメカニズムで、怪我や病気、加齢で失った 組織や臓器を再生するのか。 再生医療への学術基盤の構築 細胞移植を中心としたヒトの再生医療に応用可能な発生・再生メカニズムの.
1 情報教育 初級講座 担当: 遠藤 美純 2 今日の内容  Excel の応用 ( 午前 )  データ処理や Word との連携  グラフの作成  PowerPoint によるスライド作成 ( 午後 )  Excel による演算と基本的な関数  Excel.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
Drosophila solexa Tag analysis 2/25
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
植物系統分類学・第13回 分子系統学の基礎と実践
Gene Constellator SystemTM
RNA i (RNA interference).
特論B 細胞の生物学 第2回 転写 和田 勝 東京医科歯科大学教養部.
生物統計学・第3回 全体を眺める(2) 主成分分析
Geneticsから Epigeneticsへ
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
コンピュータ・リテラシーb 第10回 Excel によるグラフ作成.
コンピュータ・リテラシーa 第11回 Excel によるグラフ作成.
2016年度 植物バイオサイエンス情報処理演習 第7回 情報解析(1) 配列相同性解析・1
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
経営工学基礎演習a PowerPointの利用.
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
第10回:Microsoft Excel (2/2)
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
メンデルの分離の法則 雑種第1世代どうしを交配すると草丈の高いものが787個体、草丈の低いものが277個体であった。
遺伝子の機能は、どのようにしてわかるのか
人獣共通感染 E型肝炎ウイルス (HEV)検出システム
第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
Anja von Heydebreck et al. 発表:上嶋裕樹
タンパク質の進化 タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか? 今のタンパク質を調べることでわからないだろうか?
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
第10回:Microsoft Excel (2/2)
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
第14回 教育研究推進センター 共同機器セミナー Agilentのゲノミクスソリューション 遺伝子発現解析のポイント〜サンプルのQCと信頼性
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
Monitoring the Expression Pattern of 1300 Arabidopsis Genes under Drought and Cold Stresses by Using a Full-Length cDNA Microarray The Plant Cell, Vol.13,
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
村石悠介・橋口岳史 農学部資源生物科学科1回生
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
忙しい人のためのR/Bioconductorの基礎
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
The Plant Cell, vol. 14, , February 2002
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
分子生物情報学(0) バイオインフォマティクス
北大MMCセミナー 第100回 附属社会創造数学センター主催 Date: 2019年7月11日(木) 16:30~18:00
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール 生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール 2016年10月4日 生命環境科学域 応用生命科学類 尾形 善之

まずは先週のリマインド 全体を眺める みんなを納得させる 木を見て森を見てまた木を見る

この実習で利用するデータ 生物データセットの説明をします シロイヌナズナとは…… シロイヌナズナの遺伝子発現データを使います モデル植物:植物で初めてゲノムが読まれた 染色体5本(普通は10数本)でも、ちゃんと植物です いろいろ実験がしやすい

遺伝子発現とは 遺伝子が転写されること つまり遺伝子が働いていること 複製:DNAをもうひとつ作る 転写:DNAからRNAを作る

遺伝子発現解析 どうやって調べるか ゲノム規模なら「マイクロアレイ」 マイクロアレイとは…… 最近は「次世代シーケンシング」ですが…… 遺伝子の発現量が分かる

マイクロアレイ、もう少し詳しく マイクロアレイの実験手順 ハイブリダイズ DNAが二重鎖になりやすい特性を利用している ATG -> AUG AUG -> TAC TAC=ATG ハイブリダイズ DNAが二重鎖になりやすい特性を利用している 2万本以上!!

シロイヌナズナのマイクロアレイデータ NCBIのGEOで入手できる NCBI: National Center for biotechnology information GEO: Gene Expression Omnibus 現在12,015実験分のデータが入手可能 今回使うのは、そのうち「わずか」237実験分です

生物データセット シロイヌナズナのマイクロアレイデータ 79実験条件 組織、発達段階 3反復 合計237実験

なぜ3反復するのか? 237種類の実験ができたのに…… 統計解析のためです データが3つあると統計指標をつけられます ばらつき(広がり)を評価できます もともと生物データには、ばらつきが大きいです

期末レポートの内容 使うデータ 「biostat16finaldata.txt」 遺伝子発現データ 生物統計学の「期末レポート」の「遺伝子発現データ」のテキストの絵を右クリックして保存する。 遺伝子発現データ でもマイクロアレイではありません。 次世代シーケンサーを使った「RNA-Seq」解析のデータです。

試料 シロイヌナズナの4系統 Col-0とSei-0コントロール(野生種) FcsとFsc:Col-0とSei-0との交雑種 菌感染の耐性が高いとされている(雑種強勢)。

実験の概要 菌の感染 時系列データ Pseudomonas syringae (Pst DC3000) 感染後:1日目、2日目、3日目 感染すると、過敏感細胞死が誘導される。 時系列データ 感染後:1日目、2日目、3日目

データの説明 36実験の遺伝子発現データ シロイヌナズナ 4系統、時系列3時点、3反復 提供するのは反復なしの12実験のデータです。

データの概要 データの概要 次世代シーケンサー(Illumina社HiSeq2000) 塩基長:76塩基 配列数:900,224,946配列(900メガ配列、9億配列)

研究目的 雑種の菌感染時に特異的に発現する遺伝子を探す。 主成分分析(第11~13回)を使って探す。 これらの遺伝子は菌感染に関係がある可能性がある。

チェックポイント・I シロイヌナズナとはどんな植物ですか? マイクロアレイは何を調べる道具ですか? 生物データセットではなぜ反復実験をするのですか?

いろいろなグラフ 円グラフ 折れ線グラフ 棒グラフ そのほかのグラフ 全体の中での割合を見る 変化を見る、量の変化は棒グラフ 量を比べる、量の変化を見る そのほかのグラフ

生物データとグラフ At1g56650の遺伝子発現データ 79実験条件 折れ線でいいの?

生物データとグラフ At1g56650と似た遺伝子発現データをもつ遺伝子群 こうなると折れ線でないと眺めにくい

これも森を見るためのグラフです 枯れていく葉で高発現

チェックポイント・II 円グラフ、折れ線グラフ、棒グラフの使い分けは? シロイヌナズナのある遺伝子の組織別の発現データ全体を眺める方法は?

本日の実習 注目する遺伝子を選ぶ 詳しくは手順書を参照。 ウェブでのグラフ解析 折れ線グラフを作る。 各組織の模式図にマッピングする。

本日の課題 注目する遺伝子についてウェブツールで解析した結果について、 どの手順で注目する遺伝子を選んだか。 注目する遺伝子のIDを書く。 ウェブツールの結果を読み取る。 結果を踏まえて、この遺伝子の発現の特徴について考察する。