生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
統計学入門(1) 第 10 回 基本統計量:まとめ. 統計学第 8 回 2 前回の練習問題の解答 (1) から (4) に対応するヒストグラムはそれぞれどれか。
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
-OHBYカードを素材とした演習- カードの演習と職業理解 大学等でのキャリア教育プログラム(活用案) 2コマ分
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
植物系統分類学・第13回 分子系統学の基礎と実践
ロードセルによる柔道特有の引く力を測る T20ES08 坂本 正吏 指導教員 吉田 清範.
認知科学ワークショップ 第2回 記憶(1).
第1回 担当: 西山 統計学.
「Self-Organizing Map 自己組織化マップ」 を説明するスライド
生物統計学・第3回 全体を眺める(2) 主成分分析
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
教育実習事前指導 第二回  2004.4.1 長谷川元洋.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
母分散が既知あるいは大標本の 平均に関する統計的検定
シミュレーション物理7 乱数.
対応のあるデータの時のt検定 重さの測定値(g) 例:
情報処理 第13回.
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
コンピュータ・リテラシーb 第10回 Excel によるグラフ作成.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
2016年度 植物バイオサイエンス情報処理演習 第9回 情報処理(5) データを集計する
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
ガウス過程による回帰 Gaussian Process Regression GPR
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
-OHBYカードを素材とした演習- カードの演習と職業理解 大学等でのキャリア教育プログラム(活用案) 2コマ分
Fuzzy c-Means法による クラスター分析に関する研究
2017年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
Broad Institute GenePattern
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第7回 公共データバンクの遺伝子発現情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
Anja von Heydebreck et al. 発表:上嶋裕樹
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
数量分析 第2回 データ解析技法とソフトウェア
Data Clustering: A Review
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
統計学の授業でのセカンド モニタとしてのiPhoneの使用
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
情報処理基礎A・B 坂口利裕 横浜市立大学・商学部
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
自己組織化マップ Self-Organizing Map SOM
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
メソッドの同時更新履歴を用いたクラスの機能別分類法
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
Ion PGM™ 次世代シーケンサーによる 受託解析サービスのご案内 ・細菌叢解析(16S メタゲノム)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
混合ガウスモデル Gaussian Mixture Model GMM
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ 生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ 2014年10月14日 生命環境科学域 応用生命科学類 尾形 善之

前回のリベンジ 作業マニュアルを作りました いつもの場所から、「sagyotejun141014.docx」というファイルをダウンロードしてください。 実習は今回のものと併せて後で行います。

さっそく本日の本題 クラスタリング(「クラスター分析」とも言います) 各種クラスタリング データを分類するのに使います 実験群のクラスター 遺伝子群のクラスター 各種クラスタリング 主成分分析(第6回から3回にわたってやります) 階層(的)クラスタリングが一番有名です その他 自己組織化マップ(SOM)、ネットワーク解析、ヒートマップなど

階層クラスタリング 最も近い関係のものを線で繋ぐ トーナメント戦のやぐらの形 固まっているもの同士が似ている 階段状には注意!

階層クラスタリンク

階層クラスタリング Rでは「dist」と「hclust」を使う ヒートマップと組み合わせて利用できます 第6回のRの回で実習します 次のスライドで説明します

階層クラスタリングとヒートマップ 図の説明 縦:実験 横:遺伝子 赤いほど発現量が多い これで50遺伝子

実はこれもヒートマップです

チェックポイント・I 階層(的)クラスタリングとは? ヒートマップとは?

遺伝子の発現傾向を分類できるが、丸の数は自分で決める 自己組織化マップ(SOM) 79実験での遺伝子発現 遺伝子名 遺伝子の発現傾向を分類できるが、丸の数は自分で決める

遺伝子の関係は見やすいが、発現傾向は同時には見れない ネットワーク解析 遺伝子の関係は見やすいが、発現傾向は同時には見れない

クラスター分析の使い分け 主成分分析(第6回からじっくりと) 階層クラスタリング(ヒートマップ付きで) 自己組織化マップ(グループ数を固定) ともかくまずはこれが便利 階層クラスタリング(ヒートマップ付きで) 遺伝子発現と実験の両方を見たいとき 自己組織化マップ(グループ数を固定) グループ分けが目的のとき ネットワーク解析 全体の分かれ方を見たいとき

チェックポイント・II クラスター解析の使い分けは?

本日の実習 ヒストグラムの作成 ウェブでのグラフ解析 遺伝子発現データをエクセルで開く。 遺伝子ごとの平均値を計算する。 平均値のヒストグラムを作る。 ウェブでのグラフ解析 折れ線グラフを作る。 各組織の模式図にマッピングする。

本日の実習 (sagyotejun141014.docx) 遺伝子発現データをエクセルで開く ウェブで解析する エクセルで平均値を計算する エクセルでヒストグラムを作る 結果を解釈する(本日の課題)

リンク先 折れ線グラフ 模式図 http://jsp.weigelworld.org/expviz/expviz.jsp http://bar.utoronto.ca/efp/cgi-bin/efpWeb.cgi

次回までの予習 次回は「比べる準備をする」の1回目です 平均 分散 ばらつき

本日の課題 注目する遺伝子について クラスタリングとヒートマップに対する疑問点や印象を書いてください。 どの組織で発現しているか考察しなさい。 発現量の平均値を求めなさい。 ヒストグラムの中の位置について考察しなさい。 クラスタリングとヒートマップに対する疑問点や印象を書いてください。