Presentation is loading. Please wait.

Presentation is loading. Please wait.

生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法

Similar presentations


Presentation on theme: "生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法"— Presentation transcript:

1 生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年10月11日 生命環境科学域 応用生命科学類 尾形 善之

2 さっそく本日の本題 クラスタリング(「クラスター分析」とも言います) 各種クラスタリング データを分類するのに使います
主成分分析(第11回から3回にわたってやります) 階層(的)クラスタリングが一番有名です その他 自己組織化マップ(SOM)、ネットワーク解析、ヒートマップなど

3 階層クラスタリング 最も近い関係のものを線で繋ぐ 固まっているもの同士が似ている トーナメント戦のやぐらの形 階段状には注意!
本当は似ていないかも…… 利点:似ている部分を直感的に見つけやすい、大規模OK 欠点:実験と遺伝子の両方を見ることができない、階段注意!

4 階層クラスタリンク

5 階層クラスタリング Rでは「dist」と「hclust」を使う ヒートマップと組み合わせて利用できます 次のスライドで説明します

6 階層クラスタリングとヒートマップ 図の説明 縦:実験 横:遺伝子 赤いほど発現量が多い これで50遺伝子
利点:実験と遺伝子の両方を同時に見ることができる 欠点:不明瞭な時には、結局のところ見方が分からない

7 実はこれもヒートマップです 利点:遺伝子の発現を直感的に分かりやすい 欠点:複数の遺伝子の比較はできない(何枚か並べれば……)

8 チェックポイント・I 階層(的)クラスタリングとは? ヒートマップとは?

9 主成分分析(第11回から詳しく) 概要 全体のデータセットをいくつかの成分に纏める 纏めた成分ごとに、遺伝子と実験の特徴を見る
利点:実験と遺伝子の両方をふたつのグラフで見ることができる 欠点:不明瞭なときには、うまく分けられない

10 自己組織化マップ(SOM) 79実験での遺伝子発現 遺伝子名 利点:実験と遺伝子の発現傾向を分類できる
欠点:丸の数は自分で決める、データ数が多いと手に負えない

11 ネットワーク解析 利点:クラスター解析で不明瞭な場合に、明瞭に分けられる 欠点:遺伝子と実験を同時に見ることができない、解析が難しい

12 クラスター分析の使い分け 主成分分析(第11回からじっくりと) 階層クラスタリング(ヒートマップ付きで)
ともかくまずはこれが便利 階層クラスタリング(ヒートマップ付きで) 遺伝子発現と実験の両方を見たいとき 自己組織化マップ(グループ数を固定) グループ分けが目的のとき ネットワーク解析(大きいほど有利) 全体をしっかりと分けたいとき

13 チェックポイント・II クラスター解析の使い分けは?

14 本日の実習 Rでクラスター解析する 階層クラスタリングする。 ヒートマップを作成する。

15 本日の課題 シロイヌナズナの遺伝子発現データ79実験条件を手に入れました。 これらのデータを全体的にどのように眺めたらよいか説明しなさい。
注目した遺伝子について眺めた結果について考察しなさい。


Download ppt "生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法"

Similar presentations


Ads by Google