Presentation is loading. Please wait.

Presentation is loading. Please wait.

生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈)

Similar presentations


Presentation on theme: "生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈)"— Presentation transcript:

1 生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈)
生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈) 2014年11月11日 生命環境科学域 応用生命科学類 尾形 善之

2 今回と次回の作業 実習中心で進めます! 今回 次回 ヒートマップ作成(約30分) モデルデータでの主成分分析の練習(約1時間)
注目遺伝子に関連する主成分分析(時間全体)

3 まずはヒートマップ 多かった質問 矢印「<-」の書き方 バックスラッシュの書き方 デスクトップにファイルを置く
半角「<」(小なり)と「-」(マイナス)の2文字 「=」でもOKです バックスラッシュの書き方 半角「\」をキーボードで打つと、R画面上では「 」 「/」(スラッシュ)と間違えやすい デスクトップにファイルを置く デスクトップのフォルダの中ではダメ

4 チェックポイント・I ヒートマップの作成方法は理解できましたか?

5 主成分分析の目的 79実験条件あると、79個の軸でデータを見ないといけない なるべく少ない軸(できれば2つの軸)でデータ全体を眺めたい
2実験なら、そのままグラフ化 なるべく少ない軸(できれば2つの軸)でデータ全体を眺めたい そのためには、うまく実験データを組み合わせたい

6 主成分分析の最終目標 遺伝子をグループ分けしたい なるべくばらばらにして見たい データがばらつく軸を決めたい

7 主成分分析とは…… データセットの情報(発現量)を「ばらつき」に注目して評価する できるだけ大きなばらつきを表せる軸(主成分)を設定する
大きなばらつきを表せたら、その主成分で要素(遺伝子)のグループ分けがしやすくなる

8 目で見る主成分分析の原理 主成分の利点 1.4倍の幅でデータ(点)を表すことができる データを分けやすくしている 実験 (成分)2 幅140
第1主成分(Z1) 主成分の利点 1.4倍の幅でデータ(点)を表すことができる データを分けやすくしている 幅140 幅100 発現量 実験(成分)1

9 主成分の意味を解釈する その主成分に対する実験の負荷量から推理(推察)する
予め注目する実験群がある場合は、その実験群がうまく分かれる主成分を探す

10 うまく分かれない場合 データセットを工夫してみる それでもうまくいかなかったら…… 標準化処理 不要なデータの削除(有効データの抽出)
ただし、「恣意的」にならないように! それでもうまくいかなかったら…… 実験をやり直す……

11 標準化データ 計算式 𝑍= 308.5−137.3 319.3 =0.536 𝑍値の場合は、正負が混ざります 元のデータ 標準化データ
𝑍= − =0.536 𝑍値の場合は、正負が混ざります 元のデータ 標準化データ 308.5 0.536 77.2 -0.187 69.7 -0.209 96.2 -0.127

12 標準化データでの主成分分析 標準化前の寄与率 標準化後の寄与率 標準化前の第一主成分が消えた!

13 標準化データでの主成分分析 標準化前の負荷量 標準化後の負荷量 負荷量のグラフに原点が出現!

14 ちょっと似ていませんか? やっぱり変な花粉です
標準化データでの主成分分析 標準化前の負荷量 標準化後の負荷量 ちょっと似ていませんか? やっぱり変な花粉です

15 標準化データでの主成分分析 標準化前の得点 標準化後の得点 得点の分布がやや均等になっています

16 標準化データでの主成分分析 標準化前の得点 標準化後の得点 細かく見るとけっこう違いますね

17 主成分分析のグラフの使い方 寄与率:主成分のための指標 得点:遺伝子のための指標 負荷量:実験条件のための指標
どの主成分がデータ全体をうまく表しているか 高い寄与率の主成分(主成分Aとする)を選ぶ 得点:遺伝子のための指標 注目遺伝子が主成分Aと関係しているか 主成分の意味付けから遺伝子の特徴を推定する 負荷量:実験条件のための指標 どの実験が主成分Aに関わっているか 主成分の意味を実験条件で意味づける

18 この辺りも何か役に立つことを表しているかも
寄与率:主成分のための指標 データ全体をよく表している この辺りも何か役に立つことを表しているかも 高い寄与率の主成分を選ぶ データ全体を表している 注目遺伝子を特徴付けられるか?

19 得点=遺伝子の発現量(平均との差)×各実験の負荷量
得点:遺伝子のための指標 それぞれの遺伝子を表す 目盛りはあくまで目安です 得点=遺伝子の発現量(平均との差)×各実験の負荷量 ランダムとの比較 データに特徴があるかを確認 注目遺伝子 主成分ごとに位置を確認(今回は正) At1g56650

20 負荷量:実験条件のための指標 各成分 絶対値が大きい実験条件に注目 第1主成分 目盛は目安です すべての実験条件が「負」 注目遺伝子は「正」
○に対応する実験群は? 成熟している組織

21 チェックポイント・II 寄与率は分かりましたか? 得点は分かりましたか? 負荷量は分かりましたか? 主成分の解釈方法は分かりましたか?

22 次回までの予習 次回は「Rを用いた主成分分析」の応用です。 寄与率、得点、負荷量の解釈について、もう一度、確認しておいてください。


Download ppt "生物統計学・第7回 全体を眺める(4) 主成分分析-2 (各種グラフの描き方と解釈)"

Similar presentations


Ads by Google