生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析- 生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析- 2017年1月17日 生命環境科学域 応用生命科学類 尾形 善之
前回のフォロー・1 符号の矛盾について 得点の絶対値の大きい遺伝子を選ぶ際に、負の絶対値が大きい遺伝子を選んだ場合 正の絶対値が大きい負荷量の実験との関係が出てこない 得点と負荷量の符号を合わせることが大事!!
前回のフォロー・2 木を見て森を見てまた木を見る 解釈は少し違っても問題ありません まず木を見る 森を見る また木を見る 森(データセット)に対して、まずひとつの木(要素)に注目する 森を見る 注目した木を通して森を眺める、森の眺め方や特徴を理解できるようになる、特徴的な木が見つかる また木を見る 特徴的な木の特徴が正しいかどうかを確認する ともかく、データを見る目が変わっていればOKです!!
多変量解析とは 多変量データ 多変量解析 多くの要素(遺伝子)と多くの変数(実験)からなる 多変量データを全体的に眺める 多変量データから要素と変数との関係を明らかにする
多変量解析の手法 主成分分析 相関ネットワーク解析 代表的 利点:全体を眺める、遺伝子と実験を繋げる 欠点:解釈しづらい、分けづらい 比較的新しい手法 利点:全体を眺める、分けやすい 欠点:遺伝子と実験を別々に解析、作業が難しい
相関ネットワーク解析 スモールワールド~Newman法 ワッツとストロガッツ (Nature, 1998) Newman (2004)
Zacharyの空手クラブ ネットワークモデル 一人、分け間違えている (Newman, 2004) 実際の34人の空手部員の交友関係 大きく二つのグループに分かれた 一人、分け間違えている (Newman, 2004)
全体を眺める 主成分分析 相関ネットワーク解析
グループに分ける 主成分分析 相関ネットワーク解析
相関ネットワーク解析の手順 多変量データを用意する。 要素間の相関行列を作る。 相関係数を閾値にしたネットワークを描く。 今回はここを実習します。 ネットワーク内をグループ化する。 ここも実習します。
相関ネットワーク解析の実行 Pajek Cytoscape ConfeitoGUI R 今回の実習に使います。 最近もっとも使われます。 私が開発中のソフトウェアです。 R 簡単なネットワークであれば、Rでも描けます。
金平糖アルゴリズムの開発 金平糖 アルゴリズム(右図) 「モジュール」と呼ぶ
ヒストンオクタマー複合体 ○が該当する遺伝子、●は外れ 金平糖アルゴリズム 従来の相関ネットワーク
金平糖アルゴリズムの解析例 マウスマイクロアレイ:実験間(37,013実験) 破骨細胞の実験群
Pajek ダウンロード~インストールする。 ネットワークファイルを用意する。 ネットワークファイルを開く。 ネットワークを描く。 この準備が少し難しい。 ネットワークファイルを開く。 ネットワークを描く。 要素数が多いと、描ききれないことがある。 グループを選ぶ。 ネットワークを描けなくてもグループを選ぶことができる。
チェックポイント 相関ネットワーク解析とは? 相関ネットワーク解析の手順は?
実習と課題 手順書で進めます。