生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
1 情報基礎 A 第 9 週 プログラミング入門 VBA の基本文法 1 準備・変数・データの入出力 徳山 豪・全 眞嬉 東北大学情報科学研究科 システム情報科学専攻 情報システム評価学分野.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
情報処理実習 第05回 Excelマクロ機能入門 操作マクロ入門.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
Gene Constellator SystemTM
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
生物統計学・第3回 全体を眺める(2) 主成分分析
ソースコード品質概論 なぜソースの品質を追求するのか
貧困と出産の関係.
研究室入退室システムの評価 学校に来なくても卒論は進むのか?
データ分析入門(13) 第13章 主成分分析 廣野元久.
主成分分析                     結城  隆   .
看護研究における 統計の活用法 Part 6 京都府立医科大学 浅野 弘明 2012年11月10日 1.
12月4日 伊藤 早紀 重回帰分析.
回帰分析/多変量分析 1月18日.
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
ワークショップ ユーザーとメーカーの公開相談会
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
ソートアルゴリズムの種類 選択ソート (selection sort) バブルソート (bubble sort)
Rコマンダーで2元配置ANOVA 「理学療法」Vol28(8)のデータ
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
多変量解析ゼミ 第10回 第12章クラスター分析 発表者 直江 宗紀.
ユーザ・インタフェース 小テスト 第5回.
主成分分析 Principal Component Analysis PCA
東京工科大学 コンピュータサイエンス学部 亀田弘之
プログラミング論 主成分分析
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
植物系統分類学・第14回 分子系統学の基礎と実践
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
ボットネットはいくつあるか?ダウンロードログからの線形独立な基底数
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
標準時間の設定と生産性改善 日本能率協会セミナー 目標 6時間 期間 3ヶ月 講師 MEマネジメントサービス編
用例とそのコンピューター上での実行に重点を置く
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
rd-7. 主成分分析 (Rシステムでデータサイエンス演習)
データ構造と アルゴリズムI 第三回 知能情報学部 新田直也.
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
C#プログラミング実習 第1回.
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析- 生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析- 2017年1月17日 生命環境科学域 応用生命科学類 尾形 善之

前回のフォロー・1 符号の矛盾について 得点の絶対値の大きい遺伝子を選ぶ際に、負の絶対値が大きい遺伝子を選んだ場合 正の絶対値が大きい負荷量の実験との関係が出てこない 得点と負荷量の符号を合わせることが大事!!

前回のフォロー・2 木を見て森を見てまた木を見る 解釈は少し違っても問題ありません まず木を見る 森を見る また木を見る 森(データセット)に対して、まずひとつの木(要素)に注目する 森を見る 注目した木を通して森を眺める、森の眺め方や特徴を理解できるようになる、特徴的な木が見つかる また木を見る 特徴的な木の特徴が正しいかどうかを確認する ともかく、データを見る目が変わっていればOKです!!

多変量解析とは 多変量データ 多変量解析 多くの要素(遺伝子)と多くの変数(実験)からなる 多変量データを全体的に眺める 多変量データから要素と変数との関係を明らかにする

多変量解析の手法 主成分分析 相関ネットワーク解析 代表的 利点:全体を眺める、遺伝子と実験を繋げる 欠点:解釈しづらい、分けづらい 比較的新しい手法 利点:全体を眺める、分けやすい 欠点:遺伝子と実験を別々に解析、作業が難しい

相関ネットワーク解析 スモールワールド~Newman法 ワッツとストロガッツ (Nature, 1998) Newman (2004)

Zacharyの空手クラブ ネットワークモデル 一人、分け間違えている (Newman, 2004) 実際の34人の空手部員の交友関係 大きく二つのグループに分かれた 一人、分け間違えている (Newman, 2004)

全体を眺める 主成分分析 相関ネットワーク解析

グループに分ける 主成分分析 相関ネットワーク解析

相関ネットワーク解析の手順 多変量データを用意する。 要素間の相関行列を作る。 相関係数を閾値にしたネットワークを描く。 今回はここを実習します。 ネットワーク内をグループ化する。 ここも実習します。

相関ネットワーク解析の実行 Pajek Cytoscape ConfeitoGUI R 今回の実習に使います。 最近もっとも使われます。 私が開発中のソフトウェアです。 R 簡単なネットワークであれば、Rでも描けます。

金平糖アルゴリズムの開発 金平糖 アルゴリズム(右図) 「モジュール」と呼ぶ

ヒストンオクタマー複合体 ○が該当する遺伝子、●は外れ 金平糖アルゴリズム 従来の相関ネットワーク

金平糖アルゴリズムの解析例 マウスマイクロアレイ:実験間(37,013実験) 破骨細胞の実験群

Pajek ダウンロード~インストールする。 ネットワークファイルを用意する。 ネットワークファイルを開く。 ネットワークを描く。 この準備が少し難しい。 ネットワークファイルを開く。 ネットワークを描く。 要素数が多いと、描ききれないことがある。 グループを選ぶ。 ネットワークを描けなくてもグループを選ぶことができる。

チェックポイント 相関ネットワーク解析とは? 相関ネットワーク解析の手順は?

実習と課題 手順書で進めます。