Download presentation
Presentation is loading. Please wait.
1
生物統計学・第8回 違いを調べる(3) 判別分析、多重比較
生物統計学・第8回 違いを調べる(3) 判別分析、多重比較 2013年11月25日 生命環境科学域 応用生命科学類 尾形 善之
2
まず最初に…… 前回のレポート 対応のあるなしが分からない ふたつのU検定の違いが分からない
標準化した主成分分析で何が良くなったか分からない
3
データセットの対応 対応なし 対応あり 並べ替えても同じ意味 勝手に並べ替えてはダメ 繰り返し At1g56650 At3g43660 1
113.3 8.7 2 58.4 25.5 3 59.9 19.7 実験 At1g56650 At3g43660 1 308.5 27.5 2 77.2 18.0 3 69.7 20.5 4 96.2 13.3 5 40.3 16.8 6 53.1 17.7 ⋮ 79 77.7 99.4 並べ替えても同じ意味 勝手に並べ替えてはダメ
4
(正確には、ウィルコクスンの符号付順位和検定)
ふたつのデータセットの検定 パラメトリック ノンパラメトリック 対応あり 対応のある𝒕検定 ウィルコクスンの検定 (正確には、ウィルコクスンの符号付順位和検定) 対応なし 対応のない𝒕検定 マン・ホイットニーの検定
5
もうひとつの𝑼検定 ウィルコクスンの検定 実験ごとに差を計算 差の絶対値の大きい順に順位づけ 差が正のときの順位の合計を計算
注目遺伝子の発現量-対照遺伝子の発現量 差の絶対値の大きい順に順位づけ 差が正のときの順位の合計を計算 検定表で𝑝値を得る
6
本日の課題 ふたつの遺伝子の79実験での発現データに関して 𝒕検定について、検定の種類・検定統計量の算出・有意の判定方法を答えなさい。
𝒕検定、𝑼検定、標準化データの主成分分析の印象・疑問点を書いてください。
7
本日の課題 ふたつの遺伝子の79実験での発現データに関して
このデータセットを使って 𝒕検定をする場合の検定の種類・検定統計量の算出・有意の判定方法を答えなさい。 𝒕検定、𝑼検定、標準化データの主成分分析の印象・疑問点を書いてください。
8
標準化データのPCA ランダムデータとの寄与率の比較 標準化前の寄与率 標準化後の寄与率 ランダムの寄与率
9
標準化データでの主成分分析 標準化前の負荷量 標準化後の負荷量 負荷量のグラフに原点が出現!
10
標準化データのPCA 各主成分の寄与率
11
チェックポイント・I データセットの対応、ふたつのデータセットの検定の使い分け、標準化データでの主成分分析の利点は理解できましたか?疑問点があれば書いてください。
12
分散分析 判別分析とともに次回取り上げます 分散分析の目的 複数グループでの差の検定 𝑡検定は2グループでの検定
でも、どこかに違いがあることがわかるだけ……
13
3つ以上のデータセットの検定 分散分析 判別分析 データセット間のどこかに違いがある データセットをグループに分ける
どのデータセット間に違いがあるかは分からない 判別分析 データセットをグループに分ける 分散分析の後にやることが多い 絶対に分散分析が必要なわけではない
14
分散分析 まず教科書で説明します 持っていない人はスライドを見てください
15
エクセルでやる分散分析 3つの遺伝子の79実験での発現データ 実演します 手計算を求めません A1~C79セルにデータ入力
データ → データ分析 → 分散分析:一元配置 入力範囲をA1~C79に設定 「先頭行をラベルとして使用」のチェックを外す 𝛼を0.05に設定 結果の分散分析表の「𝑝値」を読めばOK 手計算を求めません
16
でも、手計算したい人のために 分散分析を実演します ここは理解しなくても大丈夫です エクセルファイル
17
分散分析の纏め 3つ以上のデータセットの違いを示す 作業はエクセルでできる 𝒇分布を使う 𝒑値を読み取る
言えることは「データセットのどこかに違いがある」というだけ
18
チェックポイント・II 分散分析の目的は? 分散分析をソフトウェア(エクセル)で実行する手順は? 分散分析で言えることは?
19
判別分析
20
判別分析
21
判別分析
22
判別分析の纏め 2つ以上のデータをグループ分けする。 エクセルの分析ツールには含まれない。 実際はクラスタリングの方が便利
統計的な有意が必要な場合に使う エクセルの分析ツールには含まれない。 Rや各種統計ソフトを使う 線形判別分析は手計算もなんとかできる
23
今日の自習のポイント 分散分析の作業はエクセルでできます! 「anova xlsx」をダウンロード
24
次回までの予習 次回は「相関係数」です 教科書 相関係数、スピアマンの順位相関係数、共分散 インターネット コサイン相関
25
本日の課題 三つの遺伝子の79実験での発現データに関して以下の問いに答えなさい。
三つの遺伝子の発現データに違いがあるかどうかを調べる手順を書きなさい。 分散分析・判別分析の疑問点を書いてください。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.