Download presentation
Presentation is loading. Please wait.
1
2015年1月20日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第14回 傾向を調べる 回帰分析 2015年1月20日 生命環境科学域 応用生命科学類 尾形 善之
2
今日の流れ 講義 相関係数のおさらい 回帰分析 実習 ピアソン相関係数の検定 スピアマン相関係数 単回帰分析
3
ピアソンの相関係数 正確には「ピアソンの積率相関係数」 でもZ化したデータを使うと……
𝑟= 𝑥 1 − 𝑥 𝑦 1 − 𝑦 +⋯+ 𝑥 𝑛 − 𝑥 𝑦 𝑛 − 𝑦 𝑥 1 − 𝑥 2 +⋯+ 𝑥 𝑛 − 𝑥 𝑦 1 − 𝑦 2 +⋯+ 𝑦 𝑛 − 𝑦 2 でもZ化したデータを使うと…… 𝑟= 𝑥 1 𝑦 1 +⋯ +𝑥 𝑛 𝑦 𝑛 𝑛 これでOK 平均値との差 標準偏差 すでに平均値との差を 標準偏差で割っている 平均値は0 標準偏差は1
4
エクセルで計算する =correl(A1:A5,B1:B5) これだけ A B 1 308 27 2 77 18 3 69 20 4 96
13 5 40 16 =correl(A1:A5,B1:B5) これだけ
5
相関係数の目安 大体の目安 実は検定もできます 0.8以上:かなり相関が高い 0.6以上:相関がある 一般的には、𝑅表を使います
エクセルで𝑝値を計算できます
6
相関係数の意味 正の相関係数 よく似ている 負の相関係数 逆の傾向 相関係数0 まったく関係がない
7
相関係数の検定 𝒕検定を利用します まずは𝑡値の計算 次に𝑝値の計算 𝑡= 𝑟× 𝑛−2 1− 𝑟 2 エクセルでは、
𝑡= 𝑟× 𝑛−2 1− 𝑟 2 エクセルでは、 相関係数がA1セル、要素数が79とすると、 =A1*SQRT(79-2)/SQRT(1-A1^2) 次に𝑝値の計算 𝑡値がA2セルとすると、 =TDIST(A2,77,2) 自由度:77、両側検定
8
スピアマンの順位相関係数 使い道 データが数値でないとき データが順位のとき 計算式 𝜌=1− 𝑥 𝑖 − 𝑦 𝑖 𝑛 𝑛 2 −1
9
エクセルで計算する場合 順位を計算 順位データでピアソン相関係数を計算 =rank(A1,A1:A5) =correl(C1:D5) A B
308 27 2 77 18 3 69 20 4 96 13 5 40 16
10
回帰分析 相関係数との関係 手計算はほとんどできません 相関係数:ふたつのデータセットの類似性 回帰分析:近似式とデータセットの類似性
カイ二乗検定と似ています 独立性の検定:ふたつのデータセットが対象 適合度の検定:正解データとデータセットが対象 手計算はほとんどできません エクセルの関数や分析ツールを利用します
11
回帰分析の目的 実測値と理論値の比較 あらかじめ理論値がある場合 新たに理論モデルを作る場合 実測値と理論値の相関係数!
実測値が理論値にどのくらい当てはまるか? 新たに理論モデルを作る場合 理論値は実測値をどのくらいうまく説明できるか? 実測値と理論値の相関係数!
12
回帰分析の原理 線とどれだけ近いか 線との差の二乗和 回帰式:𝑦=𝑎𝑥+𝑏 ○と●がどれだけ近いか 丸同士の差の二乗和 相関係数 𝑟
13
回帰分析の手順 理論値がある場合 実測値と理論値のデータセットを用意 データ分析 → 回帰分析 入力範囲を指定してOK 出力結果
相関係数:「回帰統計」中の「重相関R」(0.84) 有意確率:「分散分析表」の「有意F」(<0.001) 回帰式:一番下の表 「X値1(1.54)」と「切片(-25.62)」 𝑦=1.54𝑥−25.62
14
回帰分析の手順 理論値を作る場合 時系列の実測値のデータセットを用意 挿入 → 散布図 データ系列を右クリック → 近似曲線を追加
今回はふたつのデータセットで代用します 挿入 → 散布図 データ系列を右クリック → 近似曲線を追加 近似曲線の書式設定 「線形近似」を選択 「グラフに数式を表示する」をチェック 「グラフにR-2乗値を表示する」をチェック
15
重回帰分析 目的 原理 手順 目的のデータセット(理論値)を複数のデータセット(回帰式)で説明する 回帰分析と一緒です
同じ目的で、主成分分析も利用できます 手順 参考書で説明します
16
重回帰分析
17
チェックポイント・I 回帰分析の目的は? 回帰分析の原理は? 回帰分析の手順は? 重回帰分析とは?
18
本日の実習と課題 注目遺伝子とその隣の遺伝子について 回帰分析用のデータを使って、単回帰分析を行い、考察しなさい。
注目遺伝子のIDを書いてください。 237実験でのピアソン相関係数およびスピアマン相関係数を計算し、比較しなさい。 求めたピアソン相関係数の検定をしなさい。 回帰分析用のデータを使って、単回帰分析を行い、考察しなさい。
19
次回の予告 次回は講義の最終日です。 期末試験の概要を説明します。 2種類のエラーについて説明します。 次回のレポートは返しません。
質問に答えるのは、今日のレポートが最後になります。 期末試験の概要を説明します。 試験では、これまでの各自のレポートを参照してかまいません。 もう一度聞いておきたい内容があれば、今日のレポートに書いてください。
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.