相関係数 植物生態学研究室木村 一也.

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
Example 8 種類のチーズの塩分量 : m = 325 Q 3 = 340 m Q 1 = Q3Q3Q3Q3 Q1Q1Q1Q1.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
―本日の講義― 1・相関関係と因果性・相関係数の種類 2.散布図をつくる 3・共分散・相関係数の計算
統計学入門 4-10章 チーム小樽 担当:いぬき.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
データ解析 静岡大学工学部 安藤和敏
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
応用言語学研究論A:SPSS宿題 Spring 2016 R.Nishida, Ph.D..
タレントの魅力測定とその分析.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
―本日の講義― 1・相関関係と因果性・相関係数の種類 2.散布図をつくる 3・共分散・相関係数の計算
回帰分析.
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
統計学 第3回 10/11 担当:鈴木智也.
統計学  第6回 西山.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
相関分析.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
最小自乗法.
中澤 港 統計学第4回 中澤 港
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
Black Litterman Modelによる最適化
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
相関分析 2次元データと散布図 共分散 相関係数.
数理統計学  第6回 西山.
プログラミング論 相関
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

相関係数 植物生態学研究室木村 一也

相関係数 相関係数とは、二つの確率変数の間の相関(類似性の度合い)を示す統計学的指標である。 計算によって求めるころができ、原則として単位は無く、-1 から 1 の間の実数値をとる。

r≦|0.2| ほとんど相関なし |0.2|<r≦|0.4| 弱い相関あり |0.4|<r≦|0.7| 中程度の相関あり    -1.0 -0.7 -0.4 -0.2 0.0 0.2 0.4 0.7 1.0

→Pearsonの相関係数 →Spearmanの相関係数 (順位相関係数)  また、この二つの確率変数が正規分布しているか、していないかで、算出の方法が異なる。 正規分布している →Pearsonの相関係数 正規分布していない(ノンパラメトリック) →Spearmanの相関係数          (順位相関係数)

√ ∑(xi-x)(yi-y) r = ∑(xi-x) ∑(yi-y) Pearsonの相関係数 2 2 ・ はそれぞれの平均を表す。 確率変数と、それぞれの平均との差をだして、二つをかけあわせた ・   はそれぞれの平均を表す。 ・ 分子・分母を表本数Nで割ると、それぞれ、共分散・標  準偏差を表す。

Spearmanの相関係数 6 1- ∑ (xi-yi) n(n -1) n 2 2 i=1   6 n(n -1) n 1- ∑ (xi-yi) 2 2 i=1 確率変数が順位に変わっただけで、Pearsonの相関係数の式の変形から求めることが出来る。 また、正規分布しないため、順位から求める。

例① ・ 身長と体重に相関はあるか。 身長・体重は正規分布しているので、Pearsonの相関係数の計算を用いる。 ・ 身長と体重に相関はあるか。 a b c d e f g h i j k l 身長 166 176 174 171 180 162 165 167 168 179 体重 56 62 68 59 72 52 55 58 75 74 身長・体重は正規分布しているので、Pearsonの相関係数の計算を用いる。 初めに、Rを用いて散布図を描く。

√ ∑(xi-x)(yi-y) r = ∑(xi-x)2 ∑(yi-y)2 の式で計算してみる。 散布図を見ると身長と体重は相関があることが予測される。 実際に N ∑(xi-x)(yi-y) r = i=1 √ N N ∑(xi-x)2 ∑(yi-y)2    の式で計算してみる。 i=1 i=1

身長の標準偏差‥18.59211 体重の標準偏差‥25.74231  共分散‥392.33 392.33 ÷(18.59211×25.74231)               = 0.8197452 身長と体重は強い相関があるという 結果となった。

Rを用いても同じ数値となり、身長と体重が強い相関があることが言える。 それぞれのデータ(身長(a)と体重(b))を打ち込んだ後に、 cor.test(a,b)で値を出すことが出来る。 Pearson's product-moment correlation data: a and b t = 4.5262, df = 10, p-value = 0.001098 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4642528 0.9477669 sample estimates: cor 0.8197452 Rを用いても同じ数値となり、身長と体重が強い相関があることが言える。

例② 高度差と気圧(hPa)の関係を調べる。 これは正規分布していないので、Spearmanの相関係数を用いる。 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 気圧(hPa) 1013 899 795 701 616 540 472 411 356 307 264 これは正規分布していないので、Spearmanの相関係数を用いる。 先ほどと同様、初めにRを用いて散布図を作成する。

6 1- ∑ (xi-yi) n(n -1) nに11を代入して計算すると、-1と値が出た。 (xi-yi)2 散布図より、相関があることが予想できる。   6 n(n -1) n 1- ∑ (xi-yi) 2 2 i=1 上の式で求めるために、高度・気圧それぞれの順位を決め、差の二乗を求める。 高度順位 11 10 9 8 7 6 5 4 3 2 1 気圧順位 (xi-yi)2 100 64 36 16 以上より、差の二乗の和は440と求めることが出来る。 nに11を代入して計算すると、-1と値が出た。

次にRを利用して答えを出す。 それぞれのデータ(height,pressure)を打ち込んだ後に、 cor.test(height,pressure,method=“spearman”)で値を出し事が出来る。 Spearman's rank correlation rho data: height and pressure S = 440, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to 0 sample estimates: rho -1 Rでも-1という値が出た。これはとてつもなく相関が強いことが言える。 実際に高度と気圧は比例するので、これは信頼性があると言っていいであろう。