相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

確率・統計学の基礎 データの特性を表すパラメータとは? 2 つのデータの関係性を表す式の導出方法.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
EXCEL 講習会 2014 年 5 月 1 日,2 日 OSIPP NWC ① 11 : 00 ~ 12 : 00 ② 13 : 00 ~ 14 : 00 1 政策データ分析.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
Example 8 種類のチーズの塩分量 : m = 325 Q 3 = 340 m Q 1 = Q3Q3Q3Q3 Q1Q1Q1Q1.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
林俊克&廣野元久「多変量データの活用術」:海文堂
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
Excelによる統計分析のための ワークシート開発
第3章 2変量データの記述 統計学基礎 2010年度.
重回帰分析入門 経済データ解析 2009年度.
一次関数と方程式 本時の流れ ねらい「二元一次方程式をグラフに表すことができる。」 ↓ 課題の提示 yについて解き、グラフをかく
相関係数 植物生態学研究室木村 一也.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
重回帰分析入門 経済データ解析 2011年度.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう.
母分散が既知あるいは大標本の 平均に関する統計的検定
第5章 回帰分析入門 統計学 2006年度.
データ分析入門(13) 第13章 主成分分析 廣野元久.
対応のあるデータの時のt検定 重さの測定値(g) 例:
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
需要の価格弾力性 価格の変化率と需要の変化率の比.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
相関分析.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
ミクロ経済学第9回 企業と費用2:費用最小化.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
回帰分析(Regression Analysis)
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
相関分析 2次元データと散布図 共分散 相関係数.
数理統計学  第6回 西山.
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
プログラミング論 相関
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
データ分布の特徴 基準化変量 歪度 尖度.
回帰分析入門 経済データ解析 2011年度.
2つの変量間の関係を知る 1.水稲の収量に関連のある生育指標を知りたい 2.トマトの糖度は施肥量によってどのように変化するかを知りたい
Presentation transcript:

相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長 プリント「生物統計学_第12回相関分析2013年」P5以降を予習しながら空所を埋めていきましょう. 2つの変量(x,y)の関係について,x, yともに正規分布にしたがってばらつく量であるときには両者の直線的な関係を相関といいます.一方, xについては指定できる変数(独立変数という)であり, yが指定されたxに対して,あるばらつきを含んで決まる場合,回帰といいます. 相関では両変数間の関連の度合いを相関係数で評価することを主な目的とします. 回帰では両変数間の関係を相関係数で評価することもできますが,主たる目的は両変数間の数的関係を回帰直線で表し,ある xが指定されたときにy がいくつになるかを求めることです.

相関と回帰:回帰分析 xが指定できる変量であり,yが指定されたxに対して,正規分布して決定される場合,両変数の関係を回帰分析する. 例:施肥量と水稲の収量 相関と回帰の例を考えます. 兄弟の身長について考えます.兄の身長と弟の身長それぞればらつきのある変数であり,兄の身長を指定しても,そのことで弟の身長が決まるとは考えられません.したがって,兄弟の身長は相関です.しかし,父と子の身長を考えると,遺伝的な要因から父の身長は子の身長に影響を及ぼしていると考えられます.父の身長を指定するとあるばらつきを持って,子の身長が決まると考えられます.父と子の身長は回帰分析できます.一方,父と子の身長はともに正規分布するので相関分析もできます.次に食事で得た蛋白質の量と身長の関係を考えましょう.蛋白質の量を決めればあるばらつきを持って身長が決まるから,回帰分析できます.この場合は蛋白質の量は指定でき,正規分布しない(つまり誤差はありえない)ので,相関分析は不適当です. 直線関係:単回帰分析

相関か回帰か? 最高気温と最低気温 相関 身長と体重 飼料中の脂肪含量と牛の乳脂肪率 テレビを見る時間と血圧 回帰 テレビを見る時間とエンゲル係数 それでは予習問題をやってみましょう.以下の2つの変量の関係は相関とみた方がよいでしょうか,あるいは回帰とみた方がよいでしょうか.あるいは相関とも回帰とも見なせるでしょうか? 最高気温と最低気温 身長と体重 飼料中の脂肪含量と牛の乳脂肪率 テレビを見る時間と血圧 テレビを見る時間とエンゲル係数 塩分摂取量と血圧  予習は「生物統計学第11回宿題と第12回のための予習2013 」の提出用タブ欄問3に入力して提出してください. 塩分摂取量と血圧

相関 2つの変数間の直線的な相関関係は相関係数rによって定量的に表すことができる. 相関係数rの性質 1.-1≦r≦1である. 相関係数について考えます. 2つの変数間の直線的な関係(相関関係)は相関係数 によって定量的に示すことができます. 相関係数rには以下の性質があります. ①  -1≦r≦+1です. ②  rが1に近いほど正の相関が強く,-1に近いほど負の相関が強いです. ③ rが0に近いときは,両変数間には相関がない(無相関)を意味します. 3.rが0に近いときは,両変数の間には相関がない(無相関)

異なる相関係数を持つ例 r=0.5 r=0.9 正の相関 r=-0.5 r=-0.9 相関がない 負の相関 相関係数がどのくらいのときにはどのような散布図になるかを示したのが,画面のグラフです. いちばん左は両変数間に相関がないときです.このときは横軸が増えても,縦軸は増えるわけでも減るわけでもありません. 一方,正の相関があるとき,つまり右2つの上側のグラフでは,横軸が増えると縦軸は増える傾向があります.そして,相関係数が大きいいちばん右上のグラフではより強い正の相関関係があり,かなり直線性がはっきりしていることがわかります. 一方,負の相関があるときは横軸が増えると,縦軸は減る関係にあります.そして,負の相関のときはマイナス1に近づくほど,直線的関係がより強くなっていることがわかります. つまり相関係数とは+1に近いほど右上がりの直線性が強く表れ,-1に近いほど右下がりの直線性が強く現れます.0に近いときは右上がりでも右下がりでもありません. 相関がない 負の相関

直線的な関係しか検出しない 相関係数は2変数の間に直線的な関係があるかだけを評価する. なお相関係数は2変数の間に直線的な関係があるかどうかだけを評価します.したがって,2次曲線のような関係があっても相関係数rはほとんど0かもしれません.相関係数だけで2変数の関係を評価してはいけません.相関係数を調べるときは最初にグラフをかならず書きましょう. 2次曲線のような関係があってもrはほとんど0かもしれない

エクセルによる相関係数の計算 関数による方法 それでは相関係数の計算方法を説明します.エクセルでは関数を使って相関係数を計算できます.あるいは分析ツールでも計算できます.相関係数を計算する関数は=correl(変量Aの範囲,変量Bの範囲)です.correlは英語の相関correlationの略です.

エクセルによる相関係数の計算 分析ツールによる方法 相関表 もう一つの方法が分析ツール(データ分析)を使う方法です.データ分析から相関を選択し,入力範囲を指定すると関数のときとは異なり,入力範囲になるデータについて,総当たりで相関係数を計算し,相関表を作ります.先頭行をラベルにしておくと相関表がわかりやすくなります.画面の右下にあるのが相関表です.

相関表の計算 相関表は画面のようにたくさんのデータについて相関を一度に計算するときに便利です.画面のデータは世界の各地における毎月の平均気温です. 1月の気温と2月の気温の相関係数,1月と3月,というようにすべての組み合わせについて相関係数を計算してみましょう.

相関係数の計算(練習) エクセルの分析ツールの相関を使って,画面のような相関表を得ました.1月と2月の気温の相関係数は表から0.99575とわかります.1月と1月の気温の相関は1に決まっているので,表で1というデータは同じデータ同士の組み合わせであるところです.

予習問題 10品種のアズキの種子について,長径,幅径,厚径,粒重を測定した結果が以下のデータである. 相関表を作れ. それでは予習問題をやってみましょう. 10品種のアズキの種子について,長径,幅径,厚径,粒重を測定した結果が画面のデータです.相関表を作りなさい. 予習は「生物統計学第11回宿題と第12回のための予習2013 」の提出用タブ欄問4に入力して提出してください.