みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
春の計量経済学勉強会 第1回:2016年2月23日(火) 市野泰和. 研究! ・ ・ ・研究?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
Excelによる統計分析のための ワークシート開発
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
検定 P.137.
重回帰分析入門 経済データ解析 2009年度.
データ解析 静岡大学工学部 安藤和敏
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
実証分析の手順 経済データ解析 2011年度.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
重回帰分析入門 経済データ解析 2011年度.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
統計リテラシー育成のための数学の指導方法に関する実践的研究
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
社会統計学Ic・統計科学I 第六回 ~仮説検証~
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
疫学概論 横断研究 Lesson 11. 記述疫学 §A. 横断研究 S.Harano,MD,PhD,MPH.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
「糖尿病」ってどんな病気?? ★キーワードは・・・「インスリン」!!!
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
第3章補足2 多変量データの記述 統計学基礎 2010年度.
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
プログラミング論 相関
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
回帰分析入門 経済データ解析 2011年度.
2つの変量間の関係を知る 1.水稲の収量に関連のある生育指標を知りたい 2.トマトの糖度は施肥量によってどのように変化するかを知りたい
Presentation transcript:

みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある. みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある. 1.時系列データ 1955年から1970年におけるテレビの販売数と自動車事故の数 1930年から1970年におけるタバコの消費本数と平均寿命 以上のことを調べるとどういう結果が得られるか? プリント「生物統計学_第12回相関分析2013年」P13以降を予習しながら空所を埋めていきましょう. 相関係数が高いからといって,両者の間に因果関係などが必ずあるとは限りません.例えば,年齢を問わずに調査したら,血圧と垂直飛びに負の相関関係があるかもしれません.しかし,加齢とともに血圧は上がり,運動能力は落ちますから,この関係は見かけのものでしかありません.あるいはテレビの普及率と米の消費量を1960年代について調べたら,負の相関があるでしょう.しかし,テレビを見るとご飯を食べなくなるというものではないでしょう.一般に時間の絡むデータでは見かけの相関関係の出てくることがよくあります. 例えば,1955年から1970年におけるテレビの販売数と自動車事故の数 あるいは1930年から1970年におけるタバコの消費本数と平均寿命 の関係を考えてみましょう.以上のことを調べるとどういう結果が得られるでしょうか? その結果から,どういう誤った結論が引き出せるでしょうか? 予習は「生物統計学第11回宿題と第12回のための予習2013 」の提出用タブ欄問7に入力して提出してください. その結果から,どういう誤った結論を引き出せるか?

みかけの相関関係 2:その他 2.年齢などに関わるデータ 血圧と原宿で遊ぶ時間(巣鴨でもいいが) 3.その他 みかけの相関関係 2:その他 2.年齢などに関わるデータ 血圧と原宿で遊ぶ時間(巣鴨でもいいが) 3.その他 小学1~6年までの身長と体重の相関係数は同年代だけのよりかなり大きくなる ほかにもみかけの相関が出てくる例として,血圧と原宿で遊ぶ時間を調べてもよいでしょう.若者が多く集まる原宿に長くいればいるほど血圧が低くなるという結果がでても,原宿がパワースポットで血圧が下がる効果があるということにはなりません. それ以外に小学1~6年までの身長と体重の相関係数は同年代だけの相関係数よりかなり大きくなることが知られています.標本のとり方次第で相関係数がかなり変わってくるのです.

相関分析の手順 1.2つの変量間の相関係数を計算する 2.ρ=0という帰無仮説を検定し,相関関係が有意であるかを調べる 注意点 2つの変量間に実際にはどんな結びつきがあるのかを相関分析の後,考えていくことになる 3.有意であれば,相関の強さを相関係数の大きさから評価する. 相関があっても,それは2つの変量間に必ずしも何らかの関係があるということを証明するわけではない 2.ρ=0という帰無仮説を検定し,相関関係が有意であるかを調べる 相関分析の手順をまとめます. ① 2つの変量間の相関係数 を計算します. ② ρ=0という帰無仮説を検定し,相関関係が有意であるかを調べます. ③ 有意であれば,相関の強さを相関係数の大きさから評価します.相関があっても,それは2つの変量間に必ずしも何らかの関係があることを証明するわけではありません. 注意点:2つの変量間に実際にどんな結びつきがあるのかを相関分析の後,考えます.

どんな関係があるのか? 1.直接的な因果関係が予想される場合 喫煙本数と肺ガン 2.間接的な関係が予想される場合 間接的な因果関係のあるとき A X B 宍道湖周辺の人口と汚染度 生活排水 相関係数が有意であった場合,まず考えるのは両変数間に直接的な因果関係があるというものでしょう. 例えば喫煙本数と肺がんには直接的な因果関係があると考えられています. しかし,みかけの相関関係がある場合もありますし,間接的に両変数が関係している場合もよくあります. 例えば,宍道湖周辺の人口と汚染度には相関関係があるかもしれません.それは人口が多いと生活排水が増加し,その結果,汚染が増えているということです.つまり人口をA,生活排水をX,汚染度をBとするとAとBの相関関係はXを間に挟んだ関係であるといえます. あるいは第3の要因が関与することもあります.肺がんと心筋梗塞には相関関係があるとしましょう.どちらも喫煙で増加します.つまり肺がんをA,心筋梗塞をBとするとどちらも喫煙Xと因果関係があるので,喫煙Xを共有する原因として,相関関係が現れたということになります. 第3の要因が関与する場合 X A B 肺ガンと心筋梗塞