第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
確率・統計学の基礎 データの特性を表すパラメータとは? 2 つのデータの関係性を表す式の導出方法.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
1 統計学 第2週 10/01 (月) 担当:鈴木智也. 2 前回のポイント 「記述統計」と「推測統計」。 データ自体の規則性を記述するのが 「記述統計」、データを生み出した背 景を推測するのが「推測統計」である。 推測統計は記述統計に基づくので、ま ずは記述統計から学ぶ。 以下、データの観測値をX.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 データ分析入門( 8 ) 第 8 章 散布図と相関係数 廣野元久. 第 8 章 散布図と相関係数 廣野元久 &高橋行雄 2/28 本章の概要 2つの量的データのばらつき方を調べ, その関連 ( 相関関係 ) をグラフと数値で評価する 2変量間の相関関係には, 因果関係と擬似相関があるため, 関連を見誤らないように,
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
Example 8 種類のチーズの塩分量 : m = 325 Q 3 = 340 m Q 1 = Q3Q3Q3Q3 Q1Q1Q1Q1.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
―本日の講義― 1・相関関係と因果性・相関係数の種類 2.散布図をつくる 3・共分散・相関係数の計算
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第1章 記述統計の復習 統計学 2007年度.
第3章 2変量データの記述 統計学基礎 2010年度.
第1章 記述統計の復習 統計学 2011年度.
データ解析 静岡大学工学部 安藤和敏
相関係数 植物生態学研究室木村 一也.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
データモデリング 推薦のための集合知プログラミング.
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
分布の非正規性を利用した行動遺伝モデル開発
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
11.確率モデル 確率・・・不確実性の経済学や金融やファイナンス で重要 密度関数がある場合に期待値を取る計算を中心に、紹介.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
―本日の講義― 1・相関関係と因果性・相関係数の種類 2.散布図をつくる 3・共分散・相関係数の計算
貧困と出産の関係.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
統計学 第3回 10/11 担当:鈴木智也.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
データ分析入門(13) 第13章 主成分分析 廣野元久.
主成分分析                     結城  隆   .
1変量データの記述 経済データ解析 2006年度.
10. 積分 積分・・確率モデルと動学モデルで使われる この章は計算方法の紹介 積分の定義から
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
地理情報システム論演習 地理情報システム論演習
通信トラヒックの相関構造を利用した通信品質の劣化検出
ガウス過程による回帰 Gaussian Process Regression GPR
相関分析.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
コンピュータⅡJ (情報の分析と表現) 第7講  2009年11月11日 担当:岡田佳子.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
相関分析 2次元データと散布図 共分散 相関係数.
1変量データの記述 (度数分布表とヒストグラム)
プログラミング論 相関
重回帰分析入門 (第5章補足) 統計学 2007年度.
回帰分析入門 経済データ解析 2011年度.
統計現象 高嶋 隆一 6/26/2019.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係

3.1 二つの変数の関係 相関:2つの量的変数の間の関係 連関: 2つの質的変数の間の関係  相関:2つの量的変数の間の関係 (例)数学テストの点数が高い人ほど物理テストの点数も高い  連関: 2つの質的変数の間の関係 (例)洋食が好きな人には甘党が多く、和食が好きな人には辛党が多い

3.2 散布図 散布図:散布図とは,独立変数を横軸に,従属変数を縦軸にとって,二次元平面にデータ点をプロットしたもの

相関の考え方 相関関係:2個以上の変数が「かなりの程度増減をともにする関係」 正の相関:変数Xが大きいほど変数Yも大きくなる傾向 片方が増えると他方も増える 負の相関:変数Xが大きいほど変数Yは小さくなる傾向 片方が増えると他方が減る 無相関:変数Xの大小の変化と変数Yの大小の変化との間には関係がない

正の相関の散布図の例 「統計テスト1」と「統計テスト2」の散布図 例:(p.57) 統計テスト1= c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) 統計テスト2= c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) plot(統計テスト1,統計テスト2)

弱い相関の散布図の例 前の図と比較して より円に近いちらばり

無相関の散布図の例 全体的に円に近い

散布図では・・・ 散布図は、2変数の相関の様子を視覚的把握するという意味では有効である。しかし、変数がたくさんある場合は有効ではない。  散布図は、2変数の相関の様子を視覚的把握するという意味では有効である。しかし、変数がたくさんある場合は有効ではない。  そこで、相関の様子を散布図として表現するのではなく、  相関の「強さはこのくらいです」と一つの数値にして示す  ことが一般的  この場合の指標として相関係数がある。

3.3 共分散  

Rの練習(p60,61) > 共分散1と2=sum((統計テスト1-mean(統計テスト1))*(統計テスト2-mean(統計テスト2)))/length(統計テスト1) > 共分散1と2 [1] 7.55 > 共分散1と2=mean((統計テスト1-mean(統計テスト1))*(統計テスト2-mean(統計テスト2))) [1] 7.5 > cov(統計テスト1,統計テスト2) [1] 7.947368 > cov(統計テスト1,統計テスト2)*(length(統計テスト1)-1)/length(統計テスト1)

単位を変えると... 標準偏差を利用して測定単位の影響をうけない相関の指標、相関係数を求める > 身長m=c(1.5,1.6,1.7,1.8,1.9) > 身長m [1] 1.5 1.6 1.7 1.8 1.9 > 身長cm=身長m*100 > 身長cm [1] 150 160 170 180 190 > 体重=c(50,70,60,80,90) > 体重 [1] 50 70 60 80 90 > cov(身長m,体重) [1] 2.25 > cov(身長cm,体重) [1] 225 身長mと身長cmは単位をmとcmに変えただけ それなのに共分散が大きく変化している これはマズイ 標準偏差を利用して測定単位の影響をうけない相関の指標、相関係数を求める

3.4 相関係数 相関係数:二つの確率変数の間の相関(類似性の度合い)を示す統計学的指標 相関係数の式 3.4 相関係数 相関係数:二つの確率変数の間の相関(類似性の度合い)を示す統計学的指標 原則、単位は無く、-1 から 1 の間の実数値をとる 相関係数の式

Rの練習(p62,63) > cov(統計テスト1,統計テスト2)/(sd(統計テスト1)*sd(統計テスト2)) [1] 0.749659 > cor(統計テスト1,統計テスト2) > cor(心理学テスト,統計テスト1) [1] 0.3826645 > cor(心理学テスト,統計テスト2) [1] -0.09350516

相関係数 まとめ 無相関の場合、相関係数は0、 正の相関が強くなるにしたがって1に近づく。 相関係数の最大値は1である。 相関係数 まとめ 無相関の場合、相関係数は0、 正の相関が強くなるにしたがって1に近づく。 相関係数の最大値は1である。 1 に近いときは二つの変数には正の相関があるといい、-1 に近ければ負の相関があるという。 例:先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば比較的に -1 に近い数字になる。

表3.1 相関係数の大きさの評価 相関係数 大きさの評価 -0.2 ≤ r ≤ 0.2 ほとんど相関なし 弱い相関あり -0.4 ≤ r < -0.2 0.2 < r ≤ 0.4 弱い相関あり -0.7 ≤ r < -0.4 0.4 < r ≤ 0.7 中程度の相関あり -1.0 ≤ r< -0.7 0.7 < r ≤ 1.0 強い相関あり

3.5 クロス集計表 クロス集計表:質的変数同士の関係を見る 例: 数学の好き・嫌い(変数「数学」)と、 統計の好き・嫌い(変数「統計」) 3.5 クロス集計表 クロス集計表:質的変数同士の関係を見る  例: 数学の好き・嫌い(変数「数学」)と、      統計の好き・嫌い(変数「統計」) の間に連関があるかどうか

Rによるクロス集計表 統計 嫌い 好き 嫌い 10 4 好き 2 4 数学と統計のクロス集計表 数学 > 数学=c("嫌い","嫌い","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","嫌い","好き","嫌い","嫌い","好き","嫌い","嫌い","嫌い","嫌い") > 数学 [1] "嫌い" "嫌い" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "嫌い" "好き" "嫌い" [15] "嫌い" "好き" "嫌い" "嫌い" "嫌い" "嫌い" > table(数学) 数学 嫌い 好き 14 6 > 統計=c("好き","好き","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","好き","嫌い","好き","嫌い","嫌い","嫌い","嫌い","嫌い") > 統計 [1] "好き" "好き" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "好き" "嫌い" [15] "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" > table(統計) 統計 12 8 > table(数学,統計)        統計      嫌い 好き 嫌い    10 4 好き    2  4  数学と統計のクロス集計表 数学

3.6 ファイ係数 ファイ係数:相関係数の特別な場合 1と0からなる変数(二値変数)に対して計算される相関係数

Rによるファイ係数 > 数学イチゼロ=ifelse(数学=="好き",1,0) > 数学イチゼロ [1] 0 0 1 1 0 0 0 0 0 1 1 0 1 0 0 1 0 0 0 0 > 統計イチゼロ=ifelse(統計=="好き",1,0) > 統計イチゼロ [1] 1 1 1 1 0 0 0 0 0 0 1 1 1 0 1 0 0 0 0 0 > cor(数学イチゼロ,統計イチゼロ) [1] 0.3563483

本章で出てきた関数 目的 関数名と書式 使い方 散布図を描く plot(x,y) plot(統計テスト1,統計テスト2) 共分散を求める cov(x,y) cov(統計テスト1,統計テスト2) 相関係数を求める cor(x,y) cor(統計テスト1,統計テスト2) クロス集計表を描く table(x,y) table(数学,統計) 場合分けをする ifelse(条件、真の場合、偽の場合) ifelse(統計==“好き”,1,0)

練習問題 (1) > 勉強時間=c(1,3,10,12,6,3,8,4,1,5) > 勉強時間 [1] 1 3 10 12 6 3 8 4 1 5 > 定期試験=c(20,40,100,80,50,50,70,50,10,60) > 定期試験 [1] 20 40 100 80 50 50 70 50 10 60 plot(勉強時間,定期試験)

練習問題 (2) cor(勉強時間,定期試験) [1] 0.9092974 散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・  散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・  強い相関関係にあるといえる!!

練習問題 (3)クロス集計 洋食派か和食派か=c("洋食","和食","和食","洋食","和食","洋食","洋食","和食","洋食","洋食","和食","洋食","和食","洋食","和食","和食","洋食","洋食","和食","和食") > 洋食派か和食派か [1] "洋食" "和食" "和食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "和食" "洋食" "和食" "和食" "洋食" "洋食" "和食" "和食" > 甘党か辛党か=c("甘党","辛党","甘党","甘党","辛党","辛党","辛党","辛党","甘党","甘党","甘党","甘党","辛党","辛党","甘党","辛党","辛党","甘党","辛党","辛党") > 甘党か辛党か [1] "甘党" "辛党" "甘党" "甘党" "辛党" "辛党" "辛党" "辛党" "甘党" "甘党" "甘党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党" > table(洋食派か和食派か,甘党か辛党か) 甘党か辛党か 洋食派か和食派か 甘党 辛党 洋食 6 4 和食 3 7

練習問題 (4)ファイ係数 > 洋か和=ifelse(洋食派か和食派か=="洋食",1,0) > 洋か和 [1] 1 0 0 1 0 1 1 0 1 1 0 1 0 1 0 0 1 1 0 0 > 甘か辛=ifelse(甘党か辛党か=="甘党",1,0) > 甘か辛 [1] 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 > cor(洋か和,甘か辛) [1] 0.3015113