Presentation is loading. Please wait.

Presentation is loading. Please wait.

第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.

Similar presentations


Presentation on theme: "第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係."— Presentation transcript:

1 第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係

2 3.1 二つの変数の関係 相関:2つの量的変数の間の関係 連関: 2つの質的変数の間の関係
 相関:2つの量的変数の間の関係 (例)数学テストの点数が高い人ほど物理テストの点数も高い  連関: 2つの質的変数の間の関係 (例)洋食が好きな人には甘党が多く、和食が好きな人には辛党が多い

3 3.2 散布図 散布図:散布図とは,独立変数を横軸に,従属変数を縦軸にとって,二次元平面にデータ点をプロットしたもの

4 相関の考え方 相関関係:2個以上の変数が「かなりの程度増減をともにする関係」 正の相関:変数Xが大きいほど変数Yも大きくなる傾向
片方が増えると他方も増える 負の相関:変数Xが大きいほど変数Yは小さくなる傾向 片方が増えると他方が減る 無相関:変数Xの大小の変化と変数Yの大小の変化との間には関係がない

5 正の相関の散布図の例 「統計テスト1」と「統計テスト2」の散布図 例:(p.57)
統計テスト1= c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) 統計テスト2= c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) plot(統計テスト1,統計テスト2)

6 弱い相関の散布図の例 前の図と比較して より円に近いちらばり

7 無相関の散布図の例 全体的に円に近い

8 散布図では・・・ 散布図は、2変数の相関の様子を視覚的把握するという意味では有効である。しかし、変数がたくさんある場合は有効ではない。
 散布図は、2変数の相関の様子を視覚的把握するという意味では有効である。しかし、変数がたくさんある場合は有効ではない。  そこで、相関の様子を散布図として表現するのではなく、  相関の「強さはこのくらいです」と一つの数値にして示す  ことが一般的  この場合の指標として相関係数がある。

9 3.3 共分散

10 Rの練習(p60,61) > 共分散1と2=sum((統計テスト1-mean(統計テスト1))*(統計テスト2-mean(統計テスト2)))/length(統計テスト1) > 共分散1と2 [1] 7.55 > 共分散1と2=mean((統計テスト1-mean(統計テスト1))*(統計テスト2-mean(統計テスト2))) [1] 7.5 > cov(統計テスト1,統計テスト2) [1] > cov(統計テスト1,統計テスト2)*(length(統計テスト1)-1)/length(統計テスト1)

11 単位を変えると... 標準偏差を利用して測定単位の影響をうけない相関の指標、相関係数を求める
> 身長m=c(1.5,1.6,1.7,1.8,1.9) > 身長m [1] > 身長cm=身長m*100 > 身長cm [1] > 体重=c(50,70,60,80,90) > 体重 [1] > cov(身長m,体重) [1] 2.25 > cov(身長cm,体重) [1] 225 身長mと身長cmは単位をmとcmに変えただけ それなのに共分散が大きく変化している これはマズイ 標準偏差を利用して測定単位の影響をうけない相関の指標、相関係数を求める

12 3.4 相関係数 相関係数:二つの確率変数の間の相関(類似性の度合い)を示す統計学的指標 相関係数の式
3.4 相関係数 相関係数:二つの確率変数の間の相関(類似性の度合い)を示す統計学的指標 原則、単位は無く、-1 から 1 の間の実数値をとる 相関係数の式

13 Rの練習(p62,63) > cov(統計テスト1,統計テスト2)/(sd(統計テスト1)*sd(統計テスト2))
[1] > cor(統計テスト1,統計テスト2) > cor(心理学テスト,統計テスト1) [1] > cor(心理学テスト,統計テスト2) [1]

14 相関係数 まとめ 無相関の場合、相関係数は0、 正の相関が強くなるにしたがって1に近づく。 相関係数の最大値は1である。
相関係数 まとめ 無相関の場合、相関係数は0、 正の相関が強くなるにしたがって1に近づく。 相関係数の最大値は1である。 1 に近いときは二つの変数には正の相関があるといい、-1 に近ければ負の相関があるという。 例:先進諸国の失業率と実質経済成長率は強い負の相関関係にあり、相関係数を求めれば比較的に -1 に近い数字になる。

15 表3.1 相関係数の大きさの評価 相関係数 大きさの評価 -0.2 ≤ r ≤ 0.2 ほとんど相関なし 弱い相関あり
-0.4 ≤ r < < r ≤ 0.4 弱い相関あり -0.7 ≤ r < < r ≤ 0.7 中程度の相関あり -1.0 ≤ r< < r ≤ 1.0 強い相関あり

16 3.5 クロス集計表 クロス集計表:質的変数同士の関係を見る 例: 数学の好き・嫌い(変数「数学」)と、 統計の好き・嫌い(変数「統計」)
3.5 クロス集計表 クロス集計表:質的変数同士の関係を見る  例: 数学の好き・嫌い(変数「数学」)と、      統計の好き・嫌い(変数「統計」) の間に連関があるかどうか

17 Rによるクロス集計表 統計 嫌い 好き 嫌い 10 4 好き 2 4 数学と統計のクロス集計表 数学
> 数学=c("嫌い","嫌い","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","嫌い","好き","嫌い","嫌い","好き","嫌い","嫌い","嫌い","嫌い") > 数学 [1] "嫌い" "嫌い" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "嫌い" "好き" "嫌い" [15] "嫌い" "好き" "嫌い" "嫌い" "嫌い" "嫌い" > table(数学) 数学 嫌い 好き 14 6 > 統計=c("好き","好き","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","好き","嫌い","好き","嫌い","嫌い","嫌い","嫌い","嫌い") > 統計 [1] "好き" "好き" "好き" "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" "好き" "好き" "好き" "嫌い" [15] "好き" "嫌い" "嫌い" "嫌い" "嫌い" "嫌い" > table(統計) 統計 12 8 > table(数学,統計)        統計      嫌い 好き 嫌い    好き    2  4  数学と統計のクロス集計表 数学

18 3.6 ファイ係数 ファイ係数:相関係数の特別な場合 1と0からなる変数(二値変数)に対して計算される相関係数

19 Rによるファイ係数 > 数学イチゼロ=ifelse(数学=="好き",1,0) > 数学イチゼロ [1] > 統計イチゼロ=ifelse(統計=="好き",1,0) > 統計イチゼロ [1] > cor(数学イチゼロ,統計イチゼロ) [1]

20 本章で出てきた関数 目的 関数名と書式 使い方 散布図を描く plot(x,y) plot(統計テスト1,統計テスト2) 共分散を求める
cov(x,y) cov(統計テスト1,統計テスト2) 相関係数を求める cor(x,y) cor(統計テスト1,統計テスト2) クロス集計表を描く table(x,y) table(数学,統計) 場合分けをする ifelse(条件、真の場合、偽の場合) ifelse(統計==“好き”,1,0)

21 練習問題 (1) > 勉強時間=c(1,3,10,12,6,3,8,4,1,5) > 勉強時間
[1] > 定期試験=c(20,40,100,80,50,50,70,50,10,60) > 定期試験 [1] plot(勉強時間,定期試験)

22 練習問題 (2) cor(勉強時間,定期試験) [1] 0.9092974 散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・
 散布図と(2)の結果より勉強時間と定期試験の相関係数は・・・  強い相関関係にあるといえる!!

23 練習問題 (3)クロス集計 洋食派か和食派か=c("洋食","和食","和食","洋食","和食","洋食","洋食","和食","洋食","洋食","和食","洋食","和食","洋食","和食","和食","洋食","洋食","和食","和食") > 洋食派か和食派か [1] "洋食" "和食" "和食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "洋食" "和食" "洋食" "和食" "洋食" "和食" "和食" "洋食" "洋食" "和食" "和食" > 甘党か辛党か=c("甘党","辛党","甘党","甘党","辛党","辛党","辛党","辛党","甘党","甘党","甘党","甘党","辛党","辛党","甘党","辛党","辛党","甘党","辛党","辛党") > 甘党か辛党か [1] "甘党" "辛党" "甘党" "甘党" "辛党" "辛党" "辛党" "辛党" "甘党" "甘党" "甘党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党" "甘党" "辛党" "辛党" > table(洋食派か和食派か,甘党か辛党か) 甘党か辛党か 洋食派か和食派か 甘党 辛党 洋食 6 4 和食 3 7

24 練習問題 (4)ファイ係数 > 洋か和=ifelse(洋食派か和食派か=="洋食",1,0) > 洋か和
[1] > 甘か辛=ifelse(甘党か辛党か=="甘党",1,0) > 甘か辛 [1] > cor(洋か和,甘か辛) [1]


Download ppt "第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係."

Similar presentations


Ads by Google