相関分析 2次元データと散布図 共分散 相関係数
2次元データ 身長と体重、生産と投資、収入と貯蓄などの二つの現象の間に非確実な照応関係が存在するが、この2変数x、yを観測して、2組のデータを得るとき、そのデータを2次元データという。 2次元のデータをn個の点 として、図式すると、x と y の関係がはっきりする。
散布図(Scatter-gram,正の関係)
散布図(負の相関関係)
無相関の例
Xの分散とYの分散 変数 と変数 のそれぞれの分散が次のように定義される。
共分散(Covariance) と について で定義される を と の共分散 といい、Cov(x, y)と書く。
Xとyの変動と共分散の符号 Xとyの増減変化の方向が一致であれば、 の値がプラスになり、xとyが正の相関関係が存在する。 の値がプラスになり、xとyが正の相関関係が存在する。 Xとyの増減変化の方向が逆であれば、 の値がマイナスになり、xとyが負の相関関係をもつ。
相関係数 相関係数は次式で定義される。
相関係数の性質 相関係数 は共分散 と同じ符号をもち、常に の範囲にある。 =1ならば、すべての観測値が正の傾きを持つ 同一直線上に並ぶ。 相関係数 は共分散 と同じ符号をもち、常に の範囲にある。 =1ならば、すべての観測値が正の傾きを持つ 同一直線上に並ぶ。 =-1ならば、すべての観測値が負の傾きを持つ 同一直線上に並ぶ。 は0に近ければ、XとYの間に相関はない。
相関係数の計算式
順位相関係数 2つの変数を質的基準によって順位づけて、 2変数の質的基準による順位相関関係を示す指標。 2変数の質的基準による順位相関関係を示す指標。 は2変数の質的基準による順位における差の平方和を意味する。