データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数
例 158 160 162 164 164 168 170 220 8人の平均身長が170.75cmとなるが、 220という異常なデータを外したら 7人の平均身長は163.71cmとなる。
レンジ(Range) 与えられたデータから順序統計量 を作ったとき、その最大値と最小値の差として定義される。
四分位偏差(Quartile Deviation) 順序統計量の数列を四等分し、はじめから四分の一のところにある値をX(n/4);四分の三のところにある値をX(3n/4)とすれば、四分位偏差が 項数が奇数: 項数が偶数: 8人身長の例:Q=(168-160)/2=4
レンジと四分位偏差の限界 データの散らばりの度合いを表現するのに、たかだか2個ないし4個の観測値しか使われなく、すべての観測値をもちいていない。
平均偏差 平均偏差が平均絶対偏差とも呼ばれる。 その測度が数学的に扱いにくいなどの欠点がある。
分散(Variance)
標準偏差(Standard Deviation)
度数系列の分散の計算式
分散の性質 平均値の性質3より、つまり より は より は のとき最小値となる。分散(標準偏差)は平均値からの散らばりをみる自然な測度である。標準偏差が小さいほど、データは平均値の近くに集中して分布する。
分散の性質1
分散の性質2
分散の性質3 多くのデータでは、平均値から標準偏差の3倍以上離れた値を取ることはあまりない。 即ち、殆どのデータは区間 の中に入る。
変動係数(Coefficient of variation) 異なる母集団の代表値を比較するとき、 変動係数という相対的分散度でみることによって、適正な比較測定が可能となる。 変動係数の値が小さいほど、分散はせまい範囲に密であることを意味する。