データ分布の特徴 基準化変量 歪度 尖度
基準化変量(Standardization) 与えられたデータ に対して. で定義される変量を基準化変量という。
基準化変量の性質 Zはn個あるが、Zの平均値と標準偏差を求めると この基準化の意味はデータの平均値を0にし、そこからの散らばりを1にして、データの持っている他の特徴を調べる基礎を作ることが狙いである。
基準化の効果 データのバラツキ状況を絶対値1の中にある程度集中される。 異なる単位のデータに対して比較可能性を与える。 基準化変量Zに対して したがって、ΣZ=0より、|Z|が取りうる値の最大値がたかだか
歪度(Skewness) データの分布が左右対称かどうかを示す歪度は次の式で定義される。
左右対称分布の判断基準 歪度=0のとき、データが左右対称分布 歪度>0のとき、データが右に歪んだ分布 歪度<0のとき、データが左に歪んだ分布
尖度(Kurtosis) 基準化変量に基づいたデータ分布の峰が一つの場合、その分布の尖りを測る統計量が以下のように定義される。
データ分布の尖りの判断基準 尖度>3 鋭峰分布 尖度=3 正規分布 尖度<3 鈍峰分布
度数系列の歪度と尖度 歪度 尖度