主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど より低い次元で表現できるようにする。 データがばらついている方向ほど 多くの情報を含んでいると考える。 相関係数(分散と共分散)を元に計算する。
[テーマ] 講義の構成 主成分分析のイメージ 主成分の導出 Rでの計算 まとめ
主成分分析のイメージ
主成分分析とは
主成分分析とは
主成分分析とは
主成分分析とは
主成分分析とは
主成分の導出
主成分分析の導出 中心化 標準化
主成分分析の導出 中心化(または、標準化)
主成分分析の導出 中心化(または、標準化)
主成分分析の導出
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(2)
主成分分析の導出(2)
主成分分析の導出(2)
主成分分析の導出(2) + N (または N - 1 )で割る 中心化した場合
主成分分析の導出(2) + N (または N - 1 )で割る 標準化した場合
ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで が最大となるような を求める ,
ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで が最大となるような を求める , ラグランジュの未定乗数法
ラグランジュの未定乗数法 中心化されたデータの場合 で偏微分 という条件のもとで が最大となるような を求める , ラグランジュの未定乗数法
ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法
ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 分散共分散行列の 固有値,固有ベクトルを求める
ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 分散共分散行列の 固有値,固有ベクトルを求める
ラグランジュの未定乗数法 標準化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 相関行列の 固有値,固有ベクトルを求める
固有値と寄与率 中心化後のデータの場合 標準化後のデータの場合
固有値と寄与率 中心化後のデータの場合 ・値の大きい固有値 から順に考える。 ・値の大きい固有値に 対応した軸(主成分) を順に 対応した軸(主成分) を順に 第1主成分、第2主成分 という。 ・固有ベクトルが 互いに直交する。 標準化後のデータの場合
主成分分析の導出(寄与率,累積寄与率) 一般(r 次元) 中心化後のデータの場合 寄与率 累積寄与率 , 中心化後のデータの場合 寄与率 累積寄与率 , 分散共分散行列の固有値・固有ベクトル
主成分分析の導出(寄与率,累積寄与率) 一般(r 次元) 標準化後のデータの場合 寄与率 累積寄与率 , 相関行列の固有値・固有ベクトル
主成分分析のまとめ 一般(r 次元) 中心化後のデータの場合 累積寄与率 m 個の固有値・固有ベクトルを計算し , を求める。
主成分分析のまとめ 一般(r 次元) 標準化後のデータの場合 累積寄与率 m 個の固有値・固有ベクトルを計算し , を求める。
Rでのシミュレーション
Rによる主成分分析の計算 > w1 <- read.table (“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))
データについて 標準化後 体格データ
Rによる主成分分析の計算 > w1 <- read.table(“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))
Rによる主成分分析の計算 > w1 <- read.table(“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))
まとめ
まとめ 主成分分析のイメージ データのばらつき,主成分 主成分の導出 中心化,標準化 分散, 共分散,相関係数 固有値,固有ベクトル,寄与率
補足1 r次元(中心化後)の場合 r個 r(r - 1)個