プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治 金 尚弘
主成分分析の概要 主成分分析(PCA:Principal Component Analysis)は,多くの 変数を少数の変数(合成変数,主成分,潜在変数)で表現する ための方法である. x2 t1 x1
主成分分析の基本式 主成分行列 結合係数行列
第1主成分の求め方1 第1主成分得点ベクトル 第1主成分得点の分散 第1主成分得点の平均 共分散行列 (対称行列,非負定値行列)
第1主成分の求め方2 主成分得点の分散を最大化する 結合係数ベクトルのノルムは1
第1主成分の求め方3 ラグランジュ乗数法を使う ラグランジュ関数 最適解が満たす必要条件 固有値問題
第1主成分の求め方4 固有値問題の式の両辺に左からw1*Tを掛ける 上式左辺は第1主成分得点の分散(最適化問題の評価指標) 第1主成分得点の分散は共分散行列Vの固有値である. これを最大化したいので,w1*をVの最大固有値に対応する固 有ベクトルとする. ノルムを1とするために,単位固有ベクトルとする.
第r主成分の求め方1 主成分得点の分散を最大化する 結合係数ベクトルのノルムは1 第r-1番目までの結合係数ベクトルとwrは線形独立 新たな制約式
第r主成分の求め方2 ラグランジュ乗数法を使う ラグランジュ関数 最適解が満たす必要条件 新たな制約式の影響
第r主成分の求め方3 必要条件の式の両辺に左から を掛ける 必要条件の式は固有値問題になる
第r主成分の求め方4 固有値問題の式の両辺に左からwr*Tを掛ける 上式左辺は第r主成分得点の分散(最適化問題の評価指標) 第r主成分得点の分散は共分散行列Vの固有値である. これを最大化したいのが,r-1番目までに大きな固有値に対応 する固有ベクトルは利用されているため,制約条件を守るため に,wr*をVのr番目に大きな固有値に対応する固有ベクトル とする. ノルムを1とするために,単位固有ベクトルとする.
寄与率・累積寄与率 寄与率 累積寄与率