わかりやすいパターン認識 第7章:部分空間法 7.1 部分空間法の基本 7.2 CLAFIC法 6月13日(金) 大城 亜里沙
部分空間法の基本 前章 特徴空間を線形変換することにより特 徴選択を行う方法。後段に識別機を設 けることにより認識系が構成される。 前章 特徴空間を線形変換することにより特 徴選択を行う方法。後段に識別機を設 けることにより認識系が構成される。 本章 特徴選択と識別を分離することなく、特 徴空間の線形変換そのものを利用して 識別する手法。 部分空間法
部分空間法(subspace method) 部分空間法とは,各クラスごとにそのクラスを表現する低次元の部分空間を用意し、未知パターンがどの部分空間で最もよく近似表現できるかを比較することにより未知パターンを識別する手法。 (部分空間は,学習パターンからKL展開などに より各クラスごとに独立に求める。)
CLAFIC法 (CLAss-Featuring Information Compression) CLAFIC法では、クラスごとにKL展開により部分空間を作成し、この部分空間を用いて未知パターンを識別する。特徴ベクトルがクラスごとに異なる低次元部分空間で近似できるとすれば、CLAFIC法により入力パターンが識別できるわけである。
次元特徴空間から 次元部分空間への変換 ー :クラス に着目し、 次元特徴空間から 次元部分 空間への変換を表す行列 正規直交性より 次元特徴空間から 次元部分空間への変換 ー :クラス に着目し、 次元特徴空間から 次元部分 空間への変換を表す行列 正規直交性より が成り立つ。
元の空間から部分空間への変換 元の空間から部分空間 への変換は直交射影行列 によって表すことができる。 が成り立つ。 元の空間から部分空間 への変換は直交射影行列 によって表すことができる。 が成り立つ。 次元特徴ベクトル を元の 次元空間でみると となる。
の部分空間 への正射影 の部分空間 への正射影は であり、 その長さの二乗 は この長さは未知ベクトル とクラス との類似度とみなす の部分空間 への正射影 の部分空間 への正射影は であり、 その長さの二乗 は この長さは未知ベクトル とクラス との類似度とみなす ことができる。
類似度 ー :類似度 この類似度を用いると、識別規則は次式のように表される。 特徴ベクトルは最大の射影成分を持つ 類似度 ー :類似度 この類似度を用いると、識別規則は次式のように表される。 特徴ベクトルは最大の射影成分を持つ 部分空間のクラスに識別される。 式(2.3) 識別関数 と比較することにより、式(7.11)の が識別関数として使えること がわかる。
部分空間法の計算 実際の部分空間法の計算は射影行列を使うよりかは正規直交ベクトルを利用するほうが効率的に行うことができる。 式(7.8)は この値が最大となるクラスに識別することになる。
各クラスの次元設定 部分空間法において、各クラスの次元をどのように設定するかは重要な問題!! 自己相関行列 の(大きい順に並べたときの)固有値 は、 が 大きくなるに従って徐々にゼロに近づくので、部分空間の次元を適当な 値で打ち切ってもよい。 ― 次元をあまり低くすると、各クラスを表現できる近似精度は低下する。 ― 次元をあまり高くすると、クラス間で部分空間同士の重なりが増加し 識別力が低下する。 最適な次元数は実験に頼るしかない。
最適な次元数 クラス ごとに異なる次元数 で打ち切って最適な次元数を 求める場合 を決定する一つの方法に累積寄与率を用いる方法があり クラス ごとに異なる次元数 で打ち切って最適な次元数を 求める場合 を決定する一つの方法に累積寄与率を用いる方法があり すべてのクラスに対して共通なパラメータ を選んで となる次元数 を各クラスごとに選択する手法である。
リジェクトの導入法(1) 未知ベクトルがどのクラスにも属さないと判定しなくてはならない場合がある。 この判定をリジェクトと呼ぶ。 未知ベクトルがどのクラスにも属さないと判定しなくてはならない場合がある。 この判定をリジェクトと呼ぶ。 式(7.11)ではリジェクト判定がないのでリジェクトを導入することを考 える。 ノルムで正規化したベクトル をすべての部分空間へ射影し、その長さの最大値 があるしきい値よりも小さいときにリジェクトと判定する方法。
リジェクトの導入法(2) 2クラス問題の場合では,もし ならば、 は に属すると判定し ならば、 は に属すると判定し ならば、 は に属すると判定し、それ以外ならばリジェクトするとい う方法。 ( :忠実度(fidelity value) と呼ぶ。)