EMアルゴリズム クラスタリングへの応用と最近の発展 1.はじめに 2.ファジィクラスタリング 2.1 K means法 2.2 ファジィクラスタリング 07/8/1 名雪 勲
EMアルゴリズムとは? アルゴリズムを構成しているステップ Expectationステップ Maximizationステップ 以上二つの頭文字を取ったものである。 今回はEMアルゴリズムと関連の深い、ファジィクラスタリングと絡めて説明していく。
K means法 この手法はクラスタリングで使われる単純な手法である。手順は以下の通り。 各データ点は最も近い代表点のクラスタに分類される。 こうして分類されたデータの中心を新たな中心点とし、収束するまでこの作業を繰り返す。
K means法の問題点 クラスタとクラスタの境界付近にある信頼性の低いデータも無理やり分類してしまうため、適切なクラスタリング結果が得られない場合がある。
ファジィクラスタリング K means法のクリスプな分割による誤差を修正するために、各データがどのクラスタに属しているかを「ファジィ化」して、個々のデータがどのクラスタに属しているかを1と0の間の連続値で表して代表点を決める手法。
ファジィクラスタリングのアルゴリズム 1.c個のクラスタの中心をランダムに設定する。 2.それぞれの固体の各クラスタへのメンバシップ値を求める。(メンバシップ値とは全てのクラスタに対する所属度) 3.クラスタごとに中心点を計算しなおす。 全てのクラスタの中心が収束すれば終了。 それ以外はステップ2へ戻る。
メンバシップ値についての補足 データ分割を行う際に、個体が所属するクラスタを唯一に与えるのではなく,メンバシップ値を用いて所属の度合いを表す。 例として二つのクラスタを「野球」と「サッカー」とする。 クリスプな分割では 必ずどちらかに所属しなければならない ファジィ分割では 「野球のみ」や「サッカーのみ」だけでなく,「野球:サッカー=7:3」といった表現が可能となり,データの持つ特徴をより的確に反映して分割が行われる. 参照 http://www.ie.osakafu-u.ac.jp/~honda/fcm.htm