第10回　パターン認識.

第10回　パターン認識

画像認識の概念物体認識(object recognition): 画像中に映っている認識対象の種別、位置、姿勢を同定すること
　画像認識の概念物体認識(object recognition): 画像中に映っている認識対象の種別、位置、姿勢を同定すること分類(classification):パターン認識予め与えられたカテゴリーのどれに該当するかを同定すること　　　～　文字認識、音声認識

パターン認識 v.s. ３Ｄ物体認識パターン認識３Ｄ物体認識・人工物，自然物が対象・記号（文字，音声，・）が対象・個人性が変形要因
・検出と認識は独立化可能３Ｄ物体認識・人工物，自然物が対象・視点変化による形状変化が変形要因・検出と認識は不可分

パターン認識における特徴抽出 ←幾何学的 ←統計的

パターンのベクトル表現 f1 f2 fR = = f1 f2 ・ fR =　　f

メジャー：距離か、角度か？距離で測ると濃度の違いは大きい角度で測ると濃度の違いは小さい角度で測る（Ss = cos2θ ：単純類似度）
d θ

同じパターンとは？濃度が違うパターンは違うと見るのか？濃度が違っても同じと見たい（濃度＝ノルム）

白黒の反転は同じか？濃度の変化を無視するなら、白黒の反転も同じとみるべき

パターンの分布超楕円錐形反対側もある（白黒反転）

同じパターンとは？背景が違うパターンは違うと見るのか？背景が違っても同じと見たい（背景＝ＤＣ成分）

正準化とその意義オール灰色パターンの直交補空間に射影オール灰色は意味がない＝０であって欲しいオール灰色ボケボケ０に近づく
不変ボケボケ

部分空間法分布を部分空間で近似部分空間の中を同じと見なす

部分空間法.vs. 単純類似度分布を部分空間で近似ｖｓ代表元（単純類似度） φ1 φ2：正規直交基底ベクトル
分布を部分空間で近似ｖｓ　代表元（単純類似度） cos2θ　= { ( f, φ1 )2+( f, φ2 )2 } / || f ||2 φ1 φ2：正規直交基底ベクトル　 θ f φ1 φ2 ←　各クラスに属するパターンの自己相関行列Ｒの固有ベクトル CLAFIC法（渡辺慧，１９６９）：ＫＬ展開により部分空間を作成

部分空間法未知入力パターン・ベクトルｐと辞書パターン・部分空間Qの成す角度θ1を類似度として識別を行う
N　：　 N次元の辞書部分空間Qを張る基底ベクトルの数 (p,qi) : 入力ベクトルpと辞書部分空間 Qの第i基底ベクトルqiとの内績

Karhunen-Loeveの展開（ＫＬ）法：
共分散行列を対角化する行列で変換することにより無相関化 Principal Component Analysis （主成分分析）と同値 K. Karhunen （1946） M. Loeve （1948） H. Hotelling （1933）パターン認識での再発見飯島泰蔵（1963）　　「視覚パターンの基礎方程式」渡辺慧（1965）　「醜いアヒルの子の定理」Ｅ．Oja(1983) Subspace Method(部分空間法)

複合類似度法複合類似度法の導出：部分空間法の変形～類似度計算過程において，固有値による重み付加 fα
複合類似度法の導出：部分空間法の変形　～類似度計算過程において，　　固有値による重み付加　 { ( f, φ1 )2+λ2/λ1( f, φ2 )2 } / || f ||2 カテゴリ l に属するパターン集合を {fα} とするパターン f のカテゴリ l に対する平均類似度 Sm(l) [f] =Σαwα(l) (f, fα)2 / {|| f ||2 ||fα||2} =Σm=1M λm(l) (f, φm(l))2 / {λ1(l)|| f ||2} λm(l)、 φm(l) は行列 K(l) の固有値と固有ベクトル K(l) = Σαwα(l) <fα, fα> / ||fα|| = Σm=1M λm(l) < φm(l), φm(l) > 上記 Sm(l) [f] の変分を 0 とする極値として求まる fα

醜いアヒルの子の定理（渡辺慧，1969）「醜いアヒルの子と普通のアヒルの子とは、似通った２羽のアヒルの子が似ているのと同じ程度に似ている」　～　２つのものの類似性をある基準（例えば、共に真である記述の個数）で測ると、どの２つの類似性も等しい　～　特徴選択を行っただけでは、　対象を複数のクラスに分類することはできない．　　特徴に重要性（重み）を付加することが、パターン認識における特徴選択の本質

大犬太部分空間法のバリエーション複合類似度法混合類似度法（大、犬、太を区別したい）
Sm(l)[f] =Σm=1M am(l)( f, φm(l) )2 / || f ||2 混合類似度法（大、犬、太を区別したい） Sc(l)[f] =Σm=1M am(l)( f, φm (l) )2 / || f || Σn=1N bm(l)( f, ψn (l) )2 / || f ||2 大犬太

部分空間法のバリエーション：軌跡単純類似度、複合類似度、混合類似度
( f, φ1 )2 、 ( f, φ1 )2 + ( f, φ2 )2 、 ( f, φ1 )2 - ( f, φ2 )2 　が　一定の軌跡　と　ノルム || f || f φ2 φ2 φ1 φ2 φ1 f f φ1

部分空間法の拡張相互部分空間法日立の特許辞書・入力両方とも部分空間辞書を部分空間にしないで入力を部分空間
辞書・入力　両方とも部分空間文字認識手法として提案，顔認識手法として普及

相互部分空間法 Ss(l)[f] = λmax λmax は行列 X の最大固有値 X = (xij), xij = Σm=1M ( ψi ,φm(l)) ( φm(l) ,ψj ) φm(l) は辞書の部分空間の基底、 ψi　は f から作られる部分空間の基底 λmax = 1 λnext = cos2θ θ

相互部分空間法入力側がベクトルである部分空間法と比べ、パターン変動に対する吸収能力を更に高めた手法
未知入力パターン・部分空間Pと辞書パターン・部分空間Qの成す最小角度θ1に基づいて識別を行う θ1 　：　第１正準角(最小正準角） 2つの部分空間の成す角度は統計学に　　　おいて正準角と呼ばれ、M次元部分空間PとN次元部分空間Q（M≧N）の間にはN個の　正準角が定義できる入力側がベクトルである部分空間法と比べ、　　　　　パターン変動に対する吸収能力を更に高めた手法

制約相互部分空間法相互部分空間法では識別に貢献しない成分（照明等による影響）まで含めて識別を行う
福井和広,山口修“一般化差分部分空間に基づく制約相互部分空間法”,信学論D‐Ⅱ,Vol.87-D-2,No.8,pp (2004-8) 相互部分空間法では識別に貢献しない成分（照明等による影響）まで含めて識別を行う識別に有効な成分から構成される制約部分空間への射影を相互部分空間法に付加した方法

本当に部分空間法で良いのか？バナナ分布入江文平氏が発見

ノーフリーランチ定理「あらゆる問題で性能の良い汎用最適化戦略は理論上不可能であり，ある戦略が他の戦略より性能がよいのは、現に解こうとしている特定の問題に対して特殊化（専門化）されている場合のみである．」　～　問題領域の知識を可能な限り使用して　　最適化すべき．

顔画像処理による対話型コミュニケーションの研究
知能情報工学講座西　奈津子

目的障害者・高齢者(寝たきり・聾唖者）の社会参加の機会が増大日常会話が困難な障害者・高齢者とのコミュニケーションシステムの開発
顔画像処理(口部パターン認識)による対話型コミュニケーションシステムのプロトタイプ開発基盤研究(C)(2)「分散視覚エージェントの統合に基づく親和的情報空間の展開」の一環として実施

従来のアプローチ筋萎縮性側索硬化症（ALS)を対象
（１）身体装着センサ方式によるメニュー選択伝の心(日立ケーイーシステムズ社）・はなしっ子（センサ社）（２）脳血液量変化検出方式による選択重度ALS患者用Yes/No検出装置（日立製作所) （３）表情の変化を使用したスイッチ代行方式伝の心(日立ケーイーシステムズ社）視線を用いた文字入力装置国立身体障害者リハビリテーションセンター研究所･福祉機器開発部

相互部分空間法を用いた口部パターンの認識
口部パターン認識の提案手法相互部分空間法を用いた口部パターンの認識 4種類の口部パターンの各々の辞書パターンと　　未知入力パターンを部分空間で表現し、2つの　　　部分空間のなす最小角度を尺度として識別を行う

日常会話の階層化あいさつ飲食関係訴え他の要望各階層を４つのグループに分割おはようこんにちはこんばんはありがとう
飲み物が欲しいお腹が空いたお菓子が欲しい何も食べたく　ないあいさつ飲食関係訴え他の要望トイレに行きたいあついさむいいたい外へ行きたいテレビが見たい音楽が聴きたい眠りたい

口部形状パターンの割り当てと明度ヒストグラムの対応
“口を開ける” “歯を見せる” あいさつ飲食関係訴え他の要望 “舌を出す” “口をつぼめる”

明度分布の特徴部分を用いた口部パターン認識（B4・M1）
2つの領域の面積のみを使用相互部分空間法を用いた口部パターン認識（M2） 0～255間の全ての明度値を使用して部分空間を作成画像明度分布全体を使用して部分空間を作成することにより、個人差による画像明度分布の違いに対するロバスト性が期待できる

結果確認のための口部処理１．口部分の形状を維持２．口部分の形状を変化ｔｔｔ＋１ｔ＋１ヒストグラム変化量（Hｔ）＜ TH1
255　　　明度ヒストグラム変化量（Hｔ）＜ TH1 ヒストグラム変化量（Hｔ）＞＝ TH1 一定時間継続選択結果は正しい選択結果が間違っている

実験結果

共通の辞書部分空間を作成した場合の認識率
認識結果の比較共通の辞書部分空間を作成した場合の認識率口部　　　　　パターン口を　　　開ける歯を　　　見せる口を　　　つぼめる舌を　　　出す平均相互部分　　空間法 78.0% 74.5% 82.0% 73.7% 部分空間法 63.2%　 53.3%　 52.6%　 49.2% 54.6%　特徴部分のみを用いた手法 57.2% 65.1% 63.1% 66.4% 手法 77.1% 80.2%

個別の辞書部分空間を作成した場合の認識率
被験者A 口を　開ける歯を　見せる口をつぼめる舌を　出す平均相互部分空間法 89.7% 86.2% 93.5% 97.7% 91.8% 被験者B 口を　開ける歯を　見せる口をつぼめる舌を　出す平均相互部分空間法 100% 90% 97.5%

個別の辞書部分空間を作成した場合の認識率
被験者A 被験者B 口部　　　　　パターン口を　　　開ける歯を　　　見せる口を　　　つぼめる舌を　　　出す平均共通辞書 78.0% 74.5% 82.0% 73.7% 77.1% 個別辞書(被験者A) 89.7%　 86.2%　 93.5%　 97.7% 個別辞書(被験者B) 100% 90.0% 辞書　　　部分空間 91.8% 97.5% 個別辞書作成時間　：　1つの口部形状につき，約1sec

障害者による認識実験被験者 7名（男性4名，女性3名年齢38歳～64歳）・鹿児島市身体障害者施設・誠光園入居者
被験者　7名（男性4名，女性3名　年齢38歳～64歳）・鹿児島市　身体障害者施設・誠光園　入居者・障害等級　1級～2級・障害名　　脳卒中による身体の部分的な機能全廃・機能障害　　脳性小児麻痺　　頚椎先天奇形による機能障害

障害者による実験結果

障害を持つ被験者に対し個別の辞書部分空間を作成した場合の認識率
口を　開ける歯を　見せる口をつぼめる舌を　出す平均相互部分空間法 81.0% 86.3% 79.1% 78.8% 81.3%

第10回　パターン認識.

Similar presentations

Presentation on theme: "第10回　パターン認識."— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

第10回 パターン認識.

Similar presentations

Presentation on theme: "第10回 パターン認識."— Presentation transcript:

Similar presentations

About project

フィードバック

第10回　パターン認識.

Presentation on theme: "第10回　パターン認識."— Presentation transcript: