グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識 IS1-46 グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識 堀 貴博・滝口哲也・有木康雄(神戸大学) 研究背景と目的 一般物体認識とは コンピュータビジョンの分野で最も難しいタスクの一つ 制約のないシーンで物体を一般的な名称で認識する 画像検索やロボットビジョンへの応用が期待されている 従来手法:Bag-of-Features [G.Csurka, 2004]を用いた一般物体認識 利点: 局所的特徴の集合で画像を特徴付けるので,見え方の変化や閉塞に頑健 欠点: 画像全体を対象とするため位置情報や局所的特徴間の関係性が失われる クラスタリングにより局所特徴量の出現頻度ヒストグラムに変換 解決法 特徴点間を線で接続し,グラフ構造によって画像を表現する グラフは統計処理を行うのが困難なので,ベクトル表現への変換を行う 認識 umbrella ・・・・ Codebook Frequency 認識 cup SIFT keypoints Bag of Features 入力画像 認識結果 提案手法 提案システムの流れ グラフ構造表現 [J.Revaud, 2010] グラフ-ベクトル変換 グラフ化 Training Graph Training Graph 特徴抽出 Training Graph グラフ化 Training Graph SIFT グラフ編集距離 識別器 認識結果 近接グラフ トレーニング グラフから 選択する スケールの小さいノード,関係性の薄いノードとは接続しないことによって,不必要なエッジを作成しない Training Graph Training Graph ・ ・ ・ Prototype Graph グラフ編集距離 擬似階層グラフ 学習画像 グラフ化 スケール の大きさで グラフを 階層に分解 特徴抽出 Test Graph SIFT テスト画像 階層レベル1 階層レベル2 階層レベル3 Input SIFT keypoints Graph Vector Classifier Output グラフ編集距離 グラフ-ベクトル変換 編集コスト Graph Edit Distance [A.Sanfeliu, 1983] 1つのグラフを他のグラフに変換する のに必要である最小の編集数によって, 2つのグラフの距離を定義する ベクトル空間へのグラフの埋め込み [K.Riesen, 2007] ノード挿入 : 1 エッジ挿入 : 2 入力画像 プロトタイプグラフ n個 エッジ削除 : 1 ・ ・ ・ ・ ノード置換 : 1 n次元ベクトル空間 グラフ抽出 グラフ編集距離 によるベクトル化 ベクトル空間 埋め込み グラフ編集距離 評価実験 認識結果の例 提案手法で正しく認識され,従来手法で正しく認識されなかったテスト画像の例 データセット: Caltech101(10クラス,841枚) 識別器: k-NN法(k=10),マルチクラスSVM (線形カーネル(linear),非線形カーネル(RBF)) 各クラス学習画像30枚,それ以外をテスト画像 提案手法: 300次元ベクトルを作成 従来手法: BoFのVisual wordsの数: 1000単語 各クラスの認識率 (SVM (RBF)) まとめ・今後の課題 画像をグラフ構造で表現し,グラフ-ベクトル変換を用いることで認識率が向上した グラフ編集距離の計算時間の短縮