グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識

Slides:



Advertisements
Similar presentations
果物識別 補足資料 1. やりたい事  入力された画像内に映っている果物が何かを自動判 別するプログラムを組むこと 識別器 りんご です.
Advertisements

CV-Reading Describing Objects by their Attributes 山内悠嗣.
顔表情クラスタリングによる 映像コンテンツへのタギング
BRIEF: Binary Robust Independent Elementary Features
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
Building text features for object image classification
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
Pose Tracking from Natural Features on Mobile Phones
芦田尚美*,髙田雅美*,木目沢司†,城和貴* *奈良女子大学大学院 †国立国会図書館
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
雑音重み推定と音声 GMMを用いた雑音除去
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
テキストの類似度計算
ランダムプロジェクションを用いた 音声特徴量変換
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
Buried Markov Modelを用いた 構音障害者の音声認識の検討
非負値行列因子分解による 構音障害者の声質変換
サポートベクターマシン によるパターン認識
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
大域的特徴としてBoFを導入した CRFによる一般物体認識
決定木とランダムフォレスト 和田 俊和.
視点移動カメラにおけるカメラキャリブレーション
物体領域特徴の自動選定とマルチカーネル学習を用いた 特徴統合による一般物体認識
音高による音色変化に着目した音源同定に関する研究
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
Specmurtを利用した調波構造行列による 混合楽音解析の検討
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
Data Clustering: A Review
複数特徴量の重み付け統合による一般物体認識
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
非負値行列因子分解に基づく唇動画像からの音声生成
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
設計情報の再利用を目的とした UML図の自動推薦ツール
モデル作成にクラスタリングを用いた視線認識
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響特徴量を用いた自閉症児と定型発達児の識別
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
Webページタイプによるクラスタ リングを用いた検索支援システム
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
市松模様を使用した カメラキャリブレーション
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識 IS1-46 グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識 堀 貴博・滝口哲也・有木康雄(神戸大学) 研究背景と目的 一般物体認識とは コンピュータビジョンの分野で最も難しいタスクの一つ 制約のないシーンで物体を一般的な名称で認識する 画像検索やロボットビジョンへの応用が期待されている 従来手法:Bag-of-Features [G.Csurka, 2004]を用いた一般物体認識 利点: 局所的特徴の集合で画像を特徴付けるので,見え方の変化や閉塞に頑健 欠点: 画像全体を対象とするため位置情報や局所的特徴間の関係性が失われる クラスタリングにより局所特徴量の出現頻度ヒストグラムに変換 解決法 特徴点間を線で接続し,グラフ構造によって画像を表現する グラフは統計処理を行うのが困難なので,ベクトル表現への変換を行う 認識 umbrella ・・・・ Codebook Frequency 認識 cup SIFT keypoints Bag of Features 入力画像 認識結果 提案手法 提案システムの流れ グラフ構造表現 [J.Revaud, 2010] グラフ-ベクトル変換 グラフ化 Training Graph Training Graph 特徴抽出 Training Graph グラフ化 Training Graph SIFT グラフ編集距離 識別器 認識結果 近接グラフ トレーニング グラフから 選択する スケールの小さいノード,関係性の薄いノードとは接続しないことによって,不必要なエッジを作成しない Training Graph Training Graph ・ ・ ・ Prototype Graph グラフ編集距離 擬似階層グラフ 学習画像 グラフ化 スケール の大きさで グラフを 階層に分解 特徴抽出 Test Graph SIFT テスト画像 階層レベル1 階層レベル2   階層レベル3 Input SIFT keypoints Graph Vector Classifier Output グラフ編集距離 グラフ-ベクトル変換 編集コスト Graph Edit Distance [A.Sanfeliu, 1983] 1つのグラフを他のグラフに変換する のに必要である最小の編集数によって, 2つのグラフの距離を定義する ベクトル空間へのグラフの埋め込み [K.Riesen, 2007] ノード挿入 : 1 エッジ挿入 : 2 入力画像 プロトタイプグラフ n個 エッジ削除 : 1 ・ ・ ・ ・ ノード置換 : 1 n次元ベクトル空間 グラフ抽出 グラフ編集距離 によるベクトル化 ベクトル空間  埋め込み グラフ編集距離 評価実験 認識結果の例 提案手法で正しく認識され,従来手法で正しく認識されなかったテスト画像の例 データセット: Caltech101(10クラス,841枚) 識別器: k-NN法(k=10),マルチクラスSVM (線形カーネル(linear),非線形カーネル(RBF)) 各クラス学習画像30枚,それ以外をテスト画像 提案手法: 300次元ベクトルを作成 従来手法: BoFのVisual wordsの数: 1000単語 各クラスの認識率 (SVM (RBF)) まとめ・今後の課題 画像をグラフ構造で表現し,グラフ-ベクトル変換を用いることで認識率が向上した グラフ編集距離の計算時間の短縮