Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション

Slides:



Advertisements
Similar presentations
画像処理 05A1027 後藤航太. 研究課題は openLDAP についてでしたが 今回から画像処理に変更しました。 変更した理由 自分が持っていたイメージと実際の openLDAP が違ったので変更を決 めま した。 画像処理に興味を持ったので これからは画像処理を研究課題として やっていきます。
Advertisements

生体情報を利用したオンライン認証システムに関する研 究 情報工学科 大山・山口・小尾研究室 学士課程4年田中 丈登.
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
コンピュータビジョン特論B - Graph Cuts - 永橋知行.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
Building text features for object image classification
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
Pose Tracking from Natural Features on Mobile Phones
画像処理論.
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
時空間データからのオブジェクトベース知識発見
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第三回 演習課題 画像中からの物体抽出処理(色情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/08.
Yuri Y. Boykov Marie-Pierre Jolly
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
第11回   ディジタル画像(2) ディジタル画像処理(2)
領域ベースの隠れ変数を用いた画像領域分割
物体領域特徴の自動選定とマルチカーネル学習を用いた 特徴統合による一般物体認識
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
QRコードを用いたウェーブレット変換による 電子透かし
予測に用いる数学 2004/05/07 ide.
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
QRコードを用いたIDカードに 適した電子透かし
-画像処理(空間フィルタリング)- 画像処理(空間フィルタリング)のモデルとその基本操作 雑音除去・平滑化への適用
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
複数特徴量の重み付け統合による一般物体認識
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
マルチ識別器を用いた 花画像検索システムの構築
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ポッツスピン型隠れ変数による画像領域分割
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
領域ベースの隠れ変数を用いた決定論的画像領域分割
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
プログラム依存グラフを用いた ソースコードのパターン違反検出法
Presentation transcript:

Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション 福田恵太,滝口哲也,有木康雄 (神戸大学) 電子情報通信学会 総合大会 2008

研究目的 画像の認識,識別,検索,編集など 様々な画像処理技術の前処理 画像処理における重要な問題の一つに一枚の画像から対象と なる領域を抽出するセグメンテーションの問題がある. 背景 物体 画像の認識,識別,検索,編集など 様々な画像処理技術の前処理

研究背景 近年,セグメンテーション問題をエネルギー最小問題で解く手法が多く提案されている. 動的輪郭モデル(Snakes), Level Set Method その中でGraph Cutsという手法を用いる. Y.Boykov, M.P.Jolly,“Interactive graph cuts for optimal boundary & region segmentation of object in N-D images”, IEEE International Conference on Computer Vision and Pattern Recognition 利点 領域と境界のエネルギー関数から大域解を求める 簡単なラベル付けからのセグメンテーションが可

Graph Cuts O B 物体らしいほど大きな値 近傍画素が類似しているほど大きな値 S:”obj” t-link グラフの作成 O T:”bkg” O B t-link グラフの作成 n-link 入力画像 (3×4) t-link カット 背景らしいほど大きな値 S T O B min cut セグメンテーション S→Tへのコスト総和が最小となるカット セグメンテーション結果

従来手法の問題点(1) 局所的なエッジに弱い 平滑化処理の繰り返しによるグラフカット 局所的なエッジ情報に頑健なセグメンテーションが可能   局所的なエッジ情報に頑健なセグメンテーションが可能 T. Nagahashi, H.Fujiyoshi, and T.Kanade,“ Image Segmentation Using Iterated Graph Cuts Based on Multi-scale Smoothing, ”ACCV2007 エッジの強いところでノイズが生じる

多重解像度解析により平滑化と局所テクスチャ特徴の定義を並列に行い,繰り返しグラフカットによるセグメンテーションを行う. 従来手法の問題点(2) 物体及び背景が類似した色を持つ画像 局所テクスチャ特徴量を色分布と共に t - linkで扱う 色分布に依存せずセグメンテーションが可能 色が類似しているため区別できない 多重解像度解析により平滑化と局所テクスチャ特徴の定義を並列に行い,繰り返しグラフカットによるセグメンテーションを行う.

Graph Cuts Segmentation 提案手法の流れ seed LL: 平滑化画像 Haar Waveletによる多重解像度解析 (level k) LL,LH,HL,HH画像取得 Graph Cuts Segmentation 入力 出力 n-link t-link LH,HL,HH:テクスチャ特徴 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 高周波からテクスチャを定義し,色特徴と共に学習 全てのエッジにコストを与えたので,グラフカットを実行 抽出結果を元に再学習と解像度レベルを前の段階に戻す 初期値kまで多重解像度を行い,各周波数画像を得る 低周波数画像をn-linkに用いることで平滑化

HL:縦方向 LH:横方向 HH:斜め方向の変化量 多重解像度解析 LL2 HL2 多重解像度解析 画像データを特定の周波数帯域を持ついくつかの小さいサイズの画像データに分割する方法. LL1 HL1 HL1 LH2 HH2 LH1 HH1 LH1 HH1 Haar Wavelet 変換 (k=2の時) Level 0 Level 1 Level 2 LL:平滑化画像 HL:縦方向 LH:横方向 HH:斜め方向の変化量 n-link に使用 t-link に使用

n-link n-linkのコスト LL:平滑化画像 (n-link) 低解像画像から徐々に解像度を上げることで,大域的から局所的なセグメンテーションを可能とする. T. Nagahashi [ACCV2007] Level 1 Level 0 近接が類似しているほど高い値を持つ. n-linkのコスト p q

局所テクスチャ特徴量 注目画素p周辺 (3×3) のウェーブレット係数の絶対値平均 とする 物体背景それぞれの色+テクスチャ特徴量を学習し, HL,LH,HH:局所テクスチャ特徴を定義 注目画素p周辺 (3×3) のウェーブレット係数の絶対値平均 とする 元画像 LH (Level 1) HH (Level 1) HL (Level 1) 物体背景それぞれの色+テクスチャ特徴量を学習し, t-linkのエッジに与えるコストを計算する.

t-link 事前確率 (空間情報) t-linkのコスト (事後確率) O B 距離変換 T:”bkg” 背景らしいほど 高い値をもつ 色 (RGB) テクスチャ特徴 をGMM T:”bkg” O B 距離変換 背景らしいほど  高い値をもつ 事前確率 (空間情報) {p,T}間のt-linkへ使用 物体と背景の境界を0.5とし,境界からの距離を用いて,事前確率を定義する. 背景も同様に

セグメンテーション S エッジに対するコスト O B T 以上のように全エッジに対してコストを与え, min-cut / max-flowアルゴリズムにより,グラフのカットを行い,セグメンテーション画像を得る

実験条件 評価方法として, 従来手法(1) Graph Cuts 従来手法(2) 平滑化処理のみのGraph Cuts Berkley Image database(50枚)を使用 (HS画像あり) 多重解像度解析はLevel 3まで実行 以下の式から誤検出率err(%)を算出 物体を背景と誤検出 背景を物体と誤検出

比較的誤検出率が高かった画像について考察 実験結果 各手法のエラー率(%) 解像度レベル k 従来手法(1) 従来手法(2) 提案手法 1 4.48 3.67 3.18 2 2.89 2.68 3 2.90 1.57 比較的誤検出率が高かった画像について考察

実験結果 ( 2 ) 平滑化と事前確率による効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法 17.86% 4.42% 1.93% 9.96% 0.87% 0.57%

実験結果 ( 3 ) テクスチャ特徴量による効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法 10.56% 7.45% 1.86% 11.84% 16.64% 1.99%

実験結果 ( 4 ) テクスチャ変化の度合いが異なる画像に対する効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法

まとめと考察 多重解像度解析により平滑化と局所テクスチャ特徴を用いた繰り返しによるGraph Cutsを提案した.  テクスチャ特徴と色特徴どちらが有効か画像ごとに違うためその差を考える.

御静聴ありがとうございました

処理時間について 画像サイズ:650×400 従来(1) 従来(2) 提案 10.92秒 62.96秒 87.22秒 画像サイズ:480×320 従来(1) 従来(2) 提案 8.04秒 36.77秒 55.43秒 Pentium® 4 CPU 3.20GHz

SからTへのエッジが最も小さくなるようにカットする min cut max flow アルゴリズム S つながりが強いほどカットは通らない. T min cut T S SからTへのエッジが最も小さくなるようにカットする

花弁領域抽出の自動化にGraph Cuts 応用目的 花弁領域抽出の自動化にGraph Cuts