画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts

Slides:



Advertisements
Similar presentations
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Advertisements

Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
コンピュータビジョン特論B - Graph Cuts - 永橋知行.
Building text features for object image classification
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
Pose Tracking from Natural Features on Mobile Phones
画像処理工学 2012年2月2日 担当教員 北川 輝彦.
画像処理論.
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
Pattern Recognition and Machine Learning 1.5 決定理論
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
時空間データからのオブジェクトベース知識発見
雑音重み推定と音声 GMMを用いた雑音除去
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
SURF: Speeded Up Robust Features
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第三回 演習課題 画像中からの物体抽出処理(色情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/08.
Yuri Y. Boykov Marie-Pierre Jolly
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
第11回   ディジタル画像(2) ディジタル画像処理(2)
領域ベースの隠れ変数を用いた画像領域分割
物体領域特徴の自動選定とマルチカーネル学習を用いた 特徴統合による一般物体認識
画像処理工学 2013年1月23日 担当教員 北川 輝彦.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
第14章 モデルの結合 修士2年 山川佳洋.
雑音環境下における 非負値行列因子分解を用いた声質変換
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
QRコードを用いたウェーブレット変換による 電子透かし
QRコードを用いたIDカードに 適した電子透かし
-画像処理(空間フィルタリング)- 画像処理(空間フィルタリング)のモデルとその基本操作 雑音除去・平滑化への適用
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
複数特徴量の重み付け統合による一般物体認識
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
マルチ識別器を用いた 花画像検索システムの構築
適応的近傍を持つ シミュレーテッドアニーリングの性能
名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ポッツスピン型隠れ変数による画像領域分割
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
領域ベースの隠れ変数を用いた決定論的画像領域分割
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
ランダムプロジェクションを用いた音響モデルの線形変換
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts 福田恵太・滝口哲也・有木康雄 (神戸大学)

研究目的 画像の認識,識別,検索,編集など 様々な画像処理技術の前処理 画像処理における重要な問題の一つに一枚の画像から対象と なる領域を抽出するセグメンテーションの問題がある. 画像の認識,識別,検索,編集など 様々な画像処理技術の前処理

近年,セグメンテーション問題をエネルギー最小化問題で解く手法が多く提案されている. 研究背景 近年,セグメンテーション問題をエネルギー最小化問題で解く手法が多く提案されている. ⇒その中でGraph Cutsという手法を用いる. Y.Boykov, M.P.Jolly,“Interactive graph cuts for optimal boundary & region segmentation of object in N-D images”, IEEE International Conference on Computer Vision and Pattern Recognition その利点は… エネルギー最小化問題を大域的な解で求めることが可能  Snakes, Level Set Methodでは境界線を元に局所解を求める 他のエネルギー最小法より性能がよい  Belief Propagation, Message Passing法との比較実験 容易なラベル付けで,与え方に依存しにくい

Graph Cuts O B t-link Object terminal S T O B n-link 物体らしさを表す 近傍の画素関係を表す O B グラフの作成 入力画像 (3×4) 背景らしさを表す S T O B min cut カット Background terminal t-link セグメンテーション S→Tへの重み総和が最小となるカット セグメンテーション結果

従来法の問題点 (1) t - link > n - link 色分布が強くなり,突発的な誤検出 n - link > t - link エッジ情報が強くなり,局所的なエッジに弱い 平滑化処理の繰り返しによるグラフカット   局所的なエッジ情報に頑健なセグメンテーションが可能 T. Nagahashi, H.Fujiyoshi, and T.Kanade,“ Image Segmentation Using Iterated Graph Cuts Based on Multi-scale Smoothing, ”ACCV2007

従来法の問題点 (2) 提案手法 物体及び背景が類似した色を持つ画像 色分布からのセグメンテーションが困難 局所テクスチャ特徴量を色分布と共に t - linkで扱う 色分布に依存せずセグメンテーションが可能 提案手法 Haar Wavelet変換に基づく多重解像度解析により平滑化と局所テクスチャ特徴の定義を並列に行い,グラフカットによるセグメンテーションを繰り返し行う.

Graph Cuts Segmentation 提案手法 LL,LH,HL,HH画像取得 Graph Cuts Segmentation 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 LL: 平滑化画像 LH,HL,HH:テクスチャ特徴 Haar Waveletによる多重解像度解析 (level k) seed 入力 出力 t-link n-link SeedとLevel kを与える. Level kまで多重解像度解析 平滑化画像をn-linkに使用 局所テクスチャ特徴を定義 5. 色+テクスチャをGMMに適用 6. 一段階前の結果から事前確率 7. Graph Cutsの処理を行う 8. k=0まで,2.~7.を繰り返す

多重解像度解析 LH1 HL1 HH1 LL1 多重解像度解析 画像データを特定の周波数帯域を持ついくつかの小さいサイズの画像データに分割する方法. Level 1 Level 2 LL:平滑化画像  HL:縦方向 LH:横方向 HH:斜め方向の変化量 Haar Wavelet 変換 (k=2の時) Level 0 Level 1 Level 2

Graph Cuts Segmentation LL,LH,HL,HH画像取得 Graph Cuts Segmentation 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 LL: 平滑化画像 LH,HL,HH:テクスチャ特徴 Haar Waveletによる多重解像度解析 (level k) seed 入力 出力 t-link n-link SeedとLevel kを与える. Level kまで多重解像度解析 平滑化画像をn-linkに使用 局所テクスチャ特徴を定義 5. 色+テクスチャをGMMに適用 6. 一段階前の結果から事前確率 7. Graph Cutsの処理を行う 8. k=0まで,2.~7.を繰り返す

n – linkの更新 n - link :近傍との輝度値を比較し,注目画素と近傍 とのエッジの重みを決定する LL:平滑化画像 (n-link) 低解像画像から徐々に解像度を上げることで,大域的から局所的なセグメンテーションを可能とする. 輝度値が類似しているほど高い値を持つ. Level 1 Level 0 p q

Graph Cuts Segmentation LL,LH,HL,HH画像取得 Graph Cuts Segmentation 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 LL: 平滑化画像 LH,HL,HH:テクスチャ特徴 Haar Waveletによる多重解像度解析 (level k) seed 入力 出力 t-link n-link SeedとLevel kを与える. Level kまで多重解像度解析 平滑化画像をn-linkに使用 局所テクスチャ特徴を定義 5. 色+テクスチャをGMMに適用 6. 一段階前の結果から事前確率 7. Graph Cutsの処理を行う 8. k=0まで,2.~7.を繰り返す

テクスチャの変化量が大きい領域ほど値が大きい 局所テクスチャ特徴量 HL,LH,HH:局所テクスチャ特徴を定義 注目画素p周辺 (3×3) のウェーブレット係数の絶対値平均 とする 元画像 LH (Level 1) HH (Level 1) HL (Level 1) テクスチャの変化量が大きい領域ほど値が大きい

Graph Cuts Segmentation LL,LH,HL,HH画像取得 Graph Cuts Segmentation 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 LL: 平滑化画像 LH,HL,HH:テクスチャ特徴 Haar Waveletによる多重解像度解析 (level k) seed 入力 出力 t-link n-link SeedとLevel kを与える. Level kまで多重解像度解析 平滑化画像をn-linkに使用 局所テクスチャ特徴を定義 5. 色+テクスチャをGMMに適用 6. 一段階前の結果から事前確率 7. Graph Cutsの処理を行う 8. k=0まで,2.~7.を繰り返す

t - linkの更新 (1) :色+テクスチャ特徴量 物体らしいほど  高い値をもつ 物体と背景の事後確率から,t-linkの重みを計算する S:”obj” T:”bkg” O B :色+テクスチャ特徴量 背景らしいほど  高い値をもつ

t - linkの更新 (2) 事前確率 (空間情報) 事後確率 O B 距離変換 T {p,T}間のt-linkへ使用 色 (RGB) テクスチャ特徴 をGMM T O B 距離変換 一つ前の物体領域 {p,T}間のt-linkへ使用 事前確率 (空間情報) 物体と背景の境界を0.5とし,境界からの距離を用いて,事前確率を定義する.

t - linkの更新 (3) 事前確率 (空間情報) 事後確率 S p 距離変換 {p,S}間のt-linkへ使用 色 (RGB) テクスチャ特徴 をGMM 距離変換 一つ前の背景領域 {p,S}間のt-linkへ使用 事前確率 (空間情報) 背景も同様に{p,S}間の全てのエッジに重みを与える.

Graph Cuts Segmentation LL,LH,HL,HH画像取得 Graph Cuts Segmentation 事前確率 GMM(色+テクスチャ)の更新 k ← k-1 LL: 平滑化画像 LH,HL,HH:テクスチャ特徴 Haar Waveletによる多重解像度解析 (level k) seed 入力 出力 t-link n-link SeedとLevel kを与える. Level kまで多重解像度解析 平滑化画像をn-linkに使用 局所テクスチャ特徴を定義 5. 色+テクスチャをGMMに適用 6. 一段階前の結果から事前確率 7. Graph Cutsの処理を行う 8. k=0まで,2.~7.を繰り返す

Graph Cuts Segmentation エッジに対する重み S T O B 以上のように全エッジに対して重みを与え, ※ min-cut / max-flowアルゴリズムにより,グラフのカットを行い,セグメンテーション画像を得る Yuri Boykov and Vladimir Kolmogorov, “An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Computer Vision”

実験条件 評価方法として, 従来手法(1) Graph Cuts 従来手法(2) 平滑化処理のみのGraph Cuts Berkley Image database(50枚)を使用 (HS画像あり) 多重解像度解析はLevel 3まで実行 以下の式から誤検出率err(%)を算出 物体を背景と誤検出 背景を物体と誤検出

実験結果(1) Err(%) 4.05 2.42 1.57 従来手法でも十分精度が出ている画像も含まれているため,精度差が大きくでていない. 従来手法(1) 従来手法(2) 提案手法 Err(%) 4.05 2.42 1.57 従来手法でも十分精度が出ている画像も含まれているため,精度差が大きくでていない. 従来手法でも誤検出率を約4%まで抑えている. 比較的誤検出率が高かった画像について

実験結果(2) 平滑化と事前確率による効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法 17.86% 4.42% 1.93% 9.96% 0.87% 0.57%

実験結果(3) テクスチャ特徴量による効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法 10.56% 7.45% 1.86% 11.26% 10.54% 4.77% 11.84% 16.64% 1.99%

実験結果(4) テクスチャ変化の度合いが異なる画像に対する効果 元画像+seed 従来手法(1) 従来手法(2) 提案手法

考察 突発的なノイズの除去:従来手法(2), 提案手法 事前確率 一つ前の処理結果から大まかな形情報を取得 平滑化処理  突発的なノイズの除去:従来手法(2), 提案手法  事前確率  一つ前の処理結果から大まかな形情報を取得  平滑化処理  局所的なエッジを乗り越えることが可能  色分布で区別が困難な画像:提案手法  テクスチャ変化の大きい画像  自然物画像などには効果が大きい.  テクスチャ変化の小さい画像  人工物画像などにはあまり効果がない.

まとめ 多重解像度解析により平滑化と局所テクスチャ特徴を用いた繰り返しによるGraph Cutsを提案した.  テクスチャ特徴と色特徴どちらが有効か画像ごとに違うためその差を考える.

ご静聴ありがとうございました.

Graph Cuts エネルギー関数を最小とするようなラベル f を求める手法. (エネルギー最小化問題) 活用例 領域に対するペナルティ 近傍に対するペナルティ 活用例 Image Segmentation Stereo Image Restoration Multi camera reconstruction などで注目されている ピクセルをノードとしたグラフを作成し,そのグラフの最小カットを 求めることで,物体と背景のセグメンテーションを行う.

処理時間について 画像サイズ:650×400 従来(1) 従来(2) 提案 10.92秒 62.96秒 87.22秒 画像サイズ:480×320 従来(1) 従来(2) 提案 8.04秒 36.77秒 55.43秒 Pentium® 4 CPU 3.20GHz

20 Min-cut 20 20 100 80 30 S T 60 20 10 S 20 20 T 残余ネットワーク(1) 10 10 10 50 50 40 20 20 Min cut 60 20 グラフの最小カットを求める S T 20 50 20 残余ネットワーク(2) 10 10 S 20 T 10 20 20 10 10 50 40 20 S 30 20 10 40 T 30 最大フロー(60) 10 10 20 最大フローと最小カットの値は等しい! 残余ネットワーク(3)

SからTへのコストが最も小さくなるようにカットする Min-cutの概念 S つながりが強いほどカットは通らない. T SからTへのコストが最も小さくなるようにカットする