領域ベースの隠れ変数を用いた決定論的画像領域分割

Slides:



Advertisements
Similar presentations
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Advertisements

Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
ソーラス符号の パーシャルアニーリング 三好 誠司 上江洌 達也 岡田 真人 神戸高専 奈良女子大 東大,理研
コンピュータビジョン特論B - Graph Cuts - 永橋知行.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
Pattern Recognition and Machine Learning 1.5 決定理論
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
ベイズ的ロジスティックモデル に関する研究
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
Yuri Y. Boykov Marie-Pierre Jolly
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
背 景 多数の「スピン」とそれらの「相互作用」という二種類の変数を有する系の解析においては,相互作用の方は固定されておりスピンだけが 変化するモデルを考える場合が多い.   (例:連想記憶モデル) 「スピン」よりもゆっくりと「相互作用」も変化するモデル(パーシャルアニーリング)の性質は興味深い.
第11回   ディジタル画像(2) ディジタル画像処理(2)
領域ベースの隠れ変数を用いた画像領域分割
第9章 混合モデルとEM 修士2年 北川直樹.
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
P3-12 教師が真の教師のまわりをまわる場合のオンライン学習 三好 誠司(P)(神戸高専) 岡田 真人(東大,理研,さきがけ)
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
第14章 モデルの結合 修士2年 山川佳洋.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
ガウシアン確率伝搬法の 近似精度に対する理論解析
名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
確率的画像処理アルゴリズム入門 東北大学 大学院情報科学研究科 田中 和之
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
人工知能特論II 第8回 二宮 崇.
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ポッツスピン型隠れ変数による画像領域分割
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
自己縮小画像と混合ガウス分布モデルを用いた超解像
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
混合ガウスモデル Gaussian Mixture Model GMM
教師がコミティマシンの場合のアンサンブル学習 三好 誠司(神戸高専) 原 一之(都立高専) 岡田 真人(東大,理研,さきがけ)
Presentation transcript:

領域ベースの隠れ変数を用いた決定論的画像領域分割 P039 領域ベースの隠れ変数を用いた決定論的画像領域分割 三好 誠司    岡田 真人  関西大     東大,理研

あらまし マルコフ確率場(MRF)とベイズ推定に基づく画像処理においてエッジを保存・再現するためには隠れ変数の導入が効果的である.領域ベースのポッツスピン型隠れ変数を導入したうえで,原画像も隠れ変数として,変分推論法により画像修復と領域分割を行うアルゴリズムを導出する.ガウス雑音が重畳した人工画像を用いた実験により,このアルゴリズムが有効であり頑健であることを明らかにする.

背 景 1 多数の変数とその変数間の無向性相互作用からなる系はマルコフ確率場(MRF)と呼ばれ,画像の確率モデルとして広く利用されている. 背 景 1 多数の変数とその変数間の無向性相互作用からなる系はマルコフ確率場(MRF)と呼ばれ,画像の確率モデルとして広く利用されている. MRFに基づく画像処理においては,ベイズの定理で計算される事後分布を用いる推定(=ベイズ推定)がよく用いられるが,計算量的困難に直面することが多い. MRFとベイズ推定に基づいた画像処理を行う場合,画像の事前分布を素朴なガウス分布とすると画像中のエッジの表現が難しい. エッジを表現するためには事前分布に隠れ変数を導入することが有効.

背 景 2 隠れ変数には境界ベースと領域ベースがある. 境界ベースは画素と画素の間に,そこがエッジであるかどうかを表す隠れ変数を置いてゆく. 背 景 2 隠れ変数には境界ベースと領域ベースがある. 境界ベースは画素と画素の間に,そこがエッジであるかどうかを表す隠れ変数を置いてゆく. 領域ベースは各画素がどの領域に属するかを示す隠れ変数を画素ごとに貼り付ける. 境界ベースの隠れ変数 → 多くの拘束条件が必要 領域ベースの隠れ変数 → 境界が自然に閉じたループになるなど好ましい性質を多く持つ.ただし,局所解に陥りやすいという欠点があるため,あまり使われていない.

背 景 3 画像をある一定の特徴を持つ小領域ごとに分割する問題は領域分割(セグメンテーション)と呼ばれる 画像に含まれる対象物を抽出する手法 背 景 3 画像をある一定の特徴を持つ小領域ごとに分割する問題は領域分割(セグメンテーション)と呼ばれる 画像に含まれる対象物を抽出する手法 画像の認識や理解のための第一次画像処理として重要 網膜という2次元センサーの信号から3次元の現実世界を再構成するための第一歩でもあることから視覚の計算論の基礎としても重要

先行研究 D. Geman, S. Geman, Graffigne and Dong, Boundary detection by constrained optimization, IEEE trans. PAMI (1990) MRFに領域ベースの隠れ変数を導入し,シミュレーテッドアニーリングを用いたモンテカルロ法により画像領域分割を行った. Bratsolis and Sigelle, Image relaxation by use of the Potts model with a fast deterministic method, J. Opt. Soc. Am. A (1997) ポッツスピンを領域ベースの隠れ変数(ラベル)に用いて平均場近似に基づく決定論的な手法で画像領域分割を行った.画素値をラベルの初期値として用いた. Chen, Tanaka and Horiguchi, Image segmentation based on Bethe approximation for Gaussian mixture model, Interdisciplinary Information Sciences (2005) ポッツスピンを領域ベースの隠れ変数(ラベル)に用いて確率伝搬法(ベーテ近似)による決定論的な手法で画像領域分割を行った.混合ガウスモデルを仮定し,そのハイパーパラメータ推定も行った.隠れ変数はラベルのみであり,同一ラベル領域内は画素値一様として推定.

目 的 ポッツスピン型ラベルKと原画像sの両方を隠れ変数とし,変分法に基づく推論により画像修復と領域分割を行う決定論的アルゴリズムを導出する. ガウス雑音を重畳した人工画像に適用した結果について報告する.

アルゴリズム導出の概略 同時事前分布p(x,s,K)から事後分布p(s,K|x)を求める 1.同時事前分布p(x,s,K) 2.因子化仮定            を満たす試験分布q の中からp(s,K|x)にもっとも近いものを探す(変分推論) 8

アルゴリズム導出の詳細 Nは画素数 観測画像 原画像 ポッツスピン 領域ベースの Dはポッツスピンの次元 隠れ変数 xi は観測データ,siとki は隠れ変数

観測画像xと原画像sが近いほどエネルギー小 同時事前分布p(x,s,K) ボルツマン分布 隣接する画素lとmの隠れ変数が 異なるなら定数λ, 等しいなら隣接画素の差が小さいほどエネルギー小 エネルギー関数 隣り合う画素対 すべてに関する和 画素すべて に関する和 観測画像xと原画像sが近いほどエネルギー小

式を整理すると・・・ ガウス分布 ガウス分布 ベルヌーイ分布 画素 i に隣接する画素の集合

変分法を用いてp(s,K|x)を近似的に求める とおくと一般に s,Kに関して定数 ∴ KL距離が最小という意味で事後分布p(s,K|x)に もっとも近い試験分布q(s,K)を求めるためには, L(q(s,K))を最大化するようなq(s,K)を見つければよい!

一般のq(s,K)のままでは計算が困難なので因子化仮定をおく L(q(s,K))を最大にするq(s), qi(ki)を変分法を用いて求めると

q*(s), qi*(ki)を具体的に計算すると, ポッツスピンの平均値に関するself-consistentな方程式 反復法 で解く 反復

実験結果1 (ε=0.5, ρ=130, λ=0.2) 大きなオーバーラップがあり,閾値だけでは領域分割不可な画像に対して ガウスノイズ 原画像s 観測画像x (PSNR=18dB) x の画素値ヒストグラム (閾値だけでは領域分割不可) 実験結果1 (ε=0.5, ρ=130, λ=0.2) 修復画像 大きなオーバーラップがあり,閾値だけでは領域分割不可な画像に対して 良好な領域分割 → このアルゴリズムは有効であり頑健である

実験結果2 原画像のグラデーション再現と領域分割を同時に実現! (ε=0.5, ρ=130, λ=0.1) 原画像s 観測画像x ガウスノイズ 原画像s (グラデーション有り) 観測画像x (PSNR=18dB) x の画素値ヒストグラム (閾値だけでは領域分割不可) 実験結果2 (ε=0.5, ρ=130, λ=0.1) 修復画像 原画像のグラデーション再現と領域分割を同時に実現!

まとめ 領域ベースのポッツスピン型ラベルと原画像の両方を隠れ変数とし,変分法に基づく推論により画像修復と画像領域分割を行う決定論的アルゴリズムを導出した. 雑音を重畳した人工画像に適用し,良好な画像修復と領域分割が行えることを示した. 今後の課題 ポッツスピンの次元Dやハイパーパラメータε,ρ,λの自動設定