領域ベースの隠れ変数を用いた画像領域分割

Slides:



Advertisements
Similar presentations
PRML読書会第11回 8.4 グラフィカルモデルによる推論 SUHARA YOSHIHIKO (id:sleepy_yoshi)
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
ソーラス符号の パーシャルアニーリング 三好 誠司 上江洌 達也 岡田 真人 神戸高専 奈良女子大 東大,理研
コンピュータビジョン特論B - Graph Cuts - 永橋知行.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
Pattern Recognition and Machine Learning 1.5 決定理論
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
ベイズ的ロジスティックモデル に関する研究
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
流体のラグランジアンカオスとカオス混合 1.ラグランジアンカオス 定常流や時間周期流のような層流の下での流体の微小部分のカオス的運動
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
背 景 多数の「スピン」とそれらの「相互作用」という二種類の変数を有する系の解析においては,相互作用の方は固定されておりスピンだけが 変化するモデルを考える場合が多い.   (例:連想記憶モデル) 「スピン」よりもゆっくりと「相互作用」も変化するモデル(パーシャルアニーリング)の性質は興味深い.
第9章 混合モデルとEM 修士2年 北川直樹.
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
P3-12 教師が真の教師のまわりをまわる場合のオンライン学習 三好 誠司(P)(神戸高専) 岡田 真人(東大,理研,さきがけ)
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
第14章 モデルの結合 修士2年 山川佳洋.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
複数特徴量の重み付け統合による一般物体認識
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
ガウシアン確率伝搬法の 近似精度に対する理論解析
名古屋市立大学大学院システム自然科学研究科 MIRU2009: 第12回 画像の認識・理解シンポジウム
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
人工知能特論II 第8回 二宮 崇.
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ポッツスピン型隠れ変数による画像領域分割
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
領域ベースの隠れ変数を用いた決定論的画像領域分割
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
自己縮小画像と混合ガウス分布モデルを用いた超解像
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
混合ガウスモデル Gaussian Mixture Model GMM
教師がコミティマシンの場合のアンサンブル学習 三好 誠司(神戸高専) 原 一之(都立高専) 岡田 真人(東大,理研,さきがけ)
Presentation transcript:

領域ベースの隠れ変数を用いた画像領域分割 三好 誠司    岡田 真人  関西大     東大,理研

あらまし マルコフ確率場(MRF)とベイズ推定に基づく画像処理においてはエッジの保存のために隠れ変数の導入が効果的である.ポッツスピン型の領域ベース隠れ変数と隣接画素値情報を用い,変分推論により画像領域分割を行うアルゴリズムを導出する.ガウス雑音が重畳した人工画像や自然画像を用いた実験により,このアルゴリズムが有効であり頑健であることを明らかにする.

背 景 1 多数の変数とその変数間の無向性相互作用からなる系はマルコフ確率場(MRF)と呼ばれ,画像の確率モデルとして広く利用されている. 背 景 1 多数の変数とその変数間の無向性相互作用からなる系はマルコフ確率場(MRF)と呼ばれ,画像の確率モデルとして広く利用されている. MRFに基づく画像処理においては,ベイズの定理で計算される事後分布を用いる推定(=ベイズ推定)がよく用いられるが,計算量的困難に直面することが多い. MRFとベイズ推定に基づいた画像処理を行う場合,画像の事前分布を素朴なガウス分布とすると画像中のエッジの表現が難しい. エッジを表現するためには事前分布に隠れ変数を導入することが有効.

背 景 2 隠れ変数には境界ベースと領域ベースがある. 境界ベースは画素と画素の間に,そこがエッジであるかどうかを表す隠れ変数を置いてゆく. 背 景 2 隠れ変数には境界ベースと領域ベースがある. 境界ベースは画素と画素の間に,そこがエッジであるかどうかを表す隠れ変数を置いてゆく. 領域ベースは各画素がどの領域に属するかを示す隠れ変数を画素ごとに貼り付ける. 境界ベースの隠れ変数→多くの拘束条件が必要 領域ベースの隠れ変数→境界が自然に閉じたループになるなど好ましい性質を多く持つ.ただし,局所解に陥りやすいという欠点があるため,あまり使われていない.

背 景 3 画像をある一定の特徴を持つ小領域ごとに分割する問題は領域分割(セグメンテーション)と呼ばれる 画像に含まれる対象物を抽出する手法 背 景 3 画像をある一定の特徴を持つ小領域ごとに分割する問題は領域分割(セグメンテーション)と呼ばれる 画像に含まれる対象物を抽出する手法 画像の認識や理解のための第一次画像処理として重要 網膜という2次元センサーの信号から3次元の現実世界を再構成するための第一歩でもあることから視覚の計算論の基礎としても重要

先行研究 D. Geman, S. Geman, Graffigne and Dong, Boundary detection by constrained optimization, IEEE trans. PAMI (1990) MRFに領域ベースの隠れ変数を導入し,シミュレーテッドアニーリングを用いたモンテカルロ法により画像領域分割を行った. Bratsolis and Sigelle, Image relaxation by use of the Potts model with a fast deterministic method, J. Opt. Soc. Am. A (1997) ポッツスピンを領域ベースの隠れ変数に用いて平均場近似に基づく決定論的な手法で画像領域分割を行った.画素値をポッツスピンの初期値決定のためだけに用いた. Chen, Tanaka and Horiguchi, Image segmentation based on Bethe approximation for Gaussian mixture model, Interdisciplinary Information Sciences (2005) ポッツスピンを領域ベースの隠れ変数に用いて確率伝搬法(ベーテ近似)による決定論的な手法で画像領域分割を行った.混合ガウスモデルを仮定し,そのハイパーパラメータ推定も行っている.隣接画素値の情報を積極的に使ってはいない.

目 的 領域ベースのポッツスピン型隠れ変数と隣接画素値情報を用いて変分法に基づく推論により画像領域分割を行う決定論的アルゴリズムを導出する. 目 的 領域ベースのポッツスピン型隠れ変数と隣接画素値情報を用いて変分法に基づく推論により画像領域分割を行う決定論的アルゴリズムを導出する. 雑音が重畳した人工画像と自然画像に適用した結果について報告する.

アルゴリズム導出の概略 同時事前分布p(x,K)と画像xから事後分布p(K|x)を求める 1.同時事前分布p(x,K) 2.因子化仮定           を満たす試験分布q の中から p(K|x)にもっとも近いものを探す(変分推論) 8 8

画素 i は画素値 xi と隠れ変数 kI を持っている アルゴリズム導出の詳細 Nは画素数 画像(画素値) 領域ベースの 隠れ変数 Dはポッツスピンの次元 ポッツスピン 画素 i は画素値 xi と隠れ変数 kI を持っている

∴ KL距離が最小という意味で事後分布p(K|x)に もっとも近い試験分布q(K)を求めるためには, とおくと一般に Kに関して定数 ∴ KL距離が最小という意味で事後分布p(K|x)に もっとも近い試験分布q(K)を求めるためには, L(q(K))を最大化するようなq(K)を見つければよい!

j≠iであるすべてのkj による分布qでの期待値 一般のq(K)では計算が困難なので因子化仮定をおく 因子のひとつqi(ki)に関する依存性を取り出して計算を進めると,L(q(K))を最大にする試験分布qi*(ki)は以下のように求まる. j≠iであるすべてのkj による分布qでの期待値

エネルギー関数 ボルツマン分布 隣り合う画素対 すべてに関する和 隣接する画素lとmの隠れ変数が 異なるならλ: 定数, 等しいなら(xl - xm)2: 隣接画素値情報を積極的に利用 ボルツマン分布

ベルヌーイ分布 ガウス分布 画素 i に隣接する画素の集合

この式を反復法で解くことにより, ポッツスピンの平均値が得られる! 最終的に得られる,ポッツスピンの平均値に関する self-consistentな方程式 この式を反復法で解くことにより, ポッツスピンの平均値が得られる!

結果(その1) {<ki1>} {<ki2>} {<ki3>} ρ=130 λ=0.2 ガウス雑音を重畳して 作った人工画像x (PSNR=24dB) x の画素値ヒストグラム ρ=130 λ=0.2 {<ki1>} {<ki2>} {<ki3>} 画素値にオーバーラップがあり,閾値だけでは良好な領域分割ができない画像に対して ほぼ完全な領域分割が得られている → このアルゴリズムは有効に機能している

結果(その2) {<ki1>} {<ki2>} {<ki3>} ρ=130 λ=0.2 ガウス雑音を重畳して 作った人工画像x (PSNR=18dB) x の画素値ヒストグラム ρ=130 λ=0.2 市松模様 (局所解) {<ki1>} {<ki2>} {<ki3>} 大きなオーバーラップがあり,閾値だけでは領域分割不可の画像に対して 比較的良好な領域分割 → このアルゴリズムは頑健である

結果(その3) {<ki1>} {<ki2>} {<ki3>} {<ki4>} ρ=130 自然画像 x x の画素値ヒストグラム ρ=130 λ=0.015 {<ki1>} {<ki2>} {<ki3>} {<ki4>} 自然画像に対しても比較的良好な領域分割

まとめ 領域ベースのポッツスピン型隠れ変数と隣接画素値情報を用いて変分法に基づく推論により画像領域分割を行う決定論的アルゴリズムを導出した. 雑音が重畳した人工画像と自然画像に適用し,比較的良好な領域分割が行える可能性を示した. 今後の課題 ポッツスピンの平均値を計算するソフトな推定を行っているにもかかわらず,局所解にトラップされやすいという欠点が現れた. ポッツスピンの次元Dやハイパーパラメータρ,λの自動設定.