視覚の役割 初期視覚(early vision) ↓ 中間視覚(middle vision) 高次視覚(high-level vision) 2次元画像から外界の3次元構造を推測すること 初期視覚(early vision) ↓ 中間視覚(middle.

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
画像処理工学 2012年2月2日 担当教員 北川 輝彦.
非侵襲脳活動計測(fMRI)と(MEG)情報統合とその応用
画像処理論.
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
All images are compressed.
Additional Explanatory Figures for
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
時空間データからのオブジェクトベース知識発見
画像特徴(点、直線、領域)の検出と識別-2 呉海元@和歌山大学 2007年5月14日
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
周期境界条件下に配置されたブラックホールの変形
Volume Extractor Ver 概要紹介と造形モデル例-
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
(Cognitive Brain Science) ニューロエソロジー・神経行動学 (Neuroethology) 計算論的神経科学
非侵襲脳活動計測(fMRI)と(MEG)情報統合とその応用
VI-5 線分布(ネットワークデータ)を分析する方法
第6章 カーネル法 修士2年 藤井 敬士.
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
乳児における 運動情報と形態情報の相互作用
画像処理 基礎.
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
ビデオデータベース.
第2回 両眼立体視と明るさ解析.
第11回   ディジタル画像(2) ディジタル画像処理(2)
領域ベースの隠れ変数を用いた画像領域分割
画像処理工学 2013年1月23日 担当教員 北川 輝彦.
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
Computer Graphics 第10回 レンダリング(4) マッピング
第12回   ディジタル画像(3) ディジタル画像処理(3)
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
様々な情報源(4章).
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
第3章 線形回帰モデル 修士1年 山田 孝太郎.
Data Clustering: A Review
どのような特徴を見ているのか ― 計算の目的
混信回避行動 Df = f相手 – f自己 Df > 0 ? or Df < 0 ? 発電周波数 それが混信回避行動です。
確率の生み出す新しい情報処理技術 東北大学 大学院情報科学研究科 田中 和之
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
定常剛体回転する宇宙ひもからの 重力波放射
ETPB: Extraction of Context from Pedestrians' Behavior
ポッツスピン型隠れ変数による画像領域分割
【第六講義】非線形微分方程式.
音響伝達特性を用いたシングルチャネル音源方向推定
電子ビームラインの構築と APDを用いた電子計測試験
領域ベースの隠れ変数を用いた決定論的画像領域分割
執筆者:行場次郎 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
荷電粒子の物質中でのエネルギー損失と飛程
Presentation transcript:

視覚の役割 初期視覚(early vision) ↓ 中間視覚(middle vision) 高次視覚(high-level vision) 2次元画像から外界の3次元構造を推測すること 初期視覚(early vision) ↓ 中間視覚(middle vision) 高次視覚(high-level vision)

視覚の不良設定性 良設定問題 (1) 問題の解が存在し (2) 解が一意であり (3) 解がデータに連続に依存する 光学 3次元空間→2次元画像 視覚(逆光学) 2次元画像→3次元空間 :不良設定性

Contour Based Optical Flow (Hildreth) Within the aperture, only motion component perpendicular to the contour can be measured. How to determine velocity vector? Smoothness of the velocity field

標準正則化理論 光学 データ から を解く(逆問題) 画像 3次元世界の様子を推測 を最小にする を求める データ から を解く(逆問題) 画像 3次元世界の様子を推測 を最小にする を求める 画像データ拘束 世界のモデル・なめらかさ・先験的知識√ :線形汎関数

標準正則化汎関数 問題 正則化原理 エッジ検出 領域に基づくオプティカルフロー 輪郭に基づくオプティカルフロー 表面再構成 時空間近似 色 問題 正則化原理 エッジ検出 領域に基づくオプティカルフロー 輪郭に基づくオプティカルフロー 表面再構成 時空間近似 色 陰影からの構造復元 ステレオ

最大事後確率推定としてみた標準正則化理論 3次元世界 画像 光学 観測ノイズ 3次元世界の先見分布 条件付確率 事後確率 最大事後確率推定 標準正則化 最大 最小

中間視覚 (middle vision)  複数の手がかりの統合  ↓ 2・1/2次元スケッチ ライン過程(不連続)が統合のかなめ

Integrating Visual Modules Disparity Optical flow Shading Texture coupled MRF 2・1/2-D sketch

Filling-Inと不連続 (1) 雑音がのったまばらなデータから内挿・外挿して 滑らかな表現を得る (2)内挿・外挿は不連続線で停止する   滑らかな表現を得る (2)内挿・外挿は不連続線で停止する (3) 不連続線は連続につながる ● 静止網膜像 ● neon-color spreading ● Craik-O’Brien 錯視

Visual Cortex as MRF Interaction is Local (Ts’o, 1986) Retina up fovea right down This basic cortical module(hypercolumn) in area 17 of the visual cortex contains a complete set of orientation columns representing 360 and a set of ocular dominance columns. Each hypercolumn also contains several cortical pegs, regions of cortex in which the cells do not have an axis of orientation. The cells in the pegs are concerned with color, as well shall see in Chapter 30. Each layer of the lateral geniculate nucleus receives input from either the contralateral (c) or the ipsilateral (I) eye and projects in turn to the ipsilateral or the contralateral ocular dominance columns. CO R L R L 2&3 4A 4B 4C 5&6 Interaction is Local (Ts’o, 1986) Strength of the interactions …. dropps as the horizontal distance increased and became significantly weaker 2-3mm several degree

一撃計算と繰り返し計算の比較 一撃計算 繰り返し計算 解剖学 (ハードウェア) 後ろ向き結合 水平結合 前向き結合 反復演算  一撃計算    繰り返し計算 解剖学 (ハードウェア) 後ろ向き結合 水平結合 前向き結合 反復演算 (アルゴリズム) 一撃アルゴリズム 反復アルゴリズム 本質的な特徴の抽出 視覚世界の推定 視覚の目的 (計算理論) (Gibson, Ballard) (Marr, Poggio) 神経発火の情報 キャリアー (表現) 初期発火 発火の時間パターン

運動知覚における局所的曖昧性 ・窓枠から知覚する輪郭の運動 ・局所的曖昧性→中央の窓内の輪郭の運動方向は曖昧である. ・人間が知覚する中央の輪郭の運動方向は、端点の運動方向に影響される。 すなわち、情報の統合によって曖昧性が解決されている。 ・中央の知覚の時間的変化を調べることによって統合のメカニズムを知る ことができる。

運動方向の補完の時間特性:実験手続き ・Target の中央の線分の運動方向と,その後に呈示されるランダムドットの運動 方向を比較し、どちらが鉛直方向に近いかを答える。 ・窓サイズ固定条件  輪郭長= 2.4, 4.0, 5.6, 7.2(deg),窓サイズ= 1.1(deg)  輪郭呈示時間= 100, 200,300, 400, 500, 600(ms) ・輪郭長固定条件  輪郭長= 7.2(deg),窓サイズ= 1.1, 1.9, 2.7. 3.5(deg)

運動方向の補完の時間特性:実験結果 輪郭が短かくなる、または、窓が大きくなると、知覚される運動方向は鉛直に 近づく。(p< .001)

計算理論:情報の空間的伝播と繰り返し計算 s:線分上の位置、V(s):各点での速度、b(s) :各点での輪郭のバインディング (0 < b(s) <1), N(s) :点sでの垂線方向の単位ベクトル、 VN(s) :速度の垂線成分 ・輪郭の補完と、輪郭上の運動情報  の伝播からなるモデル. ・輪郭及び運動方向の情報は空間的  に局所的に表現され、局所的な相  互作用によって伝播する。 ・エネルギー関数の最小化として定  式化でき、繰り返し計算によって  解くことができる。

実験結果とモデルによる予測の比較

奥行き知覚における局所的曖昧性 テクスチャの無い面の奥行き ・テクスチャのない水平な輪郭では左右画像の対応が一意に決まらないため、奥行き  が局所的に曖昧となり、例えば上図のステレオグラムは実際には下図に示したよう  な形状を表しているかもしれない。 ・しかし、通常は平らな面が知覚される。これは左右画像の対応が一意に決まる端点  等で得られる奥行き情報を使って、曖昧な部分の奥行きが補完されるからである。

奥行き補間の時間特性:実験手続き 水平な線分の奥行き補間のダイナミクスを実験的に観測する。 水平線分の端点の視差を時間的に変化させたときにその中央の奥行きの知覚がどのよ うに変化するかを、中央に置いた垂直線分と比較することによって測定する。 被験者は周期的に運動する水平線分の中央部の奥行きが、同じ周期で運動する垂直線 分の奥行きと等しくなるように、水平線分の端点と垂直線分との振動の位相差を調整 する。

奥行き補間の時間特性:実験結果 ・長さに依存した時間の遅れが存在。 ・垂直方向の呈示位置が固視点から離れると、時間の遅れが小さくなる。 ・途中を遮蔽すると時間の遅れが大きくなる。

視覚情報の空間的伝播 ・局所的に曖昧な輪郭運動方向あるいは奥行きの知覚は、近傍に呈示された  曖昧でない視覚パターンによってその曖昧性が解決される。 ・実験的にその過程を観測することによって、この曖昧性の解決が、空間的な  距離や遮蔽等に依存した時間のかかる処理によって行われていることが分か  った。 ・局所的情報表現とその局所的相互作用に基づき、繰り返し計算によって視覚  情報が空間的に伝播すると考える計算論的モデルが,得られた実験の結果を  よく説明した。これは、脳の視覚情報処理においても繰り返し的計算による  情報処理が行われている可能性を示している。

一次視覚野と高次視覚野とで構成される階層構造の基本計算モデル 高次視覚野(HVC) 一次視覚野と高次視覚野とで構成される階層構造の基本計算モデル 一次視覚野では、高次視覚野の表現と2次元画像データとの中間的な表現が処理される。これに対応して画像生成過程は、高いレベルでの記述から低いレベルでの記述への と、低いレベルでの記述から2次元画像データへの との直列計算で表せる。 1次視覚野(V1) 2次元画像データ 画像生成過程 3次元視覚世界の低いレベルでの記述 3次元視覚世界の高いレベルでの記述