CVPR2003サーベイ 宮崎大輔 CVLセミナー 2003年7月2日(水)

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

池内研究室 Computer Vision Laboratory 東京大学 The University of Tokyo 偏光レイトレーシング 宮崎大輔 2004 年 6 月 22 日(火) CVL セミナー.
Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
0章 数学基礎.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
計測情報処理論(4) レンズの基礎.
テンソル積展開 宮崎大輔.
ゲーム開発者向け最新技術論文の解説・実装講座
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
( ) ( ) 行 列 式 置 換 n文字の置換σ: n個の文字{1,2,・・・,n}から自分自身への1対1の写像 1 2 ・・・ n
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
4.3 連立1次方程式   Ax = b   (23) と書くことができる。
All images are compressed.
Extremal Combinatorics 14.1 ~ 14.2
Nonrigid Structure from Motion in Trajectory Space
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
SURF: Speeded Up Robust Features
DARTs: Efficient scale-space extraction of DAISY keypoints
線形代数学 4.行列式 吉村 裕一.
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
3次元での回転表示について.
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
第6章 カーネル法 修士2年 藤井 敬士.
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社
線形代数学 谷津 哲平 第1章 ベクトル 1.1 ベクトル空間 1.2 ベクトルの一次独立性 1.3 部分ベクトル空間
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
3. 可制御性・可観測性.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
「R入門」  5.7 行列に対する諸機能  10月23日 (木) 発表者 大城亜里沙.
Computer Graphics 第10回 レンダリング(4) マッピング
独立成分分析 (ICA:Independent Component Analysis )
3次元での回転表示について.
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
可視面・不可視面の判定方法と隠れ面(不可視面)の消去法について述べる.
Image Analogies SIGGRAPH 2001 宮崎大輔
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
偏光による形状推定および色の解析 宮崎大輔.
Thesis Supervisor: Katsushi Ikeuchi 池内克史
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
様々な情報源(4章).
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
電磁気学Ⅱ Electromagnetics Ⅱ 6/9講義分 電磁場の波動方程式 山田 博仁.
物理ベースレンダリング 光の物理的な挙動を正確に再現して レンダリングを行うこと 光(電磁波)の挙動を表す物理法則 幾何光学 波動光学
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
資料 線型変換のイメージ 固有値、固有ベクトル 平賀譲(209研究室) 資料
4. システムの安定性.
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
コンピュータグラフィックス 実習3: 光線追跡法
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
1:Weak lensing 2:shear 3:高次展開 4:利点 5:問題点
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
All images are compressed.
行列 一次変換,とくに直交変換.
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
空間図形の取り扱いについて.
Presentation transcript:

CVPR2003サーベイ 宮崎大輔 CVLセミナー 2003年7月2日(水) ヘルムホルツステレオ法 CVPR2003サーベイ 宮崎大輔 CVLセミナー 2003年7月2日(水)

本発表の流れ Helmholtzステレオ法とは? P. Tu, P. R. S. Mendonça, “Surface Reconstruction via Helmholtz Reciprocity with a Single Image Pair,” CVPR2003, Oral T. E. Zickler, P. N. Belhumeur, D. J. Kriegman, “Toward a Stratification of Helmholtz Stereopsis,” CVPR2003, Oral

Helmholtzステレオ法とは?

歴史 Helmholtzステレオ法が開発された そしてCVPR2003 1856年: von HelmholtzがHelmholtz reciprocityを発表 1900年: Rayleigh卿がより一般的な実験結果を提示 2002年: Snyderが一般化 2001年: Magda, Kriegman, Zickler, Belhumeur [ICCV] 2002年: Zickler, Belhumeur, Kriegman [ECCV, IJCV] Tu, Mendonça: 一対の画像だけを使う手法 Zickler, Belhumeur, Kriegman: 未校正下で行う手法 Helmholtzステレオ法が開発された そしてCVPR2003

ステレオ法 多数の方向から物体を観測 光源固定 window内での輝度の差などを使って対応点を探す カメラパラメータ(視線方向など)とdisparity(視差)から距離を求める 距離(depth)が求まる 物体

照度差ステレオ法(photometric stereo) 光源を変化させる→ある方向から光を照らした画像、別の方向から光を照らした画像、・・・を撮影する カメラ固定 法線(surface normal)が求まる

Helmholtz Reciprocity

Helmholtzステレオ法 Stereo + Photometric stereo 距離(depth)と 法線(normal) が求まる

計測結果の一例

計測装置の一例

取得画像の一例

計測結果の一例

Peter Tu Paulo R. S. Mendonça GE Global Research Center, USA Surface Reconstruction via Helmholtz Reciprocity with a Single Image Pair Peter Tu Paulo R. S. Mendonça GE Global Research Center, USA

この論文の手法 以前のHelmholtzステレオ法を、一つのペアのreciprocal画像から形状を復元する 動的計画法(dynamic programming)を使ってマッチングを行う Ohta&Kanadeが1985年に動的計画法を使ったステレオマッチング法を提案している

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) 画像2のepipolar線上のpixel 画像1のepipolar線上のpixel グリッド

動的計画法(dynamic programming) コストが最小になる経路を探す →最適なマッチング 動的計画法の実装で有名な物にDijkstra法がある

notation 表面上の点p 単位視線ベクトルv1,v2 単位法線ベクトルn Optical center c1,c2 C1 C2 n

Helmholtz reciprocityと画像の輝度 BRDF Helmholtz reciprocity 輝度1 輝度2 輝度2を輝度1に変換した輝度 η: scale factor

動的計画法のコスト Lambertianの場合 Helmholtz reciprocityの場合 a b 3D空間の点paが対応づけられている 3D空間の点pbが対応づけられている aからbにたどり着いたときのコスト = aのコスト + bでのwindow内の各pixelの輝度差

法線のepipolar平面への投影 法線を2つの垂直ベクトルの和で表す neと視線(or光源)v1,v2はepipolar平面に含まれる noはepipolar平面に垂直である よって n no ne v1 v2 Epipolar平面

法線の近似 α: unknown scale pb pa v1 v2

輝度 以上の事を使い、輝度を表す式に代入すると 右辺は、画像2、カメラパラメータ、近似法線から求まる

飽和(saturation) カメラのdynamic rangeを超えたらspecularとみなす →入射角と反射角が等しい よって、コスト関数として以下を用いる

結果

結果

Toward a Stratification of Helmholtz Stereopsis Todd E. Zickler Yale University Peter N. Belhumeur Columbia University David J. Kriegman University of California

この論文の手法 以前のHelmholtzステレオ法を、キャリブレーションを行わずに形状を復元する 特異値分解(SVD; singular value decomposition)を使う Tomasi&Kanadeが1992年にSVDによる因数分解法を提案している

特異値分解(SVD)とは? SVDについては僕は初心者なので間違っている所があるかもしれないので注意してください SVDは行列Aを分解する Uの列、Wの要素、Vの列(VTの行)を入れ替えてもいいので、wjを大きい順に並べたとして、以下、議論を進める wjを特異値と呼ぶ

特異値分解 N×Nの行列AのrankがN未満のとき、その行列を特異という 行列が特異のとき、Ax=bを解くことを考えよう

特異値分解 Ax=0を満たすxの張る空間を零空間(null space)と呼ぶ 零空間が1次元の場合、零ベクトル(null vector)と呼ぶときもある(普通、零ベクトルとは[0,…,0]のベクトルの事を言う) Axの張る空間を値域(range)と呼ぶ w1 wj≠0 A= U VT wj=0 wN 値域の正規直交基底 零空間の正規直交基底

特異値分解 Ax=bの特殊解はSVDを使って以下で与えられる Ax=bの解は特殊解に零空間の任意のベクトルを加えた形で表される Ax=bの解がない場合(bが値域の外にある場合)、SVDは最小2乗法の意味で最良の妥協解を求める。すなわち、Axがbに最も近くなるような特殊解xをはきだす

特異値分解

Uncalibrated Helmholtz stereopsis カメラと光源を入れ替えてペア画像を取得 合計M(M-1)の画像を取得 つまり、合計M(M-1)/2のreciprocal画像ペアを取得

Helmholtz reciprocity constraint カメラ/光源位置 カメラがoi、光源ojのときの観測輝度 表面上の点 法線 視線(pからoi) 光源の強さ ハットは単位ベクトルを表す

正射影 カメラ/光源が十分遠くにあると仮定(2.5mなど) さきほどの制約: 光源ベクトル: は光源の強さで、 はカメラ/光源方向(単位ベクトル) 光源と法線の内積をwiとおく 制約は次のように書き直せる wiを要素とするベクトルw 最終的に制約は次のように表せる

具体例 M=4の例

ランク M=4の場合rankは3になる EのrankはM-1になる(らしい) M-1未満のケースは考えない 1次元零空間は以下で表せる

Wの定義 N×M行列Wを定義する(Nは点の数、Mはカメラ/光源の数) Wの行をさきほどの1次元零空間とする 図はWの列を表す

Decomposition に分解したい : N×3行列(ckでスケーリングされた法線) SVDで分解 3×3の正則行列Qを使って正しい分解を行う このQを求める必要がある Uncalibrated stereo, Uncalibrated photometric stereoには様々な方法があるが、この論文では以下で示す方法を使った 詳しくは、[Shapiro-Zisserman-Brady1995], [Tomasi-Kanade1992], [Weinshall1993]を参照せよ (rank W = 3) 上位3つの特異値 だけを使って分解

アフィンカメラ 画像i 点k はじめは正射影を仮定 image point projection matrix scene point offset 回転行列の上の2行をスケーリングしたもの (ただし、aspect比を1としピクセル歪みも無いとした場合) 視線/光源方向がPから求まる

Metric reconstruction そこで、以下を満たす3×3正則行列Qを求める 本当の視線/光源方向 が求まる いまいち良く分からないが

実装 4点以上(例えば20点)の対応点を全ての画像で与えてやり、Tomasi-Kanadeの方法で視線/光源方向 を求める

実装 全てのdisparity d∈[0, dmax]で探索し、最適なdを求める まず、点xで、各dにおける行列 を計算する dが最適であるかを評価する特徴としてrankE=M-1という性質を利用する rankを計算する方法は数多く提案されているが、この論文では単純に2つの最小の特異値を使って、以下を評価値とする ←ほとんど0 (rankE=M-1が成り立つ場合)

実装 点xoの周りのウィンドウWr(例えば9×9)でrx(d)を計算し、その和が最大となるときのdをdisparityの推定値とする この解は、E=UΣVTとSVDしたとき、最小の特異値に相当するVの列になる(1次元零空間) 実際は誤差を防ぐためウィンドウWE(例えば3×3)で重み付きEwを計算し、その和が最小となるwを求める この場合でも重み付きEをSVDしたときの1次元零空間としてwを与える事ができる

実装 全てのwxからWを計算できる 視線/光源方向 より、W=BSと分解できる

結果

結果

結果

Daisuke Miyazaki 2003 Creative Commons Attribution 4 Daisuke Miyazaki 2003 Creative Commons Attribution 4.0 International License. http://www.cvl.iis.u-tokyo.ac.jp/