参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社

Slides:



Advertisements
Similar presentations
画像処理・実習 第十四回:パターン認識 東海大学 情報理工学部 情報メディア学科 濱本和彦. 今回の内容 5. パターン認識 5.1 マッチングの原理 5.2 テンプレートマッチング 実習 相互相関とテンプレートマッチング.
Advertisements

Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
池内研究室 Computer Vision Laboratory 東京大学 The University of Tokyo 偏光レイトレーシング 宮崎大輔 2004 年 6 月 22 日(火) CVL セミナー.
第 5 章 2 次元モデル Chapter 5 2-dimensional model. Contents 1.2 次元モデル 2-dimensional model 2. 弱形式 Weak form 3.FEM 近似 FEM approximation 4. まとめ Summary.
視覚の幾何学 3 呉海元@和歌山大学 参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何 学-」 コロナ社.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
計測情報処理論(4) レンズの基礎.
豊洲 304教室 15 JULY コンピュータグラフィックス 2008年度版.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
静止背景における動物体の検出と追跡 陳 謙 2004年10月19日.
パノラマ動画像モデルによる 仮想空間表現システムの研究
第3回  CVにおけるエピポーラ幾何
3DCG技法についての 調査報告 ○○県立○○高等学校 1年は組 グループ0.
コンピュータビジョン特論 第7回対象追跡 2006年11月15日 加藤丈和.
画像処理論.
Chapter 11 Queues 行列.
参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社
形状を平行移動や回転移動させて位置を変えたり,拡大・縮小して変形させる方法を説明する.
剛体の物理シミュレーション は難しい? 佐藤研助手 長谷川晶一.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
The ball being captured inside the net
Nonrigid Structure from Motion in Trajectory Space
画像特徴(点、直線、領域)の検出と識別-2 呉海元@和歌山大学 2007年5月14日
多重フォーカスカメラと符号化開口を用いた実時間距離画像計測
多変数関数の積分(6/3~24) 重積分(2重積分) 第6章(§5は除く) 重積分の定義 「連続関数は積分可能」
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
Licensing information
金沢大学 工学部 情報システム工学科3年 岩淵 勇樹
3次元での回転表示について.
線画解析 第3回.
4. 組み合わせ回路の構成法 五島 正裕.
コンピュータビジョン 第1回.
参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
Computer Graphics 第3回 座標変換 芝浦工業大学情報工学科 青木 義満
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
Computer Graphics 第4回 投影・ビューイングパイプライン モデリング 芝浦工業大学情報工学科 青木 義満
第11回   ディジタル画像(2) ディジタル画像処理(2)
Hough変換 投票と多数決原理に基づく図形の検出
OpenGLライブラリを用いた3次元フラクタルの描画
5章  3次元形状を2次元面に投影する 3次元空間内に定義した形状を,2次元面上(ディスプレイのスクリーン面,プリンタの紙面など)に投影して表示するために必要になる変換について説明する.
第12回   ディジタル画像(3) ディジタル画像処理(3)
3次元での回転表示について.
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
予測に用いる数学 2004/05/07 ide.
講義日程 第1回: 投影法とその種類 第2回: 点及び直線の投影 第3回: 副投影法 第4回: 平面の投影
可視面・不可視面の判定方法と隠れ面(不可視面)の消去法について述べる.
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
CVPR2003サーベイ 宮崎大輔 CVLセミナー 2003年7月2日(水)
資料 線型変換のイメージ 固有値、固有ベクトル 平賀譲(209研究室) 資料
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
コンピュータグラフィックス 実習3: 光線追跡法
北大MMCセミナー 第62回 附属社会創造数学センター主催 Date: 2016年11月4日(金) 16:30~18:00
超立方体の展開図 Cabri 研究会 2012年1月9日 生越 茂樹.
1:Weak lensing 2:shear 3:高次展開 4:利点 5:問題点
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
ETPB: Extraction of Context from Pedestrians' Behavior
地理情報システム論 第4回 コンピュータシステムおける データ表現(2)
ポッツスピン型隠れ変数による画像領域分割
パターン認識特論 カーネル主成分分析 和田俊和.
第5回 斜投影と等角投影 ★立体図を作図する! ★三面図から立体の形状を読みとる。.
重力波解析ライブラリKagaliのためのAntenna pattern functionの作成
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
Presentation transcript:

参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社 視覚の幾何学2 呉海元@和歌山大学 参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社

Single view geometry Camera model Single view geom.

透視投影モデル (x,y,z)から(x’,y’,z’)へ投影: (相似三角関係より) 仮定: 原点をレンズの中心に Z軸と光軸と同じ O x 仮定:  原点をレンズの中心に  Z軸と光軸と同じ (f = Z’) ●透視投影はZに関し非線形である ★幾何関係だけ考える理論系の人はよくf=1とする

正射影 (orthographic projection) ●正射影画像面に垂直な軸に沿って投影するもの ●Z軸方向の情報が失われ, X軸とY軸方向の座標はそのまま保存される ●正射影はZに関し線形であり数学 的にははるかに扱いやすい ●正射影は実際のカメラによる投影 とは掛け離れたものであり,この投影 モデルがCGの分野に良く使われて いるが、CVの分野に応用できる場 合は稀である  

正射影モデル ●正射影はZに関し線形である Projection from (x,y,z) to (x’,y’,z’): or

弱透視投影(weak perspective projection) ●透視投影は現実のカメラによる投影にきわめて近いが、非線形であり数学的には扱いにくい ●正射影は線形であるが、実際のカメラによる投影とは程遠い ●弱透視投影はこれら二の投影の中間的なものであり、正射影と透視投影を組み合わせた投影である

弱透視投影 ●弱透視投影は正射影と透視投影を組合わせた投影 1) 対象物を画像面pに平行な平面Pに正射影⇒線形  ⇒均一に拡大或は縮小を行っている⇒線形 ★弱透視投影は線形   x = X’/Z’ = X/Z°   y = Y’/Z’ = Y/Z°   Z°は定数

弱透視投影が成り立つ条件 ●弱透視投影は透視投影の近似である ●この近似の有効範囲は限られている ●弱透視投影では対象物上の各点までの距離Zが一定値Z°で近似できることを前提としている ●対象物のZ軸方向の厚みDがカメラから対象物までの距離Zと比較して十分小さければよい ●D:Zが1:10以上であればこの近似が有効であると考えてよい

平行透視投影(paraperspective projection) ●弱透視投影では透視投影の前に画像面pに平行な平面Pへの正射影を行った ●透視投影を線形近似するもう一つの一般化した方法:透視投影の前に平面Pへ平行投影を行う        ⇒正射影のように各点をある直線Lに平行に投影するが、この直線Lが必ずしも平面Pに垂直ではない L L 弱透視投影 平行透視投影

平行透視投影 ●平行投影の方向 = 対象物の平均的な方向 ●平行投影は線形な投影であり、平行な平面間の透視投影も線形な投影であるから、これらを組み合わせた平行透視投影も線形な投影となる

平行透視投影の式 Step 1: 対象物の平均的な方向を(△X, △Y, 1)とし この方向に平行投影する:   この方向に平行投影する:    X’ = X + ( Z°- Z)△X    Y’ = Y + ( Z°- Z)△Y    Z’ = Z°   Step 2: 透視投影する      平行透視投影は以下のように表せる:        x = X’/Z’ = 1/Z°・X - △X/Z°・ Z + △X        y = Y’/Z’ = 1/Z°・Y - △Y/ Z°・Z + △Y

平行透視投影 ●前式のX, Y, Zにかかる1/ Z°, △X/ Z°, △Y/ Z°, △X, △Yなどはいずれも定数 => X, Y, Zに関して線形 ●平行透視投影も透視投影の線形近似 ●対象物の平均方向が光軸に一致する場合には平行透視投影は弱透視投影となる

弱透視投影と平行透視投影 ●平行透視投影の方がより透視投影に近い ●弱透視投影も平行透視投影も画像面pに平行な平面Pに平行投影した後、透視投影する ●弱透視投影は平面Pに垂直に平行投影する ●平行透視投影は対象物の平均的な方向に向けて平行投影する ●平行透視投影の方がより透視投影に近い

E.g., Shape Reconstruction Right Left 正射影 透視投影 ★射影モデルが異なる→同じ画像から復元された3D情報が異なる

Affine cameras 焦点距離f を増加 物体とカメラの距離を増加

2次元平行移動

2次元拡大・縮小

2次元回転(原点中心)

2次元アフィン変換 平行移動 アフィン変換 拡大・縮小 一般化! 回転 せん断

アフィン変換をもっと簡単な形に~ 同次座標 (homogeneous coordinates) 1つ次元を 上げると・・・ 積 和 積のみ! 図形の変換を全て行列の乗算1回で処理可能 複雑な座標変換がすべて行列の形で処理できる

同次座標の基本2D変換 Basic 2D transformations as 3x3 matrices 平行移動Translate 拡大・縮小Scale 回転Rotate せん断Shear

行列の合成 複雑な座標変換の行列は各処理の行列の掛け算から合成 p’ = T(tx,ty) R(Q) S(sx,sy) p

同次座標 (3次元) ( x, y, z ) ( x, y, z, f ) 3次元座標値を,一つ次元を上げて4次元空間の中で処理 同次座標 (3次元) 3次元座標値を,一つ次元を上げて4次元空間の中で処理 (x/f, y/f, z/f) が三次元座標値となる f=1のときはそのまま(x, y, z)が座標値 ( x, y, z ) ( x, y, z, f ) 2次元アフィン変換と同じく、 座標変換をまとめて表記できる!

3次元アフィン変換 2次元 3次元 (A: アフィン変換行列) P(x, y, z) からP(x’, y’, z’) へのアフィン変換(同次座標による表現) (A: アフィン変換行列)

同次座標導入の利点 同次座標を使わない場合 一回目のアフィン変換 二回目のアフィン変換 同次座標を導入した場合 H1,H2: 2D ⇒ 3 x 3 のアフィン変換行列 H1,H2: 3D ⇒ 4 x 4 のアフィン変換行列

直線上の点はすべて同じ座標を持つものとする(点と線が同一視される) 同次座標系導入の利点 f=w=1 直線上の点はすべて同じ座標を持つものとする(点と線が同一視される)

無限遠要素 無限遠点 無限遠直線 無限遠平面

Two-view geometry 3D reconstruction Epipolar geometry E-matrix comp. F-matrix comp. H-matrix comp. Structure comp.

立体視Stereo Vision (Stereopsis) Main problem – recover 3D depth from two (or more) image views ●一台のカメラから得られた画像のみからでは、3D物体の形状を一意に決定することができない ●2つ以上の異なる視点で得られた画像からはこのような不定性を取り除き、形状を決定することができる ●静止シーンの場合、一台のカメラから異なる視点で得られた2枚の画像でもOK

立体視の原理 平行ステレオ 三角計測法に基づいて、 視線の交点が注視点の空間位置 距離Zは焦点距離f、ベースB、差△xの関数 差(disparity) 距離Zは焦点距離f、ベースB、差△xの関数

立体視の原理 光軸は平行ではない場合 Algorithm p l r P Ol Or Xl Xr Pl Pr Zl Yl Zr Yr R, t t X’l Xl’ = T, Yl’ = Xl’xZl, Z’l = Xl’xYl’ Algorithm Rotate both left and right camera so that they share the same X axis : Or-Ol = T Define a rotation matrix Rrect for the left camera Rotation Matrix for the right camera is RrectRT Rotation can be implemented by image transformation Pr = R (Pl – T) Pl’ = Rrect Pl Pr’ = Rrect RT Pr First rotate the right camera so that it’s three axes parallel to the left camera; then Rotate both camera so that they have the same x axis, and Z axes are parallel 光軸は平行ではない場合

立体視の原理 光軸は平行になるように 変換(R,tが既知) Algorithm p l r P Ol Or Xl Xr Pl Pr Zl Yl Zr Yr R, t t X’l Xl’ = T, Yl’ = Xl’xZl, Z’l = Xl’xYl’ Algorithm Rotate both left and right camera so that they share the same X axis : Or-Ol = T Define a rotation matrix Rrect for the left camera Rotation Matrix for the right camera is RrectRT Rotation can be implemented by image transformation Pr = R (Pl – T) Pl’ = Rrect Pl Pr’ = Rrect RT Pr First rotate the right camera so that it’s three axes parallel to the left camera; then Rotate both camera so that they have the same x axis, and Z axes are parallel 光軸は平行になるように 変換(R,tが既知)

Correlation Approach LEFT IMAGE (xl, yl) (0). Essential Equation represents actually the epipolar plane in either the left or the right image (1). Epipolar line in the right image given pl (Epl)Tpr=0 zr = fr extension of the equations in pr = (xr,yr,fr) (2). Epipolar line in the left image given pr (prTE) pl=0 zl = fl For each point (xl, yl) in the left image, define a window centered at the point

Correlation Approach RIGHT IMAGE (xl, yl) (0). Essential Equation represents actually the epipolar plane in either the left or the right image (1). Epipolar line in the right image given pl (Epl)Tpr=0 zr = fr extension of the equations in pr = (xr,yr,fr) (2). Epipolar line in the left image given pr (prTE) pl=0 zl = fl … search its corresponding point within a search region in the right image

Correlation Approach RIGHT IMAGE (xr, yr) dx (xl, yl) (0). Essential Equation represents actually the epipolar plane in either the left or the right image (1). Epipolar line in the right image given pl (Epl)Tpr=0 zr = fr extension of the equations in pr = (xr,yr,fr) (2). Epipolar line in the left image given pr (prTE) pl=0 zl = fl … the disparity (dx, dy) is the displacement when the correlation is maximum

特徴に基づいた立体視 特徴検出 残りの部分は表面内挿 特徴コーナー、点、エッジ 対応特徴を見つける (相関評価による)  ⇒差(disparty)より奥行計算 残りの部分は表面内挿 corner line structure

よく用いられる相関評価方法 SSD(Sum of Squared Differences) 最も基本的な誤差関数 画像をベクトルとみなせば、  ベクトル間のユークリッド距離 外れ値の影響を受けやすい 照明変化の影響を受けやすい ラスタスキャン 多次元ベクトルと考える 画素毎に差をとって二乗 総和

よく用いられる相関評価方法 SAD(Sum of Absolute Differeces) 画素毎の差分の絶対値の和 SSDに比べて外れ値の影響を受けにくい 照明の影響を受けやすい

よく用いられる相関評価方法 CC(Cross Correlation) 正規化相互相関 ベクトル間の内積(角度) 照明変化に強い SSD,SAD CC ノルムが変化しても内積 CCは変わらない 明るさの正規化 コントラスト の正規化

特徴に基づいた立体視 corner 差(disparity) 2枚の画像から 3次元情報を復元

Examples Left Image Right Image Depth Map

1.弱透視投影の原理図を描き、その原理と成り立つ条件について述べなさい 出席チェック 1.弱透視投影の原理図を描き、その原理と成り立つ条件について述べなさい