参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社

Slides:



Advertisements
Similar presentations
だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
Advertisements

Humble and Honorific Language By: Word-Master Leo, Mixer of Ill Beats.
て -form - Making て -form from ます -form -. With て -form, You can say... ~てもいいですか? (= May I do…) ~てください。 (= Please do…) ~ています。 (= am/is/are doing…) Connecting.
第 5 章 2 次元モデル Chapter 5 2-dimensional model. Contents 1.2 次元モデル 2-dimensional model 2. 弱形式 Weak form 3.FEM 近似 FEM approximation 4. まとめ Summary.
Essay writing rules for Japanese!!. * First ・ There are two directions you can write. ・よこがき / 横書き (same as we write English) ・たてがき / 縦書き (from right to.
VE 01 え form What is え form? え? You can do that many things with え form?
視覚の幾何学 3 呉海元@和歌山大学 参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何 学-」 コロナ社.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
計測情報処理論(4) レンズの基礎.
カメラキャリブレーション(校正) 実世界のカメラとカメラモデルとの対応付け
米国セキュリティ調査 (2002 CSI/FBI調査 攻撃場所)
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
パノラマ動画像モデルによる 仮想空間表現システムの研究
第3回  CVにおけるエピポーラ幾何
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
画像処理論.
五段動詞の歌 ごだんどうしのうた.
英語勉強会.
 辞書系(じしょけい).
Chapter 11 Queues 行列.
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
Chris Burgess (1号館1308研究室、内線164)
What did you do, mate? Plain-Past
Verb Plain Negativeform
Training on Planning & Setting Goals
画像特徴(点、直線、領域)の検出と識別-2 呉海元@和歌山大学 2007年5月14日
Only One Flower in the World
SP0 check.
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
Tohoku University Kyo Tsukada
V 03 I do NOT eat sushi. I do NOT do sumo.
A 02 I like sushi! I like origami!
にほんご JPN101 Sep. 23, 2009 (Wednesday).
十年生の 日本語 Year 10 Writing Portfolio
Histograms of Oriented Gradients(HOG)
Reasonので + Consequence clause
Licensing information
Chapter 4 Quiz #2 Verbs Particles を、に、で
The Sacred Deer of 奈良(なら)
Who Is Ready to Survive the Next Big Earthquake?
Did he/she just say that? Get your head out of the gutter! Oh wait….
VTA 02 What do you do on a weekend? しゅうまつ、何をしますか。
線画解析 第3回.
Air Pen -- an introduction of my recent result --
参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社
参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社
Computer Graphics 第3回 座標変換 芝浦工業大学情報工学科 青木 義満
5章  3次元形状を2次元面に投影する 3次元空間内に定義した形状を,2次元面上(ディスプレイのスクリーン面,プリンタの紙面など)に投影して表示するために必要になる変換について説明する.
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
第12回   ディジタル画像(3) ディジタル画像処理(3)
岡山大学 工学部 情報工学科 (大学院自然科学研究科 計算機科学講座) 尺長 研究室
クイズやゲーム形式で紹介した実例です。いずれも過去のインターン作です。
著者:大内和夫 著者:大内和夫 著者:大内和夫 著者:大内和夫 著者:大内和夫 著者:大内和夫.
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
資料 線型変換のイメージ 固有値、固有ベクトル 平賀譲(209研究室) 資料
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
ー生命倫理の授業を通して生徒の意識に何が生じたかー
Created by L. Whittingham
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
英語勉強会:川口英語 Supporting of Continuing Life Habit Improvement Using the Theory of Cognitive Dissonance : System Extension and Evaluation Experiment B4 渡邉.
非等方格子上での クォーク作用の非摂動繰り込み
Cluster EG Face To Face meeting
Grammar Point 2: Describing the locations of objects
重力波解析ライブラリKagaliのためのAntenna pattern functionの作成
英語4技能指導のための 帯活動素材・2 図形再現アクティビティ.
Apply sound transmission to soundproofing
市松模様を使用した カメラキャリブレーション
Improving Strategic Play in Shogi by Using Move Sequence Trees
Presentation transcript:

参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社 視覚の幾何学1 呉海元@和歌山大学 2007年6月11日 参考書 佐藤 淳: 「コンピュータビジョン -視覚の幾何学-」 コロナ社

実際のカメラ ★イメージセンサに受光部と信号処理部を含まれる ●実際に使用するテレビカメラは対象物からの光を受ける受光部(撮像素子)と、受光により発生する微弱な電気信号を処理する信号処理部からなっている   ★イメージセンサに受光部と信号処理部を含まれる ●受光部の前にはレンズが置かれ、光はこのレンズによって集光され、絞りを通して撮像素子(イメージセンサ)に至る ●レンズ系と撮像素子によって、3D空間から2D画像への投影

●実際のカメラではレンズ収差や歪みが生じるため、複数のレンズを組み合わせて、レンズ収差や歪みなどを取り除く

レンズのひずみ(Lens Distortions) (x, y) (xd, yd) k1 , k2 In some real applications, such as accurate 3D measurement and really distorted lens (wide angle lens for example), you really need to consider to remove the distortion. For the purpose of showing you the principle of 3D geometry and calibration let’s forget about the radial distortion for the moment.

ズームレンズの内部構造 ・レンズの配置を変わると  焦点距離を変わる

Single view geometry Camera model Single view geom.

カメラモデル(Camera model) 画像内の一点と3次元空間中の光線の関係 投影・射影関係によって決定 ?   ⇒ この関係を記述するモデルが複数ある ?

投影( Projections ) 投影:m次元からn次元への変換 (m>n) CV: 3D to 2D 投影中心 投影面 投影面 平行投影・正射影 透視投影

理想的なカメラ ●3次元空間のある点から発せられた光はレンズによって一点に集光される ●光がレンズに入射する角度に応じて集光される位置が変わる ●どのような角度で入射した平行な光もすべてある一つの平面上に集光される ☆この平面上に撮像素子を置いておけば,ピントの合った画像が得られる

ピンホール・カメラ(pinhole camera) ●CVの場合には必ずしも実際のカメラの物理的な投影をそのまま考える必要はない ●カメラの幾何学的な性質のみを考えるなら、レンズの中心の一点のみに注目し、撮像素子に至る光は全てこの一点を通過してくるものと考える方が扱いやすい ●このようなカメラをピンホール・カメラと呼ぶ Image plane Pinhole Object

ピンホール・カメラ o f ●撮像素子が置かれる面を画像面I (image plane) Pinhole Object f o 像が上下逆転 ●撮像素子が置かれる面を画像面I (image plane) ●全ての光が通過する点(pinhole)を光学中心o(optical center) ●光学中心と画像面の間の距離を焦点距離f (focal length) 特徴: ●ピント合わせの必要がない ●投影の幾何学的な性質がそのまま保存されている ●視覚の幾何を考えるうえで理想的な性質を持つ

ピンホール・カメラ ●仮想的に画像面(Virtual image plane)を光学中心の前(対象物側)に置くと、像が上下逆転せずに投影される   ⇒ 投影がより扱いやすくなる ●普通、画像面を対象物側に置いて考える    もちろん、光学中心の後ろのまま考える場合もある Image plane Pinhole Object Virtual image plane 画像面の場所によって、 数式の±記号の差がある

Pinhole camera image Amsterdam: what do you see in this picture? straight line size parallelism/angle shape shape of planes depth We may see Objects : river, river bank, cars parking on the bank, buildings, tree in front of the buildings, bridge, sky. Can figure out relative distances – SO WHAT? Do we see the 3D structure with just one images? Let’s first have a look at what geometric properties are preserved in the 2D perspective image. Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam straight line size parallelism/angle shape shape of planes depth Straightness is preserved Proof. x= fX/Z, y=fY/Z: a 3D line in space projects to a 2D line in the image Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam straight line size parallelism/angle shape shape of planes depth Size is inversely proportional to the depth (distance) Z Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam straight line size parallelism/angle shape shape of planes depth In general, the angles and parallelism are not preserved. For example, the right angles of the rectangular building change: Acute angles (smaller than 90) in the nearer end and abtuse angles (greater than 90) in the farther end…. Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam straight line size parallelism/angle shape shape of planes depth The projections of parallel lines converge to a point. --- vanishing point So the shapes usually change How about planes parallel to the image plane… we may not be able to find such a plane in this image, but… Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam straight line size parallelism/angle shape shape of planes parallel to image depth The façade of building in the far end approximately is parallel to the image plane so the shape is preserved Photo by Robert Kosara, robert@kosara.net http://www.kosara.net/gallery/pinholeamsterdam/pic01.html

Pinhole camera image straight line size parallelism/angle shape Amsterdam: what do you see? straight line size parallelism/angle shape shape of planes parallel to image Depth ? stereo motion structure … SO why can we see 3D structure from a single image? We do not see individual pixels, but rather spatial shapes We use knowledge of the objects (RECTANGULAR building, similar size of the cars), river and bank in a plane – perceptual organization (up-down vision) Perspective distortion actually tells us some 3D information: Using the projections of parallel lines in the façade of the building, we can estimate the orientation of the building therefore 3D structure Order of the object, Occlusion, BUT it is extremely hard for a computer to use high level knowledge . Up-down paradigm seems to be the privilege of human visual perception. The state-of-the-art of the computer vision mainly use bottom-up approach. SO Stereo Motion The idea is to recover 3D of each small local pieces (point, line, patch), and then group and segment the 3D point cloud into meaningful objects so that the computer may recognize the objects in images Intermediate results for image and video representations, coding and compression, interactive 3D presentation and event detection image mosaics for entertainment, interface, virtual reality, and monitoring Layered representation (MPEG4) 3D video Motion Detection (of human, cars) for surveillance, traffic monitoring, Human Vision: You can see it but you don't know how you see it. - We see spatial shapes rather than individual pixels - Knowledge: top-down vision belongs to human - Stereo & Motion most successful in 3D CV & application - You can see it but you don't know how…

透視投影 (Perspective Projection) Image plane Pinhole Object Virtual image plane x’ y’ x z y O 簡略されたモデル:

透視投影 (Perspective Projection) 点⇒点 線⇒線 面⇒面 ポリゴン⇒ポリゴン 遠い物体が小さい 奥行き情報が得られない Horizon 消失点

透視投影モデル 仮定: 1.原点をレンズの中心に 2.Z軸と光軸と同じ ●透視投影はZに関し非線形である (x,y,z)から(x’,y’,z’)へ投影: (相似三角関係より) (x’, y’, z’) x z y x’ y’ (x, y, z) z z’ x’ O x 仮定:  1.原点をレンズの中心に  2.Z軸と光軸と同じ (f = Z’) ●透視投影はZに関し非線形である ★幾何関係だけ考える理論系の人はよくf = Z’ =1とする

同次座標系 Homogenous Coordinates

カメラのパラメータ Camera Parameters 画像座標系Image coordinates    (ximage, yimage) 画像中心Image center         (ox, oy) カメラ座標系Camera coordinates   (xcamera, ycamera) ワールド座標系Real world coordinates (X, Y, Z) 焦点距離Focal length           f 画素の有効サイズEffective size of pixel in millimeter                                         (kx, ky)

カメラのパラメータ

カメラの内部パラメータ xim yim Pixel (xim,yim) Y Z X x y O p (x,y,f) ox oy (0,0) Size: (Sx,Sy) fx fy ox oy 内部パラメータ(Intrinsic Camera Parameters)はワールド座標系内のカメラの位置と姿勢と依存しない

カメラの内部パラメータII レンズのひずみLens Distortions k1 , k2 (x, y) (xd, yd) k1 , k2 レンズのひずみLens Distortions In some real applications, such as accurate 3D measurement and really distorted lens (wide angle lens for example), you really need to consider to remove the distortion. For the purpose of showing you the principle of 3D geometry and calibration let’s forget about the radial distortion for the moment. Modeled as simple radial distortions r2 = xd2+yd2 (xd , yd) distorted points k1 , k2: distortion coefficients A model with k2 =0 is still accurate for a CCD sensor of 500x500 with ~5 pixels distortion on the outer boundary

カメラの外部パラメータ Extrinsic Camera Parameters 外部パラメータはワールド座標系内のカメラの位置と姿勢によって決定される 平行移動Translation (3x1ベクトル) 回転Rotation (3x3行列) Zw Xw Yw Y X Z x y O Pw P p xim yim (xim,yim) R t O

平行移動(Translation) (tx, ty, tz) Translation vector

平行移動(Translation) Inverse translation

回転(Rotation) Y Z X (X,Y,Z) ) (X’,Y’,Z’) Z-軸周り

回転(Rotation) X-軸周り Y-軸周り Z-軸周り 回転なし

回転(Rotation) Inverse rotation 回転行列は直交行列!!

回転行列とEuler角 , ,  はX, Y, Z軸周りの回転角 注意: 一回一つの角度しか回転できない 順番と関係がある Rotation Matrix Orthogonal R3 = R1 X R2 R1’, R2’ and R3’ are the three camera axes (X, Y, Z) in the world coordinate system Zw Xw Yw Y X Z O a b g If angle  is small, then cos =1 and sin = また * + = 

カメラのパラメータ ワールド座標系とカメラ座標系の下 tx, ty, tz と r1,1…r3,3 はカメラ外部パラメータ

カメラのパラメータ ワールド座標系と画像座標系の下で

透視投影モデル (x,y,z)から(x’,y’,z’)へ投影: (相似三角関係より) 仮定: 原点をレンズの中心に Z軸と光軸と同じ O x 仮定:  原点をレンズの中心に  Z軸と光軸と同じ (f = Z’) ●透視投影はZに関し非線形である ★幾何関係だけ考える理論系の人はよくf=1とする

ピンホールカメラモデル

正射影 (orthographic projection) ●正射影画像面に垂直な軸に沿って投影するもの ●Z軸方向の情報が失われ, X軸とY軸方向の座標はそのまま保存される ●正射影はZに関し線形であり数学 的にははるかに扱いやすい ●正射影は実際のカメラによる投影 とは掛け離れたものであり,この投影 モデルがCVの分野に応用できる場 合は稀である  

正射影モデル Projection from (x,y,z) to (x’,y’,z’): or (x’, y’, z’) y

弱透視投影(weak perspective projection) ●透視投影は現実のカメラによる投影にきわめて近いが、非線形であり数学的には扱いにくい ●正射影は線形であるが、実際のカメラによる投影とは程遠い ●弱透視投影はこれら二の投影の中間的なものであり、正射影と透視投影を組み合わせた投影である

弱透視投影 Step 1) 対象物を画像面pに平行な平面Pに正射影 この投影は正射影 ⇒ 線形     この投影は正射影 ⇒ 線形 Step 2) その投影像をさらに画像面pへ透視投影  この投影は平面Pから平行な平面pへの投影 ⇒ 均一に拡大或は縮小を行っている       ⇒ 線形  ★弱透視投影は線形

弱透視投影の式(Step 1) ●対象物を画像面pに平行な平面Pに正射影することは、対象物上の各点のX座標とY座標を保存したままZ座標のみ一定の値 即ち、平面PのZ座標であるZ°に変更することに等しい ●この投影は次のように表せる :    X’=X    Y’=Y    Z' =Z°           

弱透視投影の式(Step 2) ●正射影されたものをさらに透視投影される ⇒ 弱透視投影は次のように表せる x = X’/Z’ = X/Z°    ⇒ 弱透視投影は次のように表せる    x = X’/Z’ = X/Z°    y = Y’/Z’ = Y/Z°    Z°は定数 ●これらの式はXとYに関して線形である   ⇒ 投影が線形化された

弱透視投影が成り立つ条件 ●弱透視投影は透視投影の近似である ●この近似の有効範囲は限られている ●弱透視投影では対象物上の各点までの距離Zが一定値Z°で近似できることを前提としている ●対象物のZ軸方向の厚みDがカメラから対象物までの距離Zと比較して十分小さければよい ●D:Zが1:10以上であればこの近似が有効であると考えてよい

1.ピンホールカメラ(透視投影モデル)の原理図を描き、撮影された画像の特徴について述べなさい 出席チェック 1.ピンホールカメラ(透視投影モデル)の原理図を描き、撮影された画像の特徴について述べなさい