デジタルメディア処理2 担当: 井尻 敬 前期の復習 10分 後期の概要 10分 試験の総括 10分.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

デジタルメディア処理2 担当: 井尻 敬 前期の復習 10分 後期の概要 10分 試験の総括 10分

デジタルメディア処理2、2017(前期) 4/13 デジタル画像とは : イントロダクション 4/20 フィルタ処理1 : 画素ごとの濃淡変換、線形フィルタ,非線形フィルタ 4/27 フィルタ処理2 : フーリエ変換,ローパスフィルタ,ハイパスフィルタ 5/11 画像の幾何変換1 : アファイン変換 5/18 画像の幾何変換2 : 画像の補間,イメージモザイキング 5/25 画像領域分割 : 領域拡張法,動的輪郭モデル,グラフカット法, 6/01 前半のまとめ (約30分)と中間試験(約70分) 6/08 特徴検出1 : テンプレートマッチング、コーナー・エッジ検出 6/15 特徴検出2 : DoG、SIFT特徴量、ハフ変換 6/22 画像認識1 : パターン認識概論,サポートベクタマシン 6/29 画像認識2 : ニューラルネットワーク、深層学習 7/06 画像処理演習 : ImageJを使った画像処理 7/13 画像処理演習 : Pythonプログラミング 7/20 後半のまとめ (約30分)と期末試験(約70分)

特徴検出 と パターン認識 8・9回 – パターン・図形・特徴の検出とマッチング 10・11回 -- パターン認識 画像の中から,特定のパターン,コーナー,直線,円,などの特徴点を 検出するアルゴリズムを紹介する 10・11回 -- パターン認識 既存のデータセットからクラス分類を学習し,未知画像がどのクラス属 すかを推測する手法を紹介する 深層学習にも少しだけ触れる

Contents 画像内の特定パターンを発見する手法 テンプレートマッチング 特徴点検出 コーナー検出(Harris corner detector/FAST) エッジ検出(Canny edge detector) その他有名な特徴点(SIFT/BRIEF/ORB) 特徴点の対応付け Hough変換

準備: ノルム(norm) d次元空間のベクトル 𝐱= 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 の p -ノルムは以下の 通り定義される ||𝐱|| 𝑝 = 𝑥 1 𝑝 + 𝑥 2 𝑝 +…+ 𝑥 𝑛 𝑝 1 𝑝 例 d=2のとき p=2なら… 𝐱−𝐲 2 = 𝑥 1 − 𝑦 1 𝟐 + 𝑥 2 − 𝑦 2 𝟐 これはよく知っているユークリッド空間の距離 p=1なら… 𝐱−𝐲 1 = 𝑥 1 − 𝑦 1 +| 𝑥 2 − 𝑦 2 | 点𝐱から点𝐲へ,軸に沿った方向のみで移動した際の距離 市街地における移動距離になぞらえて市街地距離やマンハッタンノルムと呼ばれる 𝐱 𝐱−𝐲 2 𝐲 𝐱−𝐲 1

左の画像から右の画像を探せ ※地味な例ですみません。。。

左の画像から右の画像を探せ ※地味な例ですみません。。。

テンプレート マッチング 入力画像をラスタスキャンし,入力画像とテンプレートの類似度を比較 類似度が閾値より高い部分を出力する templateMatching.py テンプレート マッチング テンプレート 画像 比較 入力画像 入力画像をラスタスキャンし,入力画像とテンプレートの類似度を比較 類似度が閾値より高い部分を出力する ※テンプレート : 検索対象を表す標準画像 ※ラスタスキャン : 画像を左から右に,上から下に,一画素ずつ走査すること

類似度(相違度)の定義 相違度: Sum of Square Distance 𝑅 𝑆𝑆𝐷 = 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 2 𝑅 𝑆𝑆𝐷 = 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 2 相違度: Sum of Absolute Distance 𝑅 𝑆𝐴𝐷 = 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 類似度: Normalized Cross Correlation(正規化相互相関) 𝑅 𝑁𝐶𝐶 = 𝑖,𝑗 𝐼 𝑖,𝑗 𝑇 𝑖,𝑗 𝑖,𝑗 𝐼 𝑖,𝑗 2 𝑖,𝑗 𝑇 𝑖,𝑗 2 入力画像 𝐼 𝑖,𝑗 テンプレート 𝑇 𝑖,𝑗 Grayscale化 されている

テンプレートマッチングの結果 SAD SSD NCC SAD/SSDは相違度なので,近いところほど値が小さくなる templateMaching.py テンプレートマッチングの結果 テンプレート SAD SSD NCC 入力画像 𝑖,𝑗 𝐼 𝑖,𝑗 𝑇 𝑖,𝑗 𝑖,𝑗 𝐼 𝑖,𝑗 2 𝑖,𝑗 𝑇 𝑖,𝑗 2 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 2 SAD/SSDは相違度なので,近いところほど値が小さくなる NCCは類似度なので近いところほど値が大きくなる 例えば,閾値以下の局所最小部を検出対象とすればよい

テンプレートマッチングの結果 SAD SSD NCC SAD/SSDは相違度なので,近いところほど値が小さくなる templateMaching.py テンプレートマッチングの結果 テンプレート SAD SSD NCC 𝑖,𝑗 𝐼 𝑖,𝑗 𝑇 𝑖,𝑗 𝑖,𝑗 𝐼 𝑖,𝑗 2 𝑖,𝑗 𝑇 𝑖,𝑗 2 入力画像 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 𝑖,𝑗 𝐼 𝑖,𝑗 −𝑇 𝑖,𝑗 2 SAD/SSDは相違度なので,近いところほど値が小さくなる NCCは類似度なので近いところほど値が大きくなる 例えば,閾値以下の局所最小部を検出対象とすればよい

類似度・相違度の意味的理解 𝐯 𝐼 , 𝐯 𝑇 ∈ 𝑅 𝑊𝐻 𝑅 𝑊𝐻 空間 入力画像・テンプレートは W x H グレースケール画像 これを (WH)-次元ベクトルと考える 入力画像 𝐼 𝑖,𝑗 テンプレート 𝑇 𝑖,𝑗 𝐯 𝐼 𝑅 𝑆𝑆𝐷 は 𝐯 𝐼 , 𝐯 𝑇 のユークリッド距離 𝑅 𝑆A𝐷 は 𝐯 𝐼 , 𝐯 𝑇 の市街地距離 𝑅 𝑆𝑆𝐷 𝑅 NCC は 𝐯 𝐼 , 𝐯 𝑇 の角度 𝐯 𝑇 𝑅 𝑆A𝐷 𝐯 𝐼 , 𝐯 𝑇 ∈ 𝑅 𝑊𝐻 𝑅 𝑁𝐶𝐶 𝑅 𝑊𝐻 空間

サブピクセル精度のテンプレートマッチング テンプレートマッチングは目的画像にテンプレート画像を重ね差 分を評価するため発見できる位置はピクセル単位(離散値) サブピクセル(連続値)精度で位置検出を行いたい 局所的に関数をフィッティングし,最小値を求める  等角直線フィッテイング  パラボラフィッティング

サブピクセル精度のテンプレートマッチング 相違度 位置 -1 1 f-1 f0 f1 問題 相違度が最小の画素を原点(x=0)にとる x=±1 の相違度も既知 最小値を与える位置xを実数精度で求める ※画像に適用する際は縦横を独立に扱えば良い 等角直線フィッティング 下図の通り傾きが-1倍の2本の直線の交点を利用 パラボラフィッティング 二次関数で相違度を補間し相違度の最小位置を求める -1 1 f-1 f0 f1 -1 1 f-1 f0 f1 x X = ½ (f1 – f-1) / (f0 – f-1) f-1 > f1 X = ½ (f1 – f-1) / (f0 – f-1) otherwise X = (f-1 – f1) / (2f-1 – 4f0 + 2f1) x = x = x f-1 > f1 のときは、 f-1 と f0 を通る直線と, f1を通る直線を考える

テンプレートマッチングの高速化 W×H w×h 対象画像全領域にテンプレートを重ね合わ せて差分を計算する計算複雑度は… 残差逐次検定 : 目標画像をラスタスキャンしテン プレートとの差分計算をする際,現在の最小値よりも 差分が大きくなったら計算を打ち切る 粗密探査法 : ガウシアンピラミッドを生成.低解 像度画像にてマッチングする画素を発見.ひとレベル 高解像度画像に移動し,発見した画素に関係する数画 素のみに対してマッチングを計算する 教科書 図11.5 © CG ARTS協会

復習: Steepest descent - 最急降下法 最小化問題 関数𝑓(𝐱)を最小化する𝐱を求めよ arg min 𝐱 𝑓(𝐱)      ※ 関数𝑓(𝐱)の形が分かっていて𝛻𝑓(𝐱)=𝟎が解けるならそれで よいが,そうでない場合に使える手法の一つが最急降下法 例 f(x,y) = x^2 + y^2 最急降下法 1. 𝐱 0 を初期解とする(何らかの方法で発見する) 2. 変化が十分少なくなるまで以下を繰り返す 𝐱 𝑡+1 = 𝐱 𝑡 −ℎ𝛻𝑓 𝐱  

Chamfer Matching 入力画像 I のエッジ画像 𝐼 𝐸 𝑥,𝑦 を生成し, エッジ画素からの距離画像 𝐼 𝐷𝑇 を計算 相違度を以下の通り定義する 𝑆 𝑥,𝑦 = 𝑣=0 𝐻 𝑢=0 𝐻 𝑇 𝐸 𝑢,𝑣 𝐼 𝐷𝑇 𝑥+𝑢,𝑦+𝑣 ※ エッジ画素上で距離画像をサンプリング ※ テンプレート全体を見ないので高速 教科書図 11.7

Chamfer Matching 3. 相違度を以下の通り定義する 𝑆 𝑥,𝑦 = 𝑣=0 𝐻 𝑢=0 𝑊 𝑇 𝐸 𝑢,𝑣 𝐼 𝐷𝑇 𝑥+𝑢,𝑦+𝑣 4. 初期位置 𝑥 0 , 𝑦 0 から最急降下法により 相違度が最小となる位置を探索する 𝑥 𝑡+1 𝑦 𝑡+1 = 𝑥 𝑡 𝑦 𝑡 −𝛻𝑆 𝑥,𝑦 ※勾配の式は以下の通り 𝛻𝑆 𝑥,𝑦 = 𝑣 𝑢 𝑇 𝐸 𝑢,𝑣 𝜕 𝜕𝑥 𝐼 𝐷𝑇 𝑥+𝑢,𝑦+𝑣 𝑣 𝑢 𝑇 𝐸 𝑢,𝑣 𝜕 𝜕𝑦 𝐼 𝐷𝑇 𝑥+𝑢,𝑦+𝑣 教科書図 11.7

まとめ : テンプレートマッチング 入力画像から物体を検出するための手法 検出対象の画像(テンプレート)を用意し, 入力画像をラスタスキャンし相違度を評価 相違度が閾値以下の領域を出力する 相違(類似)度 : SAD, SSD, NCCなど テンプレート 入力画像 サブピクセル精度で検出するための関数フィッティング 高速化のための残差逐次検定・粗密(coarse to fine)探索・chamfer matching

(Harris Corner Detector) HarrisCorner.py CannyEdge.py コーナー、輪郭線の検出 物体認識・物体追跡・位置あわせなど,より高度な画像処理に利用するため 画像から『コーナー』や『輪郭線』といった特徴的な点・曲線を検出する コーナー検出 (Harris Corner Detector) 輪郭検出 (Canny Edge detector)

Harrisのコーナー検出アルゴリズム [C. Harris & M. Stephens (1988) Harrisのコーナー検出アルゴリズム [C. Harris & M. Stephens (1988). "A Combined Corner and Edge Detector". Proc. of the 4th ALVEY Vision Conference. pp. 147–151.] 入力 : グレースケール画像 出力 : コーナー画素群 手法の概要 Harris行列 (又はStructure tensor matrixと呼ばれる)を定義し,この固有値固 有ベクトルを用いて,局所領域の輝度変化方向と変化量を検出する 局所領域の輝度変化が,直交する2方向について大きくなる部分をコーナーと定義

Structure tensor matrix (1/3) ※ 上で理解できる人はよいのですが、そうでない人は… ※ なんか画像の各画素(x,y)に行列𝐀 𝑥,𝑦 が定義された,,,ことを確認してください Structure tensor matrix (1/3) 画像上の点(x,y)の輝度値をI(x,y)と表す 点(x,y)におけるStructure tensor matrixは以下の通り定義される 𝐀 𝑥,𝑦 = 𝑢,𝑣 𝐺 𝑢,𝑣 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 ただし、 𝐼 𝑦 = 𝐼 𝑦 𝑥+𝑢,𝑦+𝑣 ,  𝐼 𝑥 = 𝐼 𝑥 𝑥+𝑢,𝑦+𝑣  と省略したもの 𝐼 𝑥 と 𝐼 𝑦 は画像の微分(sobel filter) また、𝐺 𝑢,𝑣 は重み関数(ガウシアンを用いる) ※教科書の式11.6 ~ 11.9に対応する

Structure tensor matrix (2/3) 実際の計算手順 Structure Tensorの性質 固有値を 𝜆 1 , 𝜆 2 とする ( 𝜆 1 > 𝜆 2 ) 固有ベクトルを 𝐯 1 , 𝐯 2 とする 対象行列  固有値は実数 対象行列  固有ベクトルは直交 半正定置  𝜆 1 ,≥0, 𝜆 2 ≥0 半正定置行列の和なので. 𝐯 1 は輝度値変化の最も大きな方向 𝜆 1 は 𝐯 1 方向の輝度値変化の大きさ 𝜆 2 は 𝐯 2 方向の輝度値変化の大きさ 𝐀 𝑥,𝑦 = 𝑢,𝑣 𝐺 𝑢,𝑣 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 𝐺 𝑢,𝑣 中心からの距離に応じて 重み付けして足し合わせる 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 𝑥,𝑦 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 𝐼 𝑥,𝑦

Structure tensor matrix (3/3) 𝐯 1 𝐯 2 𝜆 1 :小 𝜆 2 :小 𝐯 1 𝐯 2 𝜆 1 :大 𝜆 2 :小 𝐯 1 𝐯 2 𝜆 1 :大 𝜆 2 :大 Structure Tensor Matrixの二つの固有値は,局所領域の輝度値変 化の様子に依存して大小が変化する (小, 小)  全体的に変化がすくない  : フラット (大, 小)  ある方向にのみ大きく変化 : エッジ (大, 大)  2方向に大きく変化 : コーナー !

Harrisのコーナー検出アルゴリズム Corner Edge Flat Edge 𝜆 2 グレースケール画像からコーナーを検出 𝜆 1 各画素(x,y)におけるStructure Tensor 𝐀 と固有値 𝜆 1 , 𝜆 2 を計算 各画素(x,y)において𝑅= 𝜆 1 𝜆 2 −𝑘 𝜆 1 + 𝜆 2 2 を計算 Rが極大かつ閾値以上の点をコーナーとして出力する ※ただし,𝑘はユーザが指定するパラメタ (0.04~0.06) ※𝑅= 𝜆 1 𝜆 2 −𝑘 𝜆 1 + 𝜆 2 2 は,コーナーらしさを現す関数 : 𝜆 1 と 𝜆 2 が大きくかつ近いときに大きな値を返す Edge Flat Edge 𝜆 1 評価式Rの3Dプロット  http://www.wolframalpha.com/input/?i=z%3Dx*y+-+0.02*(x%2By)%5E2

Harrisのコーナー検出アルゴリズム グレースケール画像からコーナーを検出 固有値の計算時間が無駄 det 𝐀 = 𝜆 1 × 𝜆 2 各画素(x,y)におけるStructure Tensor 𝐀 と固有値 𝜆 1 , 𝜆 2 を計算 各画素(x,y)において𝑅= 𝜆 1 𝜆 2 −𝑘 𝜆 1 + 𝜆 2 2 を計算 Rが極大かつ閾値以上の点をコーナーとして出力する 固有値の計算時間が無駄   det 𝐀 = 𝜆 1 × 𝜆 2   tr 𝐀 = 𝜆 1 + 𝜆 2 という関係を利用すると 計算を効率化できる ※練習) 上記の関係を証明せよ グレースケール画像からコーナーを検出 new 各画素(x,y)におけるStructure Tensor 𝐀 を計算 各画素(x,y)において𝑅= det 𝐀 −𝑘 tr 𝐀 2 を計算 Rが極大かつ閾値以上の点をコーナーとして出力する

Harrisのコーナー検出アルゴリズム(実装例)

Cannyの輪郭線検出アルゴリズム(1/2) ※井尻はキャニーと呼んでます が、教科書はケニーですね。。。 1. ガウシアンフィルタをかける : 𝐼 →𝐺∗𝐼 例) 5x5, σ=1.4 のガウシアンなどが利用される 2. 勾配強度・勾配方向計算   Sobel filterにより縦横方向の微分を計算 : 𝐼→ 𝐼 𝑥 , 𝐼 𝑦      勾配強度 : 𝑔 𝑥,𝑦 = 𝐼 𝑥 𝑥,𝑦 2 + 𝐼 𝑦 𝑥,𝑦 2   勾配方向 : 𝑑 𝑥,𝑦 = tan −1 𝐼 𝑦 𝑥,𝑦 𝐼 𝑥 𝑥,𝑦   (0°/45°/90°/135°の4通りに量子化) 実装を分かりやすくするため、ガウシアンかけてから、微分をとると説明しているけど。 本当は Gx * I と Gy * I を計算する. 0° 45° 90° 135° 参考: OpenCV http://docs.opencv.org/2.4/doc/tutorials/imgproc/imgtrans/canny_detector/canny_detector.html 原著論文: Canny, J., A Computational Approach To Edge Detection, IEEE PAMI, 1986.

Cannyの輪郭線検出アルゴリズム(2/2) 0° 45° 90° 135° 3. non-maximum suppression 細い輪郭線抽出のため,勾配強度が極大となる画素のみを残す 各画素xに対して…  勾配方向に隣接する2画素p,qとxの勾配強度を比較  画素xの勾配強度がp,qと比べて最大でないならxの勾配強度を0に 4. 閾値処理 二つの閾値TmaxとTminを用意 画素xの勾配強度が… Tmaxより大きい  Strong edge: 画素xは輪郭線である Tminより小さい  not edge : 画素xは輪郭線でない それ以外     week edge: もしstrong edgeに隣接していれ ば輪郭線とする q x p 0° 45° 90° 135° 3. Non maximum suppression   8近傍の極大を見てはだめ。   エッジ方向を考えて、エッジと垂直な方向のみを考慮して極大を計算しないとだめ   図を描いて説明したほうが良いかも 4閾値処理: なぜ二つの閾値を利用するかが大切。  本当のエッジとノイズによるエッジが存在する。  Week edgeは両者を含んでしまう。  本当のエッジなのに、ノイズや陰影など何かしらの影響で勾配強度が弱い画素はweekエッジになる。  ただしそのようなweek edgeはStrong edgeに隣接していることが多い。そのためStrong edgeが近傍にあればエッジとして受け入れる. ※紹介したものは実装の一例です.

Cannyの輪郭線検出アルゴリズム(実装例)

まとめ : コーナー・輪郭検出 コーナー検出:画像中の『角』形状を検出 輪郭検出 : 画像中の物体と物体の境界を検出 Harris Corner detection  Structure Tensorの固有値により角らしさを定義 様々な手法が知られる(FAST/SUSAN/ヘッセ行列) 輪郭検出 : 画像中の物体と物体の境界を検出 Canny Edge Detection 微分フィルタによる勾配画像取得 勾配方向を考慮した細線化 二つの閾値処理 様々な手法が知られる(Sobel/Hough変換…)

補足資料 最近読んだ・見た面白かった論文紹介 Texture Synthesis Seam Curving Visual Microphone SIGGRAPH 2016全部読み ガウシアン畳み込みのはなし 線形フィルタのセパレート実装のはなし ガウシアンピラミッドのはなし 補足資料

Structure Tensor Matrix(導出) B (u,v) (x,y) Structure Tensor Matrix(導出) 画像上で『点(u,v)を中心とする領域A』と『微少量(x,y) だけ動かした領域B』を考える 領域AとBの差分を,重みを考慮して定義する; 𝐷 𝑥,𝑦 = 𝑥,𝑦 𝐺 𝑥,𝑦 𝐼 𝑢+𝑥,𝑣+𝑦 −𝐼 𝑥,𝑦 2  …(1) ※ 重み関数G(x,y)には,ガウシアンがよく用いられる. テーラー展開し二次以降の項を無視すると,以下の変形が得られる 𝐼 𝑢+𝑥,𝑣+𝑦 ≈𝐼 𝑢,𝑣 +𝑥 𝐼 𝑥 𝑢,𝑣 +𝑦 𝐼 𝑦 𝑢,𝑣   これを(1)に代入すると, 以下の通りStructure Tensor Matrixが現れる 𝐷 𝑥,𝑦 = 𝑥,𝑦 𝐀 𝑥 𝑦 , 𝐀= 𝑥,𝑦 𝐺 𝑥,𝑦 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦

Structure Tensor Matrix(導出) B (u,v) (x,y) Structure Tensor Matrix(導出) 画像上で『点(u,v)を中心とする領域A』と『微少量(x,y)だけ動 かした領域B』の差は以下の通り 𝐷 𝑥,𝑦 = 𝑥,𝑦 𝐀 𝑥 𝑦 , 𝐀= 𝑥,𝑦 𝐺 𝑥,𝑦 𝐼 𝑥 𝐼 𝑥 𝐼 𝑥 𝐼 𝑦 𝐼 𝑥 𝐼 𝑦 𝐼 𝑦 𝐼 𝑦 今知りたいのは,どの方向(x,y)に動かすと差分が最大になるか?つまり, 画像の変化が大きいか?である.そのため以下の最大化問題を考える. 𝑎𝑟𝑔𝑚𝑎𝑥 𝑥,𝑦 𝐀 𝑥 𝑦 𝑥,𝑦 𝑥 𝑦 この目的関数はレイリー商と呼ばれ,(x,y)が行列Aの固有ベクトルに一致 するとき,最大値(最小値)をとり,最大値・最小値は固有値と一致する ことが知られている(証明省略). つまり,Structure Tensor matrixの固有値固有ベクトルを 𝜆 1 , 𝜆 2 ( 𝜆 1 > 𝜆 2 ) 𝐯 1 , 𝐯 2 とすると,(x,y)が 𝐯 1 に一致するときに画像は最も大きく変化する. また(x,y)が 𝐯 2 に一致するとき画像の変化は最小になる.