画像処理ボード上での 高速テンプレートマッチングの 実装と検証

Slides:



Advertisements
Similar presentations
FPGA 株式会社アプライド・マーケティング 大越 章司
Advertisements

多入力パルス波高分析システムの開発 環境計測 小栗 康平  京都府立大学 環境情報学科 環境計測 卒論発表会.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Chapter11-4(前半) 加藤健.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
2000年 3月 10日 日本電信電話株式会社 三菱電機株式会社
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
RoboVision e-nuvo IMAGEシリーズ リアルタイム画像認識モジュール
マイコン入門実践教育プロセス説明 第4システム部 ES443 塩島秀樹.
計算機システムⅡ 主記憶装置とALU,レジスタの制御
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
Smart-USBを利用した開発設計の メリットとデメリット 有限会社プライムシステムズ
オリジナルなCPUの開発 指導教授:笠原 宏 05IE063 戸塚 雄太 05IE074 橋本 将平 05IE089 牧野 政道
App. A アセンブラ、リンカ、 SPIMシミュレータ
FPGAを用いたMG3用 インターフェース回路の解説
計算機システム ハードウェア編(第3回) ~ ノイマン型コンピュータ ~.
Fire Tom Wada IE dept. Univ. of the Ryukyus
プログラムはなぜ動くのか.
オペレーティングシステム i386アーキテクチャ(2)
割り込み.
割り込み.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
パソコンの歴史 ~1970年 1970年代 1980年代 1990年~ ▲1946 ENIAC(世界最初の計算機、1,900加算/秒, 18,000素子) ▲1947 UNIVACⅠ(最初の商用計算機) ▲1964 IBM System/360(5.1MHz, 1MB, 2億円) ▲1974 インテル8080(8.
専門演習Ⅰ 国際経済学部 国際産業情報学科 2年 石川 愛
第7回 2006/6/12.
汎用テストベンチ作成ツール を用いた シミュレーションからテストまで
Occam言語による マルチプリエンプティブシステムの 実装と検証
型付きアセンブリ言語を用いた安全なカーネル拡張
OpenMPハードウェア動作合成システムの検証(Ⅰ)
高速剰余算アルゴリズムとそのハードウェア実装についての研究
読み出し回路のアップグレードに向けた研究
序章 第2節 教育機器とコンピュータ 1 パーソナルコンピュータ
1.コンピュータと情報処理 p.18 第1章第1節 2.コンピュータの動作のしくみ CPUと論理回路
動的依存グラフの3-gramを用いた 実行トレースの比較手法
MPIとOpenMPを用いた Nクイーン問題の並列化
マイコンによるLEDの点灯制御 T22R003 川原 岳斗.
リモートホストの異常を検知するための GPUとの直接通信機構
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
Ibaraki Univ. Dept of Electrical & Electronic Eng.
FPGA 株式会社アプライド・マーケティング 大越 章司
各種ソート回路のハードウェア化と ハード/ソフト最適分割化の検討
DDRターミネーションレギュレータの使用法 - 何個のメモリを駆動できるのか -
ディジタル回路の設計と CADによるシステム設計
情報処理 タイマの基礎 R8C タイマの基礎.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
信号伝搬時間の電源電圧依存性の制御 による超伝導単一磁束量子回路の 動作余裕度の改善
先週の復習: CPU が働く仕組み コンピュータの構造 pp 制御装置+演算装置+レジスタ 制御装置がなければ電卓と同様
Fire Tom Wada IE dept. Univ. of the Ryukyus
第5回 メモリ管理(2) オーバレイ方式 論理アドレスとプログラムの再配置 静的再配置と動的再配置 仮想記憶とメモリ階層 セグメンテーション
Ibaraki Univ. Dept of Electrical & Electronic Eng.
コンピュータアーキテクチャ 第 9 回.
Handel-Cを用いた パックマンの設計
コンピュータアーキテクチャ 第 2 回.
外付けLVDSを選択する場面は? ■外付けLVDSバッファのメリットは? FPGA+外付けLVDSバッファ LVDSドライバ内蔵FPGA
2013年度 プログラミングⅠ ~ 内部構造と動作の仕組み(2) ~.
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
コンピュータアーキテクチャ 第 2 回.
コンピュータアーキテクチャ 第 5 回.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Cソースコード解析による ハード/ソフト最適分割システムの構築
計算機アーキテクチャ1 (計算機構成論(再)) 第二回 命令の種類と形式
第4回 CPUの役割と仕組み2 命令の解析と実行、クロック、レジスタ
プロセッサ設計支援ツールを用いた 独自プロセッサの設計
コンピュータアーキテクチャ 第 9 回.
コンピュータアーキテクチャ 第 5 回.
信号伝搬時間の電源電圧依存性の制御 による超伝導単一磁束量子回路の 動作余裕度の改善
並列処理プロセッサへの 実数演算機構の開発
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Presentation transcript:

画像処理ボード上での 高速テンプレートマッチングの 実装と検証 高性能計算研究室 B4 川本隆志 2005/2/24 1.研究背景・研究目的 2.実装ターゲットボードと設計環境 3.テンプレートマッチングの定義 4.簡易テンプレートマッチングの設計 5.高速テンプレートマッチングの設計 6.ボード上での検証と性能評価

研究背景 研究目的 システムLSIの回路規模の拡大 ハードウェア記述言語によるトップダウン設計 フラットパネル・ディスプレイの需要の高まり 市場規模 1998年:約100億ドル→2004年:約400億ドル(米DisplaySearchデータ) 研究目的 産学共同研究におけるガラス外観検査装置の開発 FPGAを用いた画像処理(テンプレートマッチング)の高速化

実装ターゲットボード(TSUNAMI) 設計環境 Altera Stratix FPGA SRAM SRAM SDRAM SDRAM External I/O Mezzanine I/O Card Local Bus Configuration PLD Address Decode PLD PLX PCI9656 Device PCI Bus 設計環境 Altera社の統合開発環境ツールQuartusIIとシミュレーションツールModelSimを使用 ハードウェア記述言語VHDLで設計

テンプレートマッチングとは 設計したテンプレートマッチングの種類 簡易テンプレートマッチング 高速テンプレートマッチング 重ね合わせることにより比較照合 テンプレート 対象画像 一致しているかどうかを判断 設計したテンプレートマッチングの種類 簡易テンプレートマッチング 一般的な定義に忠実な手法 高速テンプレートマッチング 十字型の特徴に着目した、比較照合の少ない手法

簡易テンプレートマッチングの手法 …… 対象画像(2値化) 1画素ずつ ずらしながら 切り出していく 全ての画素に対して、対応する画素の差を取る 切り出し部分 1 1 1 1 1 テンプレート(2値化) 画素毎の差を積算し、その部分の相違度とする

簡易テンプレートマッチングの構成 対象画像 メモリアドレス ジェネレータ 対象画像 メモリ 8ビット セレクタ - 一時メモリ アドレス 対象画像:1024x1024画素 テンプレート:8x8画素 対象画像 メモリアドレス ジェネレータ 対象画像 メモリ 8ビット セレクタ - 一時メモリ アドレス ジェネ レータ 一時メモリ タイミング ジェネ レータ 結果 アキュムレータ 開始信号 マッチング座標 制御 ユニット 最小相違度 保持ユニット テンプレート メモリ アドレス ジェネレータ テンプレート メモリ マッチング処理ユニット

改良アルゴリズムを用いた高速化(1) 111......111 ???......??? 明らかに マッチして いない マッチング処理の回数を減らす マッチング処理を 行う 中央のラインの いずれかのビットが1 111......111 ???......??? 切り出し部分 明らかに マッチして いない マッチング処理を 行わない 中央のラインの 全てのビットが0

改良アルゴリズムを用いた高速化(2) 対象画像 切り出す回数を少なくする マッチング部分に 近づいている可能性が あるときだけ 少しずつずらす 対象画像 切り出し部分 大きくずらしながら 切り出すことで 比較照合の回数を 少なくする 1 1

高速テンプレートマッチングの構成 SRAM 開始信号 対象画像:1024x1024画素 テンプレート:32x32画素 FPGA外部 レジスタ レジスタ FPGA内部 レジスタ レジスタ 結果書き戻し ユニット 終了信号 マッチング座標 相違度 計算ユニット SRAM リ-ド アドレス ジェネ レータ タイミング ジェネ レータ ワード セレクタ 結果 アキュムレータ ブロックセレクタ 開始信号 一時 メモリ 最小相違度 保持ユニット 制御 ユニット テンプレート メモリ マッチング処理ユニット

ボード上での実装と検証の方法 ホストPC ④ ⑥ ② ③ ⑦ ⑤ TSUNAMIボード QuartusII ① TSUNAMI専用API 回路構成情報 TSUNAMI専用API ④ ⑥ ② ③ ⑦ 開始 信号 終了割り込み信号 回路構成情報 画像 マッチング座標 FPGA マッチング座標 SRAM レジスタ 画像 ⑤ TSUNAMIボード

実行クロック数の比較と性能評価 ボードに依存しない部分の高速化についてはソフトに対して数倍の性能向上が得られた TSUNAMIボード上での正常な動作を確認 簡易Cに対して高速Cが最小で約236分の1 高速Cに対して、VHDLシミュレーションの結果が最小で約7分の1だが、TSUNAMI上での結果は最大で約1.9倍となった TSUNAMIボード上のSRAMの1回のリードアクセス(32ビット)に10クロック程度もかかることが原因 ボードに依存しない部分の高速化についてはソフトに対して数倍の性能向上が得られた

まとめ 今後の課題 ガラス外観検査装置の開発のためのテンプレートマッチングの設計 改良アルゴリズムによる高速化 高速テンプレートマッチングのFPGA上への実装と検証・性能評価 今後の課題 画像サイズが可変の場合に対応させる アフィン変換の機能を追加