太原研究室 M1 割田臣一.  既に述べたように、イメージフィルタは一般に、 動作しているイメージデータの画面に作用する。 ◦ この例では、 3×3 ウィンドウ上でフィルタを作用させる。 ◦ 処理においては 3 つの新しい値と、先程のピクセルの計 算で用いた 6 つの同じ値を使う。  カラム(

Slides:



Advertisements
Similar presentations
画像処理 05A1027 後藤航太. 研究課題は openLDAP についてでしたが 今回から画像処理に変更しました。 変更した理由 自分が持っていたイメージと実際の openLDAP が違ったので変更を決 めま した。 画像処理に興味を持ったので これからは画像処理を研究課題として やっていきます。
Advertisements

コンピュータウイル ス ~ウイルスの感染を防ぐには~. ( 1 )コンピュータウイルスとはどんなもの なのか、 どんな被害を及ぼすのかを知る。 ( 2 )コンピュータウイルスに感染しないた めの 方法を知る。 1 課 題 ウイルスの感染を防ぐに は.
画像情報処理 1 プログラミング課題 知的画像処理研究室 M2 大村 瑞穂. 目次 プログラミング課題の準備 – ファイルのダウンロード・解凍・コンパイル サンプルプログラムの説明 画像処理の方法 レポートに載せる画像について 例題と第 1 回レポート課題.
4 相互作用図 後半 FM13001 青野大樹.
プログラミング演習3 李 亜民クラス 第2回 ラスタライズ.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Chapter11-4(前半) 加藤健.
実地棚卸/棚卸検数 & 在庫調整 SAP Best Practices.
C言語 配列 2016年 吉田研究室.
情報基礎演習B 後半第5回 担当 岩村 TA 谷本君.
計算機システムⅡ 主記憶装置とALU,レジスタの制御
計算機アーキテクチャ特論Chapter.6.6~6.9
Chapter 5. Describing a FIR Filter 5.3後半~5.6
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
オペレーティングシステムJ/K 2004年10月7日
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
ブロック線図によるシミュレーション ブロック線図の作成と編集 ブロック線図の保存と読込み ブロック線図の印刷 グラフの印刷
担当:青木義満 情報工学科 3年生対象 専門科目 システムプログラミング システムプログラミング プロセス間通信(パイプ) 担当:青木義満
第4章 Impulse C の導入 安達ほのか シグナルやストリーム 、メモリーは型だからそのまま訳す.
システム開発実験No.7        解 説       “論理式の簡略化方法”.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
データ構造とアルゴリズム論 第2章 配列(構造)を使った処理
第5回 CPUの役割と仕組み3 割り込み、パイプライン、並列処理
画像処理ボード上での 高速テンプレートマッチングの 実装と検証
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
Ibaraki Univ. Dept of Electrical & Electronic Eng.
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
アスペクト指向プログラミングを用いたIDSオフロード
プログラム実行履歴を用いたトランザクションファンクション抽出手法
Occam言語による マルチプリエンプティブシステムの 実装と検証
高速剰余算アルゴリズムとそのハードウェア実装についての研究
プログラミング 2 ファイル処理.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
動的依存グラフの3-gramを用いた 実行トレースの比較手法
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
オペレーティングシステムJ/K (仮想記憶管理)
ゲーム開発モデルの基礎.
デジタル画像とC言語.
プログラミング基礎a 第7回 C言語によるプログラミング入門 ファイル入出力
GPSを使わないBebop Droneの 自動飛行
先進的計算基盤システムシンポジウム SACSIS2007併設企画 マルチコアプログラミングコンテスト 「Cellスピードチャレンジ2007」
プログラミング 4 整列アルゴリズム.
15K1117 下窪 聖人 15K1013 坂本 倖輝 15K1112 黒川 晶太 15K1015 関根 修斗
バイトコードを単位とするJavaスライスシステムの試作
OSが管理している、デフォルトの入出力装置 入力:stdin キーボード 出力:stdout モニタ(コマンドプロンプトの画面)
情報とコンピュータ 静岡大学工学部 安藤和敏
JAVAバイトコードにおける データ依存解析手法の提案と実装
明星大学 情報学科 2012年度前期     情報技術Ⅰ   第1回
アルゴリズムとプログラミング (Algorithms and Programming)
Ibaraki Univ. Dept of Electrical & Electronic Eng.
コンピュータアーキテクチャ 第 9 回.
Handel-Cを用いた パックマンの設計
5.チューリングマシンと計算.
保守請負時を対象とした 労力見積のためのメトリクスの提案
オペレーティングシステムJ/K (並行プロセスと並行プログラミング)
精密工学科プログラミング基礎 第7回資料 (11/27実施)
ILC衝突点ビームモニターのための 読み出し回路の開発
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
コンパイラ 2012年10月11日
プログラミング基礎a 第7回 C言語によるプログラミング入門 ファイル入出力
精密工学科プログラミング基礎Ⅱ 第2回資料 今回の授業で習得してほしいこと: 配列の使い方 (今回は1次元,次回は2次元をやります.)
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
明星大学 情報学科 2014年度前期     情報技術Ⅰ   第1回
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Presentation transcript:

太原研究室 M1 割田臣一

 既に述べたように、イメージフィルタは一般に、 動作しているイメージデータの画面に作用する。 ◦ この例では、 3×3 ウィンドウ上でフィルタを作用させる。 ◦ 処理においては 3 つの新しい値と、先程のピクセルの計 算で用いた 6 つの同じ値を使う。  カラム( column ):縦方向の列、数学で列 ⇔ row(横方向の列、数学で行)

 カラム生成プログラムは左から右に処理を進め、 どんなサイクルにおいても 3 ピクセルの行のスト リームを発生させる。  このストリームは、 3 つの新しい値に対応する 1 つ の 3 ピクセル列に相当する。  3 つの新しい値は、フィルタによって次の処理対 象となるピクセルのフィルタ画面において必要と される。

 Prep_run プロセスは、オリジナルのアルゴリズム 同様 3 ピクセルの列データを生み出すのに十分な データ量をバッファリングするが、より簡単な方 法でバッファリングを行う。  オリジナルのアルゴリズムの性能にてネックとな るのが、 1 つのバッファからピクセルの値を取得 する方法であった。  バッファは全てのピクセルを含んでおり、「前を 見る」「後ろを見る」ためにある画像の行全体を 必要とした。

 イメージフィルタの性能を向上させるためには、 同じメモリへのアクセス回数を減少させたい。  そのために、要求された計算を実行する際の繰り 返し回数を減らしたい。 ⇒7 、 10 章で述べた配列を分割する技法を用いるこ とで一度のループで同じ配列にアクセスする必要 性を失くす。  その結果、 2 クロックに 1 回ピクセルの列を生み出 すことで非常に高いスループットを実現できる。 → 図 参照

 この過程は ◦ 1 つのピクセルのストリームを受け入れる ◦ 配列 B,C に 2 つのスキャンラインをキャッシュする ◦ オリジナルの例と似た循環バッファ技術を用いることで 3 つの出力ストリームを生成する。 ※ スキャンライン:ディスプレイの走査線、画像の横 1 列 ⇒ 同じ配列への不要なアクセスを避けることで、そ れぞれの列の出力の待ち時間を 2 クロックにでき る。

 このパイプラインで最も大切な過程はフィルタ自 身。 これは図 における filtter_run で表さ れる。  この過程は prep_run プロセスによって生成された 3 つのピクセルのストリームを受け入れ、オリジ ナルのアルゴリズムと同様の畳み込みを行う。  この畳み込みにおいて、多数のステートメントレ ベルの最適化は入力処理の繰り返し回数を減らす ことに繋がる。

 オリジナルの手法で行われたように、隣接するピクセ ルは配列から呼び出されること無く、ローカル変数 p01,p02,p03 等に格納される。 ◦ これにより、 1 つの配列に同時にアクセスをする必要がなくな る。 ◦ 1 つの配列に同時にアクセスをしてしまうと、オプティマイザ が単一のステージにて複数の計算を同時に行うことが妨げら れる。  水平、垂直、斜め方向における座標の違いの計算は、 より単純で並列化が可能な計算に置き換えられる。 ◦ これにより、 abs( 絶対値 ) 機能やマクロの必要性をなくせる。 ◦ この場合、中心のピクセルは繰り返し周辺のピクセルと比 較され、平均差が得られる。

 これらの変化によって、僅か 2 クロックのスルー プット率のエッジ検出アルゴリズムが実現される。  もちろん、この計算は他のタイプの畳み込みを行 う様に必要に応じて修正できる。

 from_stream は、先の図 11-9 述べられた to_stream 処 理と反対の機能を提供する。  この処理では、入力ピクセルの単一ストリームを読み 込み、それに続いて列を読み込み、 co_memory_writeblock によって出力メモリに書き込 まれる。  またこの処理では、ストリームから読み込まれ、メモ リに置かれたバイトの並びを入れ替えることで、使用 される画像形式を反映する。(この場合は TIFF 形式)  このストリームからメモリまでの処理,from_stream を 図 で示す。

 11.4で述べたこれら 4 つのプロセス、対応す るストリーム、メモリ、および信号宣言は、 Impulse C によって記述され、図 に示され る構成機能によって相互接続される。  この構成機能は、以下に示すような機能を持って いる。

startsig と donesig のための信号宣言。 ◦ Startsig がイメージバッファが処理の準備ができている ことを示すのに対し、 Donesig はイメージのフィルタリ ングが完了したことを示す。 ◦ これらの信号は、ソフトウェアテストベンチとイメージ フィルタハードウェアの間の共有メモリ ( イメージバッ ファ ) の使用を調整するのに使われる。 ピクセルストリームの入出力と prep_run から filter_run に接続する 3 つのストリームのためのス トリーム宣言 Shrmem のためのメモリ宣言。 ◦ このメモリはイメージバッファを表す。

4 つの必須ハードウェアプロセスと 1 つの追加ソフトウェア のテストベンチ処理、 cpu_proc のためのプロセス宣言。 ◦ このソフトウェアのテストベンチ処理は Appendix E に 記載されている。 2 つの信号 startsig と donesig のための co_signal_create の 呼び出し。 メモリ shrmem のための co_memory_create の呼び出し。 ◦ メモリは、この例で扱う Altera プラットホームに対応した位置 heapO に作成される。 ◦ heap0 は専用ハードウェアとして FPGA 上で作用しているプロ セッサとイメージフィルタにアクセスできるオンチップメモリを 表す。  プロセッサには、ソフトウェアのテストベンチが置かれる

入力ストリーム、出力ストリーム、 3 つの中間的ストリームから 成る 5 つのストリームのための co_stream_create の呼び出し。 ◦ 3 つの中間ストリームが深さ 4 のストリームを与えられているの対して、 入力および出力ストリームの深さは、画像のスキャンラインの半分の数 である。 ◦ この処理は、メモリ読み書き時間が予想以上に長くなることによるス トールを軽減するために行われる。 ◦ しかし、この様に深いストリームバッファはハードウェア資源において 相当な負担となることに気をつける。 4 つのハードウェアプロセスと 1 つのソフトウェアテストベンチ プロセスのための Co_process_create の呼び出し。 4 つのハードウェアプロセスのための co_process_config の呼び 出し。 ◦ これらの 4 つのプロセスが、ハードウェアブロックとして FPGA にコンパ イルされる。