各種ソート回路のハードウェア化と ハード/ソフト最適分割化の検討

Slides:



Advertisements
Similar presentations
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Advertisements

ヘテロジニアスマルチコアプロセッサ 環境を対象としたキャッシュシステム 自動生成ツールの開発
VLSI設計論第4回 アキュムレータマシンと 仮遅延シミュレーション
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
解答2-7 コメント取出し状態図 エスケープ 中 other any \ 文字列 定数 other \n : 行末コメント取出し終了 “ “
4.ソート 4-1.ソート問題について 4-2.簡単なソートアルゴリズム 4-3.高度なソートアルゴリズム
アルゴリズムとデータ構造 2012年6月27日
第12回 ソート(3): シェルソート、クイックソート
高速ソートと 安定結婚問題 平成24年12月14日.
アルゴリズムとデータ構造 第8回 ソート(3).
Capter9 Creating an Embedded Test Bench ( )
第11回 整列 ~ シェルソート,クイックソート ~
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
第10回 ソート(1):単純なソートアルゴリズム
データ構造とアルゴリズム 分割統治 ~ マージソート~.
プロセッサ設計教育のための 命令セット・スーパースカラシミュレータの試作と評価
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
高性能コンピューティング論2 第1回 ガイダンス
画像処理ボード上での 高速テンプレートマッチングの 実装と検証
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
階層的境界ボリュームを用いた 陰関数曲面の高速なレイトレーシング法
 データベースによる並列処理 情報論理工学研究室  三宅健太.
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
専門演習Ⅰ 国際経済学部 国際産業情報学科 2年 石川 愛
第11回 整列 ~ シェルソート,クイックソート ~
オントロジーを使用した プログラム開発支援システムの提案
Occam言語による マルチプリエンプティブシステムの 実装と検証
OpenMPハードウェア動作合成システムの検証(Ⅰ)
高速剰余算アルゴリズムとそのハードウェア実装についての研究
読み出し回路のアップグレードに向けた研究
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
MPIとOpenMPを用いた Nクイーン問題の並列化
ソートアルゴリズムの種類 選択ソート (selection sort) バブルソート (bubble sort)
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
RTCPパケットの測定による マルチキャスト通信の品質評価
わんくま同盟茶藝部顧問 Microsoft MVP for VC episthmh
通信機構合わせた最適化をおこなう並列化ンパイラ
大岩 元 慶応大学環境情報学部 再帰 データ構造とプログラミング(8) 大岩 元 慶応大学環境情報学部
アナライザ パケットを収集 測定用のマシン 通信.
ディジタル回路の設計と CADによるシステム設計
アルゴリズムとプログラミング (Algorithms and Programming)
先進的計算基盤システムシンポジウム SACSIS2007併設企画 マルチコアプログラミングコンテスト 「Cellスピードチャレンジ2007」
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
プログラミング 4 整列アルゴリズム.
DNSクエリーパターンを用いたOSの推定
階層的境界ボリュームを用いた 陰関数曲面の高速なレイトレーシング法
Ibaraki Univ. Dept of Electrical & Electronic Eng.
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
アルゴリズムとデータ構造1 2006年7月11日
アルゴリズムとデータ構造 2011年6月23日
プログラミング演習Ⅲ- Sorting Quick Sort and Merge Sort
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
アルゴリズムとデータ構造 --- 理論編 --- 山本 真基
Managing non-functional uncertainty via model-driven adaptivity
アナライザ パケットを収集 測定用のマシン 通信.
バブルソート,バケツソート,クイックソート
「マイグレーションを支援する分散集合オブジェクト」
コンピュータアーキテクチャ 第 5 回.
Cソースコード解析による ハード/ソフト最適分割システムの構築
BSPモデルを用いた 並列計算の有用性の検証
ソートのプログラムの流れ 配列の中身を小さい順に並び替える a[1],a[2],…a[n]の値を順に出力する
プロセッサ設計支援ツールを用いた 独自プロセッサの設計
コンピュータアーキテクチャ 第 5 回.
アルゴリズムとデータ構造 2012年6月25日
並列処理プロセッサへの 実数演算機構の開発
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Presentation transcript:

各種ソート回路のハードウェア化と ハード/ソフト最適分割化の検討 立命館大学 理工学部 電子情報デザイン学科 高性能計算研究室 B4 松田 英亮 2009/02/27(金) ~で~高性能~が発表します

研究背景 研究目的 ・各種ソートのハード/ソフト最適分割の検討 ・システムLSIの高集積化により、扱うデータ量の増加 ・ハード・ソフトの最適分割の必要性 ・データ量の多い処理の高速化の必要性 研究目的 ・クイックソート回路・バブルソート回路の実現 ・各種ソートのハード/ソフト最適分割の検討 ~背景は~扱う~必要性が増しています~高速化の必要性も求められて~目的~

クイックソートのアルゴリズム 9 7 5 2 11 10 3 1 7 2未満を検索 3未満を検索 3以上を検索 軸要素(pivot) 交換 2以上を検索 7 9以上を検索 9未満を検索 5以上を検索 5未満を検索 11以上を検索 11未満を検索

クイックソートのモジュール内でのデータの動き Stack_address 1 3 consent address_right request address_right Memory 9 1 8 6 3 9 1 8 8 3 6 address_left data_left data_pivot address_pivot address_right data_right Read_left Read_pivot Read_right 8 address_left data_pivot data_pivot address_right data_left data_right address_pivot Compare_big Compare_small left_data right_data left_address right_address enable1 enable2 Write_and_Swap pivot_change1 pivot_change2 address_left address_right data_left data_right reflexive address_pivot return

バブルソートのアルゴリズム 3 9 7 0 5 2 11 10 1 右端まで繰り返す 最大の値が右端にくる 右端の1つ前まで繰り返す 比較 右端まで繰り返す 最大の値が右端にくる 右端の1つ前まで繰り返す ココまで ・・・ 1~3を繰り返す 3 ソート完了

Compare_and_exchange バブルソートのモジュール内でのデータの動き Memory 9 1 A 2 ……………….…… ……………….…… 3D 7 3E 3F 3F 4 data1 address1 data1 address1 data2 address2 data2 address2 Compare_and_exchange

クイックソートの負荷割合と分割パターン 1985 1560[clk] 1439 1971 46 780000[clk] 分類 ハード ソフト 回路規模 クロック数 A Memory, Raed_left, Read_right, Read_pivot, Compare_big, Compare_small, Write_and_swap, stack_address 1985 1560[clk] B Memory Raed_left, Read_right, Read_pivot, Compare_big, Compare_small, Write_and_swap, stack_address 1439 × C Memory, Stack_address, Write_and_swap Raed_left, Read_right, Read_pivot, Compare_big, Compare_small, 1971 D Raed_left, Read_right, Read_pivot, Compare_big, Compare_small, Write_and_swap Memory, Stack_address 46 E Memory, Raed_left, Read_right, Read_pivot, Compare_big, Compare_small, Write_and_swap, stack_address 780000[clk]

クイックソートの負荷割合と分割パターン 分類 ハード ソフト 回路規模 クロック数 A Memory, Comapre_and_exchange 968 2070[clk] B Memory Compare_and_exchange 955 × C Memory, Stack_address 13 D Memory, Compare_and_exchange 828000[clk]

まとめ 今後の課題 ・Microblaze上でのハード/ソフト分割パターンの実測値の測定と検証 ・クイックソート回路・バブルソート回路の作成 それぞれソフトウェアの約500倍、400倍の速度向上 ・各種ソートのハード/ソフト最適分割化の検討 回路規模と処理速度のトレードオフを考慮した分割案の提案 今後の課題 ・Microblaze上でのハード/ソフト分割パターンの実測値の測定と検証 ・他のソート回路での実測値の測定と検証