MPIとOpenMPを用いた Nクイーン問題の並列化

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

N クイーン問題 N×N のチェス盤の上に、将棋の飛車と角 行の動きを同時にできる駒(クイーン) をお互いに動きを妨げないように N 個置 け。
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
連続系アルゴリズム演習 第2回 OpenMPによる課題.
東京大学大学院 情報理工学系研究科 コンピュータ科学専攻 金田研究室 工藤 誠
キャッシュ付PRAM上の 並列クィックソートと 並列マージソート
CPUについて HN:セシル.
Chapter11-4(前半) 加藤健.
Intel AVX命令を用いた並列FFTの実現と評価
セキュリティ機構のオフロードを考慮した仮想マシンへの動的メモリ割当
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
並列処理実用? 並列処理により、 現在時間がかかって実用しづらい処理を、 早くして実用にする 1時間 =1/10⇒ 6分
全体ミーティング (4/25) 村田雅之.
分散コンピューティング環境上の Webリンク収集システムの実装
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
群論とルービックキューブ 白柳研究室  水野貴裕.
対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法
AllReduce アルゴリズムによる QR 分解の精度について
時空間データからのオブジェクトベース知識発見
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
全体ミーティング (6/13) 村田雅之.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
PCクラスタ上での 連立一次方程式の解の精度保証
システム開発実験No.7        解 説       “論理式の簡略化方法”.
医療支援診断のためのコンピュータ分散システムの検討
アルゴリズムとデータ構造 補足資料10-2 「nクイーン」
画像処理ボード上での 高速テンプレートマッチングの 実装と検証
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
分散処理を用いた大規模ソフトウェアに対するコーディングパターン検出ツール
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
OpenMPハードウェア動作合成システムの検証(Ⅰ)
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
MPIを用いた並列計算 情報論理工学研究室 清水周.
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
仮想メモリを用いた VMマイグレーションの高速化
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
各種ソート回路のハードウェア化と ハード/ソフト最適分割化の検討
目的:高速QR分解ルーチンのGPUクラスタ実装
3次元Nクイーン問題の 解の存在の検証 07-1-037-0106 前波 大貴 情報論理工学研究室 宜しくお願いします。
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
第5回 メモリ管理(2) オーバレイ方式 論理アドレスとプログラムの再配置 静的再配置と動的再配置 仮想記憶とメモリ階層 セグメンテーション
秘匿リストマッチングプロトコルとその応用
全体ミーティング (5/23) 村田雅之.
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
「マイグレーションを支援する分散集合オブジェクト」
分散処理を用いたコーディングパターン検出ツールの実装
Cソースコード解析による ハード/ソフト最適分割システムの構築
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
理工学部情報学科 情報論理工学研究室 延山 周平
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
高度プログラミング演習 (11).
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
分散メモリ型並列計算機上での行列演算の並列化
アーキテクチャパラメータを利用した並列GCの性能予測
全体ミーティング (9/12) 村田 雅之.
ペンシルパズル「一本線」のヒント数の扱いに関する解析
Presentation transcript:

MPIとOpenMPを用いた Nクイーン問題の並列化 高性能計算研究室 B4 杉田 卓司 2009/02/27

研究背景と目的 ・研究背景 ・扱うデータ量の増加 → 計算量の増加 ・高速処理、リアルタイム処理 ・目的  ・扱うデータ量の増加 → 計算量の増加  ・高速処理、リアルタイム処理 ・目的  ・MPIとOpenMPの2つの並列プログラムを 2種類のクラスタで実験、比較する → 実行時間、速度向上比 気象予測 デジタル画像処理

Nクイーン問題 5 4 3 2 1 ● N×Nのチェス盤上にN個のクイーンを置く どのクイーンもその移動可能な場所に 1次元配列で表したもの 列番号→要素番号 行番号→要素の値 N×Nのチェス盤上にN個のクイーンを置く どのクイーンもその移動可能な場所に  他のクイーンが置かれていないことが条件 その場合の局面がいくつあるかを数える

逐次処理アルゴリズム 斜め方向に クイーンがないため 計算続行 クイーンがあるため 計算中止 Nの数を16で計算した場合、解の総数は約1477万通りにもおよぶ→並列処理○

並列アルゴリズム 1 3 2 4 1列目の配置に何行目のクイーンを配置するかを4分割する。(N=14) 各プロセスの解の個数を回収して総和を求める 1 3 2 4 Process0 (1,5,9,13) Process1 (2,6,10,14) Process2 (3,7,11) Process3 (4,8,12) 1列目のどの位置にクイーンを配置するかをプロセス毎に指定して処理を並列に割り当てる。

実験環境 Raptor Nycto Server Host - Xeon 2.8GHz 2GB SDRAM 250GB HDD Compute Host (6台) Pentium4 3.2GHz 40GB HDD Gigabit Ethernet Raptor、MPI→分散メモリ型 Nycto、OpenMP→共有メモリ型 OpenMPが分散メモリ上で動くためにSCore上のSCASHというシステムに よって共有メモリと見せかけて動かす Nycto Gigabit Ethernet - Pentium4 3GHz Server Host 2GB SDRAM 240GB HDD Compute Host(8CPU) Quad Xeon 3GHz 8GB SDRAM 300GB HDD

Raptor上での実験結果 ・OpenMP、MPI共に理想的な速度向上が得られた ・MPIの方が実行時間が短い

Nycto上での実験結果 ・OpenMP、MPI共に理想的な速度向上が得られた ・MPIの方が実行時間が短い

考察 Raptor Nycto ・相性 ・OpenMPの柔軟性 プロセス数 1 2 4 実行時間(秒) OpenMP 2303.3 1153.7 752.7 MPI 938.6 716.9 439.3 速度向上比 3 1.31 2.14 プロセス数 1 2 4 8 実行時間(秒) OpenMP 2204.2 1298.5 643.9 281.4 MPI 1863.3 931.7 471.4 240.1 速度向上比 1.7 3.4 7.8 7.7 Nycto OpenMP 共有 Raptor 分散 MPI 分散 Nycto 共有 ・相性 ・OpenMPの柔軟性

まとめと今後の課題 まとめ ・Nクイーン問題の並列化 ・2つのPCクラスタでの実験、比較 今後の課題 ・Nクイーン問題については高速化の余地あり ・実装までの時間を比較