グローバルコンピューティング環境における遺伝的アルゴリズムの検討

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

並列分散遺伝的アルゴリズムの有効 性 学績番号 畠中 一幸 知的システムデザイン研究室 Intelligent Systems Design Laboratory.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
クラスタの構成技術と クラスタによる並列処理
超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.
遺伝的アルゴリズム  新川 大貴.
過負荷時のWebアプリケーションの性能劣化を改善する Session-level Queue Scheduling
対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
神奈川大学大学院工学研究科 電気電子情報工学専攻
モード付き並列機械における オンラインスケジューリング
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
対話型遺伝的アルゴリズムにおける ユーザ負担軽減と多様性維持の検討
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
分散確率モデル遺伝的アルゴリズムにおける解探索メカニズムの検討
マイクロシミュレーションにおける 可変属性セル問題と解法
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究 同志社大学大学院 小掠真貴 同志社大学工学部 廣安知之
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
MPIを用いた並列処理 ~GAによるTSPの解法~
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価
MPIとOpenMPを用いた Nクイーン問題の並列化
グローバルコンピューティング シミュレータの概要
Internet広域分散協調サーチロボット の研究開発
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ
グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
他のプロセスに与える影響の少ない 実行時ミラーリングシステム
適応的近傍を持つ シミュレーテッドアニーリングの性能
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
Virtualizing a Multiprocessor Machine on a Network of Computers
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
ビット空間における GAの解探索モニタリングシステム
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
GbEにおける TCP/IP の研究について
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
理工学部情報学科 情報論理工学研究室 延山 周平
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
分散遺伝的アルゴリズムにおけるパラメータの検討
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
渡邉 真也, 廣安 知之, 三木 光範 同志社大学 工学部 Faculty of Engineering,Doshisha Univ
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
各種荷重を受ける 中空押出形成材の構造最適化
遺伝的交叉を用いた 並列シミュレーテッドアニーリングの検討 小掠 真貴 廣安 知之 三木 光範 角 美智子 岡本 祐幸 同志社大学大学院
Presentation transcript:

グローバルコンピューティング環境における遺伝的アルゴリズムの検討 - JSPP2001 - グローバルコンピューティング環境における遺伝的アルゴリズムの検討 June 5-8, 2001, Joint Symposium on Parallel Processing, Kyoto Research Park 谷村 勇輔,廣安 知之 三木 光範,佐野 正樹 (同志社大学)

本研究の目的 グローバルコンピューティング環境を利用できる最適化システムの構築 最適化ソフトウェアとしてGAに着目し, 構造物の設計,たんぱく質の構造解析 従来の最適化手法では困難 GAなどのヒューリスティックなアルゴリズム 繰り返し計算が多いために膨大な計算が必要 Gridを利用する 最適化ソフトウェアとしてGAに着目し, そのグリッドモデルを検討する

遺伝的アルゴリズム(GA) 生物の進化の仕組みを応用 強力な最適化手法の1つ 個体(探索点) 計算負荷が高いという欠点 評価 選択 交叉 突然変異

分散遺伝的アルゴリズム(DGA) 単純GA(SGA) 分散GA(DGA) 移住 母集団を複数のサブ母集団(島)に分割する 移住による個体交換を行う 多様性を維持し,解の探索能力が高い 各島を1つのプロセッサに割り当てる

2個体分散遺伝的アルゴリズム (Dual DGA) 2個体分散GA (Dual DGA) 分散GA(DGA) 島内のアルゴリズムを単純にする 島数を多くすることで,より多様性を維持する 分散GAより探索性能が良い

Dual DGAの並列モデル 島移住 通信量が少なくて済む 粒度の単位を1つの島と,小さくすることができる 1PE 通信量が少なくて済む 粒度の単位を1つの島と,小さくすることができる 計算機の特性に合った(通信/計算)の割合 ロードバランス

Dual DGAの性能(1) GA Cluster Ridge 関数 (n = 30) 島数: 96 移住トポロジ: リング プロセッサ内移住間隔: 5 プロセッサ間移住間隔: 25 GA PE数:16 CPU:Pentium II 400MHz メモリ:128MB ネットワーク:FastEhternet Cluster Ridge 関数 (n = 30)

Dual DGAの性能(2) 解探索の性能 実行性能

グローバルコンピューティング 環境でのモデル検討 サイト (並列計算機) Dual DGAを用いる理由 性能の良いGAを用いる 並列計算機(クラスタ)に実装しやすい 目的,要件 速く,良い解が得られること スケジューラの利用 サイト間のコミュニケーション 障害対策

検討するモデル スケジューラ チェックポインティング グローバルネットワーク スレーブサイト マスターサイト (並列計算機) (端末) 探索プロセス (Dual DGA) (並列計算機) マスターサイト (端末) ジョブの投入 スケジューラ 結果報告 ユーザ 管理プロセス 監視 キュー 経過報告,状態報告 チェックポインティング

チェックポインティングとキュー キュー Dual DGAの計算 Dual DGAの計算 最良の個体を収集 個体を分配 キューを用いて 時間 Dual DGAの計算 サイト1 個体を分配 最良の個体を収集 Dual DGAの計算 サイト2 キューを用いて サイト間の情報交換 解のバックアップ 探索状態の確認 キュー

キューの仕組み マスターサイト スレーブサイト ① 管理プロセス 探索プロセス 4PE キュー ② 最良個体を選ぶ スレーブサイト

キューの仕組み マスターサイト スレーブサイト 管理プロセス 探索プロセス キュー 最良個体 ③ スレーブサイト

検討モデルが考慮したこと Gridで考慮すべきこと ネットワーク 性能,スループットの変動 通信モデル,トポロジ 障害,予測不能な現象 アプリケーション (検討モデル) ジョブ管理 (スケジューラ) Gridで考慮すべきこと その他 ネットワーク 性能,スループットの変動 通信モデル,トポロジ 障害,予測不能な現象 サイト 性能 スループットの変動 異なるアーキテクチャ

シミュレーション環境 任意の現象を何度でも再現できる ある現象を再現するシナリオ 各計算機は均等,スケジューリングアルゴリズムは考慮しない モデルの検討 チェックポイントとキューの仕組みによる効果 Dual DGA スレーブサイト数: 4 各サイトのPE数: 4 チェックポイント: 100世代 キューサイズ: 32個体

想定するシナリオ シナリオ1 最後まで問題なく計算を実行できる シナリオ2 (ネットワークの障害) シナリオ3 (サイトの障害) ネットワークが利用できない時がある 各サイトが定期的にチェックポイントを受けられない シナリオ3 (サイトの障害) スレーブサイトが停止する時がある 停止したサイトでは,計算を初めからやり直す

シナリオ2 チェックポイントが不定期 サイト 0 サイト 1 サイト 2 サイト 3 1 2 3 4 5 6 7 ネットワークが低負荷 1 2 3 4 5 6 7 サイト 0 サイト 1 サイト 2 サイト 3 ネットワークが低負荷 ネットワークが高負荷

想定するシナリオ シナリオ1 最後まで問題なく計算を実行できる シナリオ2 (ネットワークの障害) シナリオ3 (サイトの障害) ネットワークが利用できない時がある 各サイトが定期的にチェックポイントを受けられない シナリオ3 (サイトの障害) スレーブサイトが停止する時がある 停止したサイトでは,計算を初めからやり直す

シナリオ3 サイトが途中で停止 サイト 0 サイト 1 サイト 2 サイト 3 1 2 3 4 5 6 7 走行 停止 初期化 アイドル チェックポイント 1 2 3 4 5 6 7 サイト 0 サイト 1 サイト 2 サイト 3 走行 停止 初期化 アイドル

シナリオ1 問題なく実行できる キューがない場合 検討モデル 目的関数 f 目的関数 f 世代数 世代数 サイト1 サイト2 サイト3 目的関数 f 目的関数 f サイト1 サイト2 サイト3 サイト4 世代数 世代数 キューがない場合 検討モデル

シナリオ1 問題なく実行できる キューがない場合 検討モデル 目的関数 f 目的関数 f 世代数 世代数 サイト1 サイト2 サイト3 目的関数 f 目的関数 f サイト1 サイト2 サイト3 サイト4 世代数 世代数 キューがない場合 検討モデル

シナリオ2 チェックポイントが不定期 不定期に行う場合 定期的に行う場合 目的関数 f 目的関数 f 世代数 世代数 サイト1 サイト2 目的関数 f 目的関数 f サイト1 サイト2 サイト3 サイト4 世代数 世代数 不定期に行う場合 定期的に行う場合

シナリオ3 サイトが停止する場合 キューがないモデル 検討モデル 目的関数 f 目的関数 f 世代数 世代数 サイト1 サイト2 サイト3 サイト4 目的関数 f 目的関数 f 世代数 世代数 キューがないモデル 検討モデル

デモ・システム(実装方法) シェルスクリプト MPIプログラム RPC サイト1 × スケジューラ サイト2 サイト3 世代数 探索点情報 負荷情報

デモ・システム(実験環境) 8 5 : 3 速度比 FastEthernetで接続 サイト1 P3 850MHz × 4 Linuxクラスタ P3 850MHz × 4 Linuxクラスタ サイト2 P3 500MHz × 4 Linuxクラスタ サイト3 P2 300MHz × 1 P3 600MHz × 3 Linuxクラスタ FastEthernetで接続

デモ・システム(実験結果) シナリオ2,3 と同様の結果 実行時間 Ridge 関数の計算負荷を150倍にして測定 Dual DGAの実行時間 その他に要した時間

各サイトに性能差がある場合 高速なサイトでは,進化のスピードが速い サイト1 サイト2 サイト3 キューがないモデル 検討モデル

最良解の履歴を比較 エリートを交換するモデルの問題 初期収束を引き起こす ある程度孤立させる 部分解を分配する その他 工夫が必要

まとめ グローバルコンピューティング環境におけるGAのモデルを検討した 数値シミュレーション,およびデモシステム GAのモデルとしてDual DGAを用いる マスタースレーブ型のモデル キューの仕組みをもったチェックポイント機能 数値シミュレーション,およびデモシステム 複数の計算資源を利用して,より高速に探索を行うことができる スケジューラが予測できないような障害に対してロバストなモデルである

今後の課題 実際のグローバルコンピューティング環境で動作するシステムを開発する デモ・システムを拡張する スケーラビリティについて検討を行う Ninf,Globus,AppLeS などを利用する スケーラビリティについて検討を行う 数十サイト以上を利用できるのか? より実際的な問題を扱う GA以外のデータの取り扱い

グローバルコンピューティング環境でGAを行う利点 高い並列性を有する ⇒ 様々なモデルを作ることができる可能性 個体数で計算量が調整でき,計算量を増やすことで良い解が求まる可能性が高くなる ⇒ 無限のリソースを有効利用できる可能性 多点探索で比較的独立性が高い探索を行うため,計算途中に探索点情報が多少失われても,大勢に影響はない ⇒ 障害対策ができる可能性

グローバルコンピューティングの階層化モデル アプリケーション ミドルウェア ツール群 ネットワーク/テストベッド GUSTO I-WAY APAN アカウント管理 セキュリティ 資源管理・スケジューリング 通信 情報管理,提供 並列拡張言語 メッセージ通信ライブラリ 遠隔システム向けRPC 広域分散処理 大規模シミュレータ

従来的な並列GAのモデル 単純GA 分散GA セルラGA ・・・ 通信量 多い 解探索 - 通信量 少ない 解探索 良い 通信量 多い :1つのプロセッサに対応 単純GA 分散GA セルラGA ・・・ マスター スレーブ 島 個体 通信量 多い 解探索 - 通信量 少ない 解探索 良い 通信量 多い 解探索 良い by 文献,谷村・佐野の実験結果

Dual PDGAの粒度について 低性能 高性能 高性能 低性能 適切な 通信/計算 のバランス

補足資料 正常に動作するシナリオ キューなし キューあり 世代数 400.4 328.7 消費リソース 1.14 1.00