谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
最新ファイルの提供を保証する代理FTPサーバの開発
超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.
遺伝的アルゴリズム  新川 大貴.
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
神奈川大学大学院工学研究科 電気電子情報工学専攻
モード付き並列機械における オンラインスケジューリング
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
マイクロシミュレーションにおける 可変属性セル問題と解法
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
PlanetLab における 効率的な近隣サーバ選択法
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
ノードの情報を動的に反映したオーバレイネットワークの構築
ノードの情報を動的に反映したオーバレイネットワークの構築
ネットワークとノードの情報を利用したオーバレイネットワークの最適化
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究 同志社大学大学院 小掠真貴 同志社大学工学部 廣安知之
MPIを用いた並列処理 ~GAによるTSPの解法~
蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
各種ルータに対応する P2P通信環境に関する研究
Internet広域分散協調サーチロボット の研究開発
進化的計算手法の並列計算機への実装 三木 光範
グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
Data Clustering: A Review
IP over DVB-RCSの設計と実装
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
適応的近傍を持つ シミュレーテッドアニーリングの性能
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
Data Clustering: A Review
Data Clustering: A Review
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
ビット空間における GAの解探索モニタリングシステム
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
分散遺伝的アルゴリズムにおけるパラメータの検討
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
Webページタイプによるクラスタ リングを用いた検索支援システム
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
特定ユーザーのみが利用可能な仮想プライベート・ネットワーク
Dynamic Function Placement for Data-intensive Cluster Computing
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
まさ 2003/06/12 卒論その後の進捗 まさ 2003/06/12.
遺伝的交叉を用いた 並列シミュレーテッドアニーリングの検討 小掠 真貴 廣安 知之 三木 光範 角 美智子 岡本 祐幸 同志社大学大学院
Presentation transcript:

谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院) Grid環境における 進化計算手法の検討 Summer United Workshops on Parallel, Distributed and Cooperative Processing 2002. 8. 21-23, 湯布院ハイツ 谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)

研究背景 Grid計算環境 Gridのアプリケーション 仮想的なコミュニティで資源を共有し,大規模計算が可能 従来とは異なる並列計算環境 動的に変化する環境,非均質な環境 セキュリティ,ポータビリティ,etc. 各種ミドルウェアの整備 テストベッドの整備 Gridのアプリケーション 様々なアプリケーションを動かしたい・・ どのような計算? どのような計算モデル? プログラミングモデルは?

Gridのプログラミングモデル Grid RPCに基づくシステム 上記以外の計算モデル 遠隔サーバに用意されたライブラリを容易に使う仕組み ex. Ninf / Ninf-G, Netsolve Parameter Sweep, Master Workerモデルを想定 上記以外の計算モデル もともとGridに適したアルゴリズムのアプリケーションがあるのではないか? タスク並列に適している あらかじめ分割された仕事

GOCA Grid Oriented Computing Application 上記を満たすアプリケーションとして・・ 仕事は複数に分割できる 分割された仕事 互いに依存関係が少ないか,独立に実行可能である 並列処理可能である 仕事間は頻繁な通信を必要としない ある資源が突然利用できなくなっても,低コストで仕事を継続できる ある資源が突然加わっても,それを有効に利用できる 上記を満たすアプリケーションとして・・

進化計算 進化計算手法 (GA, GP, PSA, etc.) 最適化問題 生物の進化にヒントを得た最適化手法 目的関数の値を制約条件内で最小化,もしくは最大化する設計変数を決定する問題 Ex. 構造物の設計,タンパク質の立体構造予測 生物の進化にヒントを得た最適化手法 経験的かつ確率的な探索 ← GOCAを満たす 複雑かつ大規模な問題が解ける可能性 目的関数 設計変数 Opt.

EVOLVE/Gシステムの提案 目的 新しい機能として アプリケーションの記述 進化計算の研究者がGridモデルを容易に検討できる MW以外のGridモデルの構築をサポートする 効率的にGrid環境を利用できる 新しい機能として Gridのノードをクラスタリングできる 階層的なクラスタを構築できる アプリケーションの記述 EVOLVE/Gが提供するAPIを利用する ジョブの実行,情報の取得,通信の枠組みなど

EVOLVE/Gシステム Client Agent Worker Agent Worker Worker Worker管理 コアな計算 実行要求,その他命令 情報の取得 実行要求 モニタリング Agentを介した通信 ユーザ拡張 Agent 基本システム Worker ユーザ拡張 Worker 基本システム Grid計算環境

Agentの動作 Agent Agentによる定期チェック 取得情報 3 1 情報の利用方法 2 Worker 障害ノードは省く ネットワーク停止 マシン停止 3 Agentによる定期チェック 障害ノードは省く 取得情報 計算経過・結果 通信データ マシン状況 情報の利用方法 アプリケーション側で記述

Gridノードのクラスタリング ユーザが定義するルールに従う 計算性能,ネットワーク性能 所属するサイト,クラスタ型計算機 など 所属するサイト,クラスタ型計算機 など Grid環境

階層的なクラスタ計算 Super Agent Super Agent : 最上位のAgent 上位のWorker : Worker / Agent Worker Super Agent : 最上位のAgent 上位のWorker : 下位のクラスタのAgent 上位の通信モデルと下位の通信モデルが存在する

評価実験 EVOLVE/Gを構築し,それを用いてPSA/GAcのGridモデルを実装する 3サイト,25ノードからなるGrid環境で実験 Basicモデル: クラスタリングしない Hybridモデル: クラスタリングする 3サイト,25ノードからなるGrid環境で実験 BasicモデルとHybridモデルの比較 手動でクラスタリングを行い,3つのサイト毎に分類する

PSA/GAc 並列SAとGAの遺伝的交叉を組み合わせたハイブリッドな最適化手法 SAの特徴 GAの特徴 両者の利点を生かすアルゴリズム Start 並列SAとGAの遺伝的交叉を組み合わせたハイブリッドな最適化手法 SAの特徴 焼きなまし(アニーリング)を模倣 現在の状態しか保存しない 近傍に重点をおいた解探索 GAの特徴 生物の進化の仕組みを模倣 複数の個体を解候補としてもつ 大域的な探索 両者の利点を生かすアルゴリズム 主にタンパク質の立体構造予測に適用 生成処理 受理判定 推移 徐冷判定 徐冷処理 終了判定 End

PSA/GAc (contd.) 2個体のペアを作り,設計変数間で1点交叉を行う d d SA d:Crossover interval End d Crossover Temperature High Low

Basicモデル Worker上でSAを実行し,Agent上で遺伝的交叉を行う Agentのチェック時に,交叉周期まで計算を終了し,かつ連絡のとれるWorker同士でペアを作る 遅いWorkerは次のチェックポイントまで待機する (Agent) SA/Worker 計算 待機 遺伝的交叉

Hybridモデル 2階層のモデル 下位のクラスタでは基本的なPSA/GAcを行う 上位のクラスタでは,各PSA/GAcの最良解を交換する 最良解の交換

Hybridモデル (contd.) 最良解の交換 基本的なPSA/GAc Super Agent Worker / Agent

実験環境 同志社大学 大阪産業大学 合計 1 + 24 ノード Galley Cluster Gregor Cluster PentiumIII 1.1GHz x 1 PentiumIII 850MHz x 8 Gregor Cluster PentiumIII 1GHz x 12 大阪産業大学 Moon Cluster Pentium4 1.7GHz x 4 合計 1 + 24 ノード 同志社大 Galley 100Mbps LAN Gregor Internet 大産大 Moon 1KB メッセージ送信時のスループット Galley – Gregor 10.95 MB/sec Galley – Moon 107.7 KB/sec

対象問題 タンパク質の立体構造予測 岡崎国立共同研究機構分子科学研究所 岡本らのエネルギー関数 Met-Enkephalin (5残基) 最小エネルギー構造は E < -11 kcal/mol である 19個の二面角を設計変数とする Main chain Side

パラメータと予備実験 各ノードで実行するSA数 16 初期温度 2.0 最終温度 0.10 交叉周期 192 ステップ 初期温度 2.0 最終温度 0.10 交叉周期 192 ステップ 近傍幅 180°→ (180×0.3)° エネルギー計算に要する時間 [sec] Cluster 1ステップ 192ステップ Galley 0.215 41.4 Gregor 0.173 33.2 Moon 0.109 20.9

最良解とステップ数の推移 (Basicモデルの場合)

Basicモデルの問題 計算の早いWorkerグループと遅いWorkerグループに分かれている 考察 チェックポイントでの最良解が振動している 同じ計算スピード同士で,情報交換を行っている 考察 最初からグループ分けしたモデル? Hybridモデルが良いのではないか

モデル比較:ステップ数

モデル比較:経過時間

考察 (Hybridモデルの利点) パラメトリック探索(各実行が並列) 階層的な通信モデル 進化計算の並列アルゴリズムは,並列度を上げることにより,解探索能力にも影響があり,並列度を上げることが良い? 大規模並列より,中規模の並列を複数試す方が良い? 個々が完全に独立したパラメトリックサーチより,それぞれの情報を交換し合いながら,お互いに適切なパラメータを見つける 階層的な通信モデル 通信モデルを階層化し,上位のクラスタでは疎な通信,下位のクラスタでは密な通信を行う パフォーマンスのスケーラビリティを確保できる ネットワーク的に近いノードをクラスタリングする

まとめ 進化計算開発者のためのGridミドルウェア「EVOLVE/G」を提案 PSA/GAcのGridモデルの実装と評価実験 進化計算の論理モデルを自由に構築可能 Grid環境をクラスタリングし,階層的トポロジを形成可能 PSA/GAcのGridモデルの実装と評価実験 クラスタリングを行った階層モデルの有効性が示された 進化計算のようなアプリケーションのGridモデルを検討する際に,EVOLVE/Gが有効なシステムであることを確認した

EVOLVE/G Agent API eg_agent_worker_setting() eg_agent_check_worker() eg_agent_read_data() Workerから取得した情報の読み込み タグを付けて読み込む eg_agent_write_data() Workerに送る情報の書き出し タグを付けて書き出す

EVOLVE/G Worker API eg_worker_read_param() eg_worker_check_readable() Agentから送られる入力ファイルの読み込み eg_worker_check_readable() Agentからの要求が来ているかの確認 eg_worker_read_data() Agentからの受け取った情報の読み込み eg_worker_write_data() Agentへ送る情報の書き出し

遅いWorkerグループ 遅いWorkerは局所探索が間に合わない 遅いWorkerが生きる場合 機能分化 保険 傾斜法などで局所探索のみさせる パラメータを変えて,違うものを探す 保険 早いWorkerのノードに障害が発生する (アプリケーションより下位層の問題) 早いWorkerの探索が初期収束する (アプリケーションの問題)