Grid環境におけるモニタリング手法の評価

Slides:



Advertisements
Similar presentations
応用 Java(Java/XML) 第 10 回 2006 年 7 月 14 日 植田龍男. 後半の内容の予定 XPath (6/9) 、 XSLT (6/16) 名前空間 (Namespace) (6/16) XML 文書の妥当性の検証 (6/23) DTD, W3C XML Schema SOAP.
Advertisements

IIS 4.0で開発をするコツ Webアプリケーション構築.
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
情報理工学系研究科 コンピュータ科学専攻 上嶋裕樹
Webプロキシサーバにおける 動的資源管理方式の提案と実装
最新ファイルの提供を保証する代理FTPサーバの開発
Windows Azure 仮想マシン 入門.
Webサービス技術を基盤とするGridRPCシステムの評価
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
報告 (2006/9/6) 高橋 慧.
神奈川大学大学院工学研究科 電気電子情報工学専攻
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
IAA情報登録クライアント for Windows
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
最新情報技術を活用した超大規模 天文データ解析機構の研究開発
HORB Messaging Service
Telnet, rlogin などの仮想端末 ftp などのファイル転送 rpc, nfs
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
コンテンツ配信 エンコード (符号化) CBR (Constant Bit Rate) VBR (Variable Bit Rate)
サーバ負荷分散におけるOpenFlowを用いた省電力法
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
過負荷時のWebアプリケーションの 性能劣化を改善する Page-level Queue Scheduling
ギガビットネットワークに対応する ネットワークべンチマークテスト機の試作と ギガビットルータの性能評価
IPv6 ネットワークにおける エニーキャスト通信実現のための プロトコル設計と実装
大阪大学 大学院情報科学研究科 博士前期課程2年 宮原研究室 土居 聡
第12回 2007年7月13日 応用Java (Java/XML).
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
All IP Computer Architecture
第10回 2007年6月29日 応用Java (Java/XML).
Cisco Router GUI設定 CCPE3.2 紹介 本資料に記載の各社社名、製品名は、各社の商標または登録商標です。
Globusにおける GridFTPの性能評価
第11回 2007年7月6日 応用Java (Java/XML).
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
グローバルコンピューティング シミュレータの概要
出典・・・基礎からわかるTCP/IPコンピューティング入門 村山公保著
ネットワークの基礎知識 電子制御設計製図Ⅰ   2014年5月2日 Ⅲ限目.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
実行時情報に基づく OSカーネルのコンフィグ最小化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
各種ルータに対応する P2P通信環境に関する研究
Internet広域分散協調サーチロボット の研究開発
通信機構合わせた最適化をおこなう並列化ンパイラ
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
独習XML ~第3章 文書と構造~ 3.3 スキーマ 3.3 XML Schema
東京工業大学 情報理工学研究科 数理・計算科学専攻 千葉研究室 栗田 亮
端末およびサービス透過的な 情報閲覧支援システムの構築
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
第13回 2007年7月20日 応用Java (Java/XML).
サーバ・クライアントシステム ( X Window System) 2006/01/20 伊藤 和也 original: 前坂たけし
仮想ネットワークを考慮した SoftIRQ制御によるCPU割当ての手法
ウェブアプリケーションサーバの Degradation Schemeの 制御に向けて
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
「マイグレーションを支援する分散集合オブジェクト」
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
状況に応じて適切な 例外処理が行なえる アスペクト指向分散環境実験の 支援ツール
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
特定ユーザーのみが利用可能な仮想プライベート・ネットワーク
Dynamic Function Placement for Data-intensive Cluster Computing
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
P2P & JXTA Memo For Beginners
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
ソケットの拡張によるJava用分散ミドルウエアの高信頼化
応用Java(Java/XML) 第8回 2005年6月23日 植田龍男.
Presentation transcript:

Grid環境におけるモニタリング手法の評価 秋山 智宏*1 中田 秀基*1 *2 松岡 聡*1 *3 *1東京工業大学 *2産業技術総合研究所 *3科学技術振興事業団

Grid Computing 広域ネットワーク上の計算・情報資源を利用した大規模計算 Internet Ninf[AIST, TITECH], Globus[ANL], NetSlove[UTK] etc server client Internet task result この絵は使わない

Gridにおけるモニタリング モニタリングの対象 モニタリングデータの用途 →高性能な広域分散コンピューティングが可能 リソース (CPU, memory, disk etc), ネットワーク(latency, バンド幅 etc), 実行中のプロセス, アプリケーション etc モニタリングデータの用途 故障検出, 性能解析, チューニング 性能予測, スケジューリング etc →高性能な広域分散コンピューティングが可能 現在、様々なモニタリングシステムが開発・運用

モニタリングのデータ形式, プロトコル等の相互運用が十分に考慮されていない 関連研究 モニタリングシステム・解析ツール Active Measurement Program (AMP) [Tony McGregor. ] http://amp.nlanr.net/ Surveyor [Sunil Kalidindi.] http://www.advanced.org/surveyor/ Network Weather Service (NWS) [Rich Wolski. ] http://nws.npaci.edu/NWS/ NetLogger Toolkit [Brian Tierney.] http://www-didc.lbl.gov/NetLogger/ モニタリングのデータ形式, プロトコル等の相互運用が十分に考慮されていない

Grid Performance Working Group(Perf-WG)の提案 Perf-WGはGlobal Grid Forum(GGF)内の組織 以下のような定義・提案をしている モニタリングシステムの基本的なアーキテクチャとその構成要素の相互関係 XMLによるデータフォーマット・プロトコル これによりモニタリングシステムの相互運用が可能に ggf について述べる。 GGFは世界30ヵ国、200以上の組織から参加者が集まり、Grid に関する技術やアプリケーションの発展や促進を基準や実装のガイドラインを作ることを通して行うことを目的とした組織。 Perf-WGについても話す。 Grid環境におけるリソースやアプリケーションの性能に関する情報の収集、表現方法、ストレージ、等の基準や最良事例を定義することを目的としたグループで、ツール間における性能データの統一的なフォーマットを開発すること、… 有効性・実現可能性の検証がなされていない

本研究の目的 実環境において、Perf-WGが定義したモニタリングシステムやデータ形式について以下のことを検証 モニタリングシステムのスケーラビリティ XMLを用いたデータ表現のコスト データ表現の拡張性 実際のGrid RPCシステムNinfを用い、定義の一部を実装 RPCに用いられる一般的なデータ形式と定義されたXML形式比較をし、コストを計測 実際のGrid環境でモニタリングをおこない、システムや ネットワークへの影響を検証

Grid Monitoring Architecture(1) Consumer Producer からモニタリングデータ(event)を受け取る real-time monitor, archiver, process monitor, overview monitor Producer consumer に対してevent を供給、directory service には event 情報を提供 Directory Service producer からevent 情報を受け取り、consumer にevent 情報の検索サービスを提供 短く簡単に述べる

Grid Monitoring Architecture(2) Consumer 3) Event Producer & Event Schema information = API & wire protocol & data format 4) Query or Subscribe 2) Look up 5) Event data Directory Service (LDAP) アニメーションする。 1) Event Publication information Producer

Event Schema モニタリングデータ(event) を表現するための基準となるスキーマ event はXMLを用いたテキスト表現 →XSDで拡張し様々な event を表現可能 CPU load, latency, memory size etc event は一つもしくはそれ以上のデータとしての値を保持し、以下から構成される Type: event を識別するためのもの Element: 実際のデータを表すもので、以下から構成 Name: データの名称 Value: データの値 Type, Source, Time etc

Base Type event はXMLスキーマをXSD法で拡張して定義する BaseTypeには必須の要素である、type, source, time しか定義されてない →event typeに応じて各々が定義、拡張 本研究ではNinfに特化した2つの Event を定義 <xsd:schema xmlns:xsd=“http://www.w3.org/1999/XMLSchema” xmlns:gp=“http://www.gridforum.org/PerfWG/schemas’’/> <xsd:complexType name=“GridEvent ”/> <xsd:element name=“source” type=“xsd:string”/> <xsd:element name=“time” type=“xsd:timeInstant”/> <xsd:element name=“sequenceNumber” type=“xsd:integer” minOccurs=“0”/> </xsd:complexType> </xsd:schema>

検証の対象 GMAの拡張性 XMLを用いたデータ表現のコスト データ表現の拡張性 定義されたアーキテクチャで様々な規模のGrid環境に対応できなければならない ローカルなクラスタ環境, 広域分散環境 etc XMLを用いたデータ表現のコスト Probe effect が生じる可能性 データサイズ大→ネットワーク性能 パーズコスト大→CPU性能 データ表現の拡張性 定義されたEvent Schema でGrid環境におけるモニタリングデータを表現できるか 新しいモニタリングデータへの対応 問題点でない

検証手法 定義されたシステム・データ形式のリファレンス実装を行い、 他の一般的なデータ形式と比較、評価を行う 実際のGrid環境でモニタリングを行い、ネットワークやシステムに与える影響を検証 解決法でない

Ninf の概要 Grid RPCシステムの一つ Client サーバは計算・情報資源を提供 Network-enabled Libraries(and Apps) クライアントがサーバ側のライブラリを呼び出す(Ninf_call)ことで計算がされる 並列処理も可能(同期/非同期 呼び出し) Server library data result Client library Ninf_call data Server result program

GMAのリファレンス実装 event writer(producer) event reader(consumer) サーバの状態をモニタリングし、event を生成、event reader に送信 event reader(consumer) event writer から event を受信、パーズして出力する Ninf_call & data event writer Ninf Client Ninf Server event data program result event reader parse data

Grid Performance event の実装 Ninf システムに特化した2つの event を定義 NsInvocation Event Server Event 定義されたBase Type を拡張 <xsd:schema xmlns:xsd=“http://www.w3.org/1999/XMLSchema” xmlns:gp=“http://www.gridforum.org/PerfWG/schemas’’/> <xsd:complexType name=“GridEvent ”/> <xsd:element name=“source” type=“xsd:string”/> <xsd:element name=“time” type=“xsd:timeInstant”/> <xsd:element name=“sequenceNumber” type=“xsd:integer” minOccurs=“0”/> </xsd:complexType> </xsd:schema>

NsInvocation Event リモートライブラリ呼び出し(Ninf_call)の実行状況をモニタリング usrID:プログラム実行者のID client:Ninf クライアントのホスト名 server:Ninf サーバのホスト名とポート番号 send(recv)Duration:クライアント-サーバ間の送信(受信)時間 exec(clientExec)Duration:サーバ(クライアント)側での実行時間 startTime:プログラム実行開始時間 functionName:サーバ側で実行されたライブラリ関数名 send(recv)DataSize:クライアント-サーバ間の送信(受信)データサイズ computingSteps:プログラム進行状況

NsInvocation Event Schema <xsd:schema xmlns:xsd="http://www.w3.org/1999/XMLSchema" xmlns:gperf="http://www.gridforum.org/PerfWG/schemas"> <xsd:annotation><xsd:documentation> </xsd:documentation></xsd:annotation> <xsd:element name="NsInvocationEvent"> <xsd:complexType base="grid:GridEvent" deriveBy="extension"> <xsd:element name="client" type="xsd:sting"/> <xsd:element name="usrId" type="xsd:positeiveInteger"/> <xsd:element name="server" type="xsd:sting"/> <xsd:element name="sendDuration" type="xsd:timeDuration"/> <xsd:element name="execDuration" type="xsd:timeDuration"/> <xsd:element name="clientExecDuration" type="xsd:timeDuration"/> <xsd:element name="recvDuration" type="xsd:timeDuration"/> <xsd:element name="startTime" type="xsd:timeInstant"/> <xsd:element name="functionName" type="xsd:sting"/> <xsd:element name="sendDataSize" type="xsd:positiveInteger"/> <xsd:element name="recvDataSize" type="xsd:positiveInteger"/> <xsd:element name="computingSteps" type="xsd:positiveInteger"/> </xsd:complexType> </xsd:element> <xsd:schema>

NsInvocation Event の XML 表現 <description>ninf_call status</description> <source>(null)</source> <time>2001-07-27T01:23:45.678-5:00</time> <client>(null)</client> <usrId>0</usrId> <server>HostA:3000</server> <sendDuration>0.000089</sendDuration> <execDuration>0.000137</execDuration> <clientExecDuration>0.000154</clientExecDuration> <recvDuration>0.000023</recvDuration> <startTime>2001-7-27T01:23:45:000-5:00</startTime> <functionName>sample/mmul</functionName> <sendDataSize>144</senddataSize> <recvDataSize>72</recvDataSize> <computingSteps>-1</computingSteps> </NsInvocationEvent>

Server Event Ninf サーバの状態をモニタリング hostName:Ninf サーバのホスト名 latency: サーバ-クライアント間のレイテンシ throughput:サーバ-クライアント間のスループット freeMemory:空きメモリー容量 freeSwapMemory:空きスワップメモリー容量 processNumber:サーバ上のプロセス数 cpuLoad:サーバのCPU load

Server Event Schema <xsd:schema xmlns:xsd="http://www.w3.org/1999/XMLSchema" xmlns:gperf="http://www.gridforum.org/PerfWG/schemas"> <xsd:annotation><xsd:documentation> </xsd:documentation></xsd:annotation> <xsd:element name="ServerEvent"> <xsd:complexType base="grid:GridEvent" deriveBy="extension"> <xsd:element name="hostName" type="xsd:sting"/> <xsd:element name="latency" type="xsd:timeDuration"/> <xsd:element name="throughput" type="xsd:positiveInteger"/> <xsd:element name="freeMemory" type="xsd:timeDuration"/> <xsd:element name="freeSwapMemory" type="xsd:positiveInteger"/> <xsd:element name="processNumber" type="xsd:positiveInteger"/> <xsd:element name="cpuLoad" type="xsd:double"/> </xsd:complexType> </xsd:element> <xsd:schema>

Server Event の XML 表現 <ServerEvent> <description>this is server event</description> <source>HostA</source> <time>2001-07-27T01:23.456-5:00</time> <hostName>HostA</hostName> <latency>0.05</latency> <throughput>100000</throughput> <freeMemory>12800000</freeMemory> <freeSwapMemory>25600000</freeSwapMemory> <processNumber>34</processNumber> <cpuLoad>60</logInterval> </ServerEvent>

評価 Micro Benchmark 実環境でのモニタリング実験 データ表現 XMLを用いたデータ表現のコストを計測 モニタリングがシステムやネットワークに与える影響を計測 データ表現 XML形式:本研究で定義した Server Event SEQ形式:モニタリング情報をテキストで羅列 XDR形式:機種非依存のバイナリフォーマット “this is server event” HostA 2001-07-27T01:23:456-5:00 HostA 0.05 100000 12800000 25600000 34 60

Micro Benchmark XML, XDR, SEQ形式で表された、それぞれの event(server event) の単位当たりのデータサイズとパーズ処理のコストを計測 使用計算機 PentiumIII 500MHz×2, Memory 512MB パーズコストは1万回の平均値 処理系:Java(Sun JDK1.3 HotSpotVM) XML parser:IBMのXML4J 表現方式 データサイズ bytes/event parse cost ms/event XML 417 10.3741 XDR 132 0.0441 SEQ 107 0.2103 XMLは他の形式に比べ データサイズでおよそ3~4倍 パーズコストはXDRに比べ250倍 SEQに比べ50倍

モニタリングがネットワークやシステムに与える影響を評価 実環境でのモニタリング実験方法 人工的なGrid環境下で、複数点から event を発生、一点で回収 クライアントはポワソン分布に従った一定の間隔でリモートライブラリを呼び出す→event が発生 クライアント-サーバ間の データ転送時間を計測 event writer Ninf_call & data server client result event writer program server : : モニタリングがネットワークやシステムに与える影響を評価 event reader : event writer server parse data event data

ethernet switching hub 実験環境 Ninf サーバ(psi00 – 63) Presto クラスタ(64台中16台) Cerelon 500MHz 384MB Memory Ninfクライアント(clientA, LAN) PentiumIII 500MHz 100base-TX Ninfクライアント(clientB, WAN) PentiumIII 850MHz 256MB Memory 2.4 ~ 2.7 Mbps (京都大学 工学部 建築学科) Titech 2.4~2.7Mbps 100Base-T psi00 psi01 ・・・ psi63 ethernet switching hub clientA clientB Kyoto-u

Local 環境におけるモニタリング(1) Ninf_call の呼び出し間隔1sec

Local 環境におけるモニタリング(2) Ninf_call の行列サイズ 500×500

Global環境におけるモニタリング(1) Ninf_call の呼び出し間隔3sec

Global環境におけるモニタリング(2) Ninf_call の行列サイズ 100×100

考察 XMLのパーズコストは代替のデータ形式と比較して明らかに大きい 実環境を想定した実験では、データ形式の違いがネットワーク性能に与える影響は小さい →実際に用いるには十分許容範囲内 Grid RPC向けの event を定義可能 →event の表現方法としてXMLスキーマは十分強力で、拡張性がある

まとめ 定義・提案されたモニタリングシステムの基本的なアーキテクチャとXMLによるデータ形式に関して について、評価をおこなった モニタリングシステムのスケーラビリティ XMLを用いたデータ表現のコスト データ表現の拡張性 について、評価をおこなった GMAが現実的な設定範囲内でスケーラブル XMLによるコストは許容範囲内 データ表現の拡張性は十分である

今後の課題 定義されたGMAのうち、未実装の機能の実現 複数のサイト間を接続した広域分散環境での検証 directory service, sensor query/subscribe プロトコル 複数のサイト間を接続した広域分散環境での検証