ネットワークトポロジを考慮した効率的なバンド幅推定手法

Slides:



Advertisements
Similar presentations
G ゼミ 2010/5/14 渡辺健人. パフォーマンスの測定 CUDA Visual Profiler CUDA の SDK に標準でついているパフォーマン ス測定用のツール 使い方: exe ファイルのパスと作業ディレクトリ指定して実 行するだけ 注意点 : GPU のコード実行後にプログラム終了前に,
Advertisements

HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
IP over DVB-RCS の設計と実装 研究背景 DVB-RCS 衛星回線を用いて受信局から送信局への狭帯域な戻り回線を提供 Forward Link Return Link HUB Terminal.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Webプロキシサーバにおける 動的資源管理方式の提案と実装
最新ファイルの提供を保証する代理FTPサーバの開発
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
TCPコネクションの分割 によるスループットの向上
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
ラウンドトリップタイムを指標とした 無線LAN のためのアクセスポイント選択手法
スケールフリーネットワークにおける 経路制御のためのフラッディング手法の提案と評価
報告 (2006/9/6) 高橋 慧.
神奈川大学大学院工学研究科 電気電子情報工学専攻
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
発表の流れ 研究背景 マルチテナント型データセンタ 関連研究 IPマルチキャスト ユニキャスト変換手法 提案手法 性能評価.
プログラムの動作を理解するための技術として
リンクパワーオフによる光ネットワークの省電力化
センサノード 時刻同期と位置測定 浅川 和久 2008/11/16 センサノード 時刻同期と位置測定.
統計学 第3回 10/11 担当:鈴木智也.
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
リファクタリングのための 変更波及解析を利用した テスト支援ツールの提案
ノードの情報を動的に反映したオーバレイネットワークの構築
ネットワークとノードの情報を利用したオーバレイネットワークの最適化
現金に替わる電子マネーの実装 200702894 大城 翔太 木下研究室.
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
大規模ネットワークにおける バンド幅測定アルゴリズム
サーバ負荷分散におけるOpenFlowを用いた省電力法
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
文献名 “Performance Tuning of a CFD Code on the Earth Simulator”
Ibaraki Univ. Dept of Electrical & Electronic Eng.
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
ネットワークトポロジーを考慮した効率的なバンド幅推定手法
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
動的依存グラフの3-gramを用いた 実行トレースの比較手法
トポロジを考慮する データ転送スケジュラー
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
リモートホストの異常を検知するための GPUとの直接通信機構
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
実行時情報に基づく OSカーネルのコンフィグ最小化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
分散環境でのStableな ブロードキャストアルゴリズムの 提案と実装
雑音環境下における 非負値行列因子分解を用いた声質変換
大規模ネットワークにおける 効率的なバンド幅マップ構築アルゴリズム
Internet広域分散協調サーチロボット の研究開発
通信機構合わせた最適化をおこなう並列化ンパイラ
東京工業大学 情報理工学研究科 数理・計算科学専攻 千葉研究室 栗田 亮
非対称リンクにおける ジャンボフレームの性能評価
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
DNSクエリーパターンを用いたOSの推定
VMMのソフトウェア若化を考慮した クラスタ性能の比較
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供
Virtualizing a Multiprocessor Machine on a Network of Computers
コーディングパターンの あいまい検索の提案と実装
1999年度 卒業論文 UDPパケットの最適な送信間隔の検討 早稲田大学理工学部情報学科 G96P026-4 小川裕二.
設計情報の再利用を目的とした UML図の自動推薦ツール
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
大規模ネットワークにおける 効率的なバンド幅マップ構築アルゴリズム
高齢者支援アプリケーション Term Projectの最終発表 Bull:ECN Takatoshi:親
GbEにおける TCP/IP の研究について
アドホックルーティングにおける 省電力フラッディング手法の提案
衛星回線を含むネットワークにおける 動的経路制御に関する研究
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
Webページタイプによるクラスタ リングを用いた検索支援システム
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
まさ 2003/06/12 卒論その後の進捗 まさ 2003/06/12.
プログラム依存グラフを用いた ソースコードのパターン違反検出法
Presentation transcript:

ネットワークトポロジを考慮した効率的なバンド幅推定手法 長沼翔 高橋慧 斎藤秀雄 柴田剛志 田浦健次朗 近山隆 (東京大学)

背景 バンド幅マップを得ることはますます重要に ネットワークの管理、運用のため 広域分散アプリケーションの最適化のため 8 8 10 7 9 3 5 A S B C D E F バンド幅マップの例

背景 バンド幅マップを得ることはますます重要に ネットワークの管理、運用のため 広域分散アプリケーションの最適化のため only 3!? 8 以前からよくあるパターン、使いみち 8 8 10 7 10 9 3 5 A S B C D E F only 3!?

背景 バンド幅マップを得ることはますます重要に ネットワークの管理、運用のため 広域分散アプリケーションの最適化のため ますますというゆえんは広域分散環境上で並列処理が盛んにおこなわれるようになってきて、 ネットワークの性能も、アプリケーション最適化するための指標の一つとなった。 8 8 Throughput = 3 10 7 10 9 3 5 source : (A) destinations : others A S B C D E F パイプラインを用いたブロードキャスト

A Stable Broadcast Algorithm [Kei Takahashi et al, CCGrid2008] 背景 バンド幅マップを得ることはますます重要に ネットワークの管理、運用のため 広域分散アプリケーションの最適化のため タスクをばらまくタスクスケジューラや Map reduceの際のタスクばらまき時の最適なばらまき方っていうのを実現できると考えられる 3 4 8 1 5 source : (A) destinations : others A S B C D E F A Stable Broadcast Algorithm [Kei Takahashi et al, CCGrid2008]

背景 バンド幅マップを得ることの難しさ ネットワークの深部の情報が得られない 多大な時間と手間を要する 既存の1対1推定ではボトルネックリンクしか得られないことがほとんど 多大な時間と手間を要する ホスト数N に対して推定すべき組み合わせはO(N2) 深部 -> ツリーと見たときのルート付近 ただ列挙するマトリクス 情報量が削減されている 応用が利かない マップとして得ないと、先ほどの例のどれも実現できない バンド幅マップ 従来方法で得られるバンド幅マトリクス A B C D E F - 3 7 8 5 9 8 8 10 7 10 9 3 5 A S B C D E F

目的 バンド幅マップを得る為の新たな手法の提案 正確 高速 ユーザレベルで実行可能 ネットワーク深部まで把握できる 高いスケーラビリティを持つ ユーザレベルで実行可能 root 権限を必要としない 機器や規格に依らない 既存手法の中にはroot 権限を必要としたり、snmpとかは機器や規格に依るものがある

352 ホストからなる分散環境で120 秒程度で構築ができた

発表の流れ 背景と目的 既存手法の紹介 提案手法の紹介 実験と評価 まとめ

1対1の推定を基調とした手法 Iperf など (Streaming method) 10 sec データを送受信,送れたデータサイズを10 sec で割る ○ 正確でばらつきの小さい結果 × ボトルネックリンクの値しか得られない Pathchar など (One-Packet method) パケットの伝送時間をキュー待ち,機器の遅れ,転送時間に分けて考え,沢山の観測データから転送時間のみを抽出し,バンド幅を算出する ○ 負荷が小さい × 不正確でしかもばらつきが大きい,スイッチが介在すると測れない,測定時間が長い,root 権限が必要など Nettimer など (Packet-Pair method) 二つのパケットを連続送信し,受信側で到達時間の差を見,それから間のリンクのバンド幅を推定する ○ Pathchar より高速 × 不正確でしかもばらつきが大きい,ボトルネックリンクの値しか得られない 一対一の推定では ボトルネックリンクしか得られない 時間と手間がかかりすぎる そもそもマトリクスしかえられないので本研究の目標とは別方向 これらを使ってバンド幅マップを構築することは不可能

Network Weather Service 各ホストにデーモンが置かれる 各ホスト間の全体全で推定を自動に行う 結局、得られるものはバンド幅マトリクス 手間は省けるが、バンド幅マップの様な詳細な情報は得られない スケールしない トポロジアンアウェア 推定の干渉・競合を避けるためにトークンを渡して一つ一つやっている デーモン走らせて、ユーザは出来上がるのをまったり待つというポリシーかもしれないが、スマートな方法ではない ?

perfSONAR SNMP を用いたネットワーク監視ツール ただし機器や規格に依存する 得られるバンド幅の値は定格値 高速であり、バンド幅マップの様な詳細な情報も得られる ただし機器や規格に依存する SNMP 非対応の機器 perfSONARプロトコルの標準化 得られるバンド幅の値は定格値 ユーザレベルではあまり実用的ではない データベースをつつくだけなので 味が違うのが、実際に測ってバンド幅を確かめるのではなく、管理データを見て調べるというようなアプローチ 非対応の機器も未だ多くある。通信経路上のすべての機器についてそれを確かめたり置き換えたりするのは現実的ではない 実際に測るのと管理データをつつくことの違いは、ここ

発表の流れ 背景と目的 既存手法の紹介 提案手法の紹介 実験と評価 まとめ

問題設定 木構造ネットワーク上に、バンド幅マップを構築する トポロジは既知とする リンクのバンド幅は上下対称とする トポロジは高速に推定可能 入力はトポロジ、出力はそれの全リンクにバンド幅の値を割り当てたバンド幅マップ トポロジは既知とする トポロジは高速に推定可能 4 クラスタ,256 ノードの推定に16 秒 Shirai et al. A Fast Topology Inference (HPDC 2007) リンクのバンド幅は上下対称とする 一般の場合にも適用可能

提案手法 基本はIperf トポロジを基本セットに分解して考え、それらを葉部からボトムアップ式に並列に推定を進める 1対1を推定対象の単位とするのではなく、 1スイッチ + 3ノードで1セット(基本セット) を推定対象の単位とする トポロジを基本セットに分解して考え、それらを葉部からボトムアップ式に並列に推定を進める 前スライドの仮定のもと、 Iperf の何を改善したかというと、、

全体的な処理の進み方 葉の部分からじわりじわりとリンクのバンド幅を決定していくイメージ

個々の基本セットの推定 基本セット 1 スイッチに3 ノード(ホスト,スイッチ等)が接続されたネットワーク B Link A Link Link C 基本セット 1 スイッチに3 ノード(ホスト,スイッチ等)が接続されたネットワーク 一般のネットワークは基本セットの連続である

基本セットのバンド幅マップは,4 ケースしかない 個々の基本セットの推定 a a B B a a Link Link A A Link Link Link Link a C b C b B b B a a Link Link A Link A Link Link Link b C c C 基本セットのバンド幅マップは,4 ケースしかない                      ( a < b < c としてよい)

各ケースで期待される、1 対 1 もしくは 1 対 2 のバンド幅推定結果 個々の基本セットの推定 4 ケースのバンド幅マップ y x B Link A Link Link たとえばcase 3 だった場合、A と一対一推定するとバンド幅aがボトルネックとなって、aとしか出ない、bは見えてこない 一対一が三種類、一対二が三種類、そういったことを利用して、絞り込み z C 各ケースで期待される、1 対 1 もしくは 1 対 2 のバンド幅推定結果 a < b < c

各ケースで期待される、1 対 1 もしくは 1 対 2 のバンド幅推定結果 個々の基本セットの推定 i j j B Link A Link 基本セットの推定完了 ( i < j < k ) i Link j k 初めはABCの区別もない C k 各ケースで期待される、1 対 1 もしくは 1 対 2 のバンド幅推定結果 a < b < c 20

個々の基本セットの推定 一般の場合の推定手順 y 個々の基本セットの推定  一般の場合の推定手順 x B Link A Link Link z 1 対1 推定を三種類行う。 If  二種の異なる値が観測された 1 対2 推定を二種類行う。 If  異なる値が観測された case 4 Else if  等しい値が観測された case 3 Else if  三つとも等しい値が観測された 1 対2 推定を三種類行う。 if  二種の異なる値が観測された case 2 case 1 C 手順 論文にも同じものが載っているので、詳しく確認したい方はそちらを a < b < c

セットまでの経路にボトルネックリンクがあると、結果が誤る 基本セットは決定できたが… セットまでの経路にボトルネックリンクがあると、結果が誤る さて、基本セットの推定はできました。これを実際のネットワーク上でボトムアップ式に 実行していけばいいかというと実は     それでは不十分。ネットワークの深部に進むにつれて、 ネットワークの深部にある基本セットでは、そこ にたどり着くまでにボトルネックリンクを通ってしまうかもしれない。 せっかくやってもこれじゃ意味がない

ネットワーク深部 (エンドホストから離れた位置にある基本セット)では、束ねたストリームを用いる 各スイッチがもつ子ノードから必要最小限の複数ホストを選んで、 そいつらから同時にストリームをセンドレシーブすることによって、 この基本セットから見れば一本の大きいストリームで基本セットの決定を行うことができる

提案手法の特徴 詳細なバンド幅マップの推定が可能 高速でスケーラブル root 権限は不要、ネットワーク機器の設定変更なども不要 基本セット、ストリームの束という考え方を組み合わせることで実現 高速でスケーラブル 干渉・競合を気にせず、各セットを葉部分から並列に推定を進めることができるため root 権限は不要、ネットワーク機器の設定変更なども不要 各セットはネットワーク的に独立している

発表の流れ 背景と目的 既存手法の紹介 提案手法の紹介 実験と評価 まとめ

実験結果 先に提案した手法を利用した、バンド幅マップ推定ツールを実装した 11 クラスタ、352 エンドホストで構成される、実際の広域分散環境上で実行し、120 秒程度でバンド幅マップが得られた

実験環境 hongo@東大 imade@京大 suzuk@東工大 kyoto@京大 hiro@広島大 kyushu@九州大 kobe@神戸大 85 hosts imade@京大 31 hosts 15 14 14 suzuk@東工大 37 hosts 31 37 14 14 14 kyoto@京大 36 hosts mirai@未来大 6 hosts 6 バンド幅マップを構築する環境として, InTrigger InTrigger とは日本各地に散らばったクラスタをネットワーク接続して、広域分散環境を作ろうというプロジェクト 11 clusters, more than 300 nodes 36 hiro@広島大 11 hosts okubo@早大 15 hosts 15 11 keio@慶應 11 hosts 11 kyushu@九州大 10 hosts 10 11 kobe@神戸大 11 hosts chiba@NII 129 hosts 16 19 16 19 48 10

バンド幅マップを図示したもの 定格の値から大きく外れているリンクも多い

一部を拡大したもの

推定精度 実験環境の全リンクについて, 実際に負荷をかけて確かめたスループットに対する実験結果の比と, 実用という観点からすると非常に有用で正確な値が得られた。±5% 誤差がでた理由として、タイミング合わせがうまくいかなかった。 Iperf そのものの誤差(2秒)など 実験環境の全リンクについて, 実際に負荷をかけて確かめたスループットに対する実験結果の比と, そのような比の値をとったリンクの出現頻度

推定時間 本手法はツリーの直径d に比例した時間を要する. ホスト数 N のときd はΟ(log N) 、なので推定時間はlog N。グラフからも確かめられる 既存手法ではO(N^2)をやっていたのとくらべ、非常に高速で、かつスケーラブルである

発表の流れ 背景と目的 既存手法の紹介 提案手法の紹介 実験と評価 まとめ

まとめ 正確かつ短時間にバンド幅マップを推定する手法を提案した. 実際の分散環境上で実験を行い,その精度を検証し,またスケーラビリティの高さを確認した. 11 クラスタ,352 ホストの環境で120 秒程度

今後考えられる課題 一般的なネットワークの適用 非ツリー 非対称なリンク ストリームを流す方向も制御して、そこに2 本のリンクがあるとして推定を進める など