ATLAS実験イベントビルダへの 品質保証機能の適用と性能評価

Slides:



Advertisements
Similar presentations
ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送
Advertisements

動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
高エネルギー加速器研究機構 素粒子原子核研究所 濱田 英太郎
Windows Azure 仮想マシン 入門.
ネットワーク技術II 第8.2課 イーサネット・スイッチング
過負荷時のWebアプリケーションの性能劣化を改善する Session-level Queue Scheduling
COPPER/FINESSE System構築
中村孝介(九州工業大学) 光来健一(九州工業大学/JST CREST)
「LHC First Collisionに向けた実験準備」
TCP (Transmission Control Protocol)
研究背景 クラウドコンピューティングサービスの普及 マルチテナント方式を採用 データセンタの需要が増加
TCPデータ通信との公平性を考慮した 輻輳適応能力を有する MPEG動画像通信のための品質調整機構
Research and Development of Event Building Farm for SuperKEKB
発表の流れ 研究背景 マルチテナント型データセンタ 関連研究 IPマルチキャスト ユニキャスト変換手法 提案手法 性能評価.
DAQ-Middlewareの開発環境と 適用事例
研究背景 クラウドコンピューティングサービスの普及 ユーザ数の増加に伴う問題 マルチテナント方式の採用 データセンタの需要が増加
大きな仮想マシンの 複数ホストへのマイグレーション
バックボーンルータにおける REDの動的閾値制御方式
無線LANにおけるスループット低下の要因の分析
ネストした仮想化を用いた VMの安全な帯域外リモート管理
コンテンツ配信 エンコード (符号化) CBR (Constant Bit Rate) VBR (Variable Bit Rate)
帯域外リモート管理の継続を 実現可能なVMマイグレーション手法
動画像ストリーミングサービスのための プロキシキャッシングシステムの 設計と実装および評価
伝送特性に応じた 適応型映像・音声配信機構の構築
サーバ負荷分散におけるOpenFlowを用いた省電力法
過負荷時のWebアプリケーションの 性能劣化を改善する Page-level Queue Scheduling
Copyright Yumiko OHTAKE
DAQ-Middleware の新機能 コンポーネント制御機能
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
DiffServにおけるクラスの新しい設定方法の提案
E16実験へのDAQ-Middlewareの応用
ATLAS実験ホールにおける TGC検出器DAQシステムの構築
ATLAS前後方ミューオントリガーシステム開発1
リモートホストの異常を検知するための GPUとの直接通信機構
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
仮想メモリを用いた VMマイグレーションの高速化
各種ルータに対応する P2P通信環境に関する研究
ネットワークの性能 牧野ゼミ3年 足立龍哉.
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
東京工業大学 情報理工学研究科 数理・計算科学専攻 千葉研究室 栗田 亮
ATLAS実験におけるシミュレーションを用いたエンドキャップトリガーの性能評価
端末およびサービス透過的な 情報閲覧支援システムの構築
非対称リンクにおける ジャンボフレームの性能評価
SN比を考慮した 無線スケジューリング方式
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
2003年6月17日 早稲田大学大学院理工学研究科 情報科学専攻 修士2年 水野 宏樹
ATLAS 実験における Inner Detector を用いた レベル2ミューオン・トリガーの性能評価
Diffservにおける 絶対的な品質保証法
TCP制御フラグの解析による ネットワーク負荷の推測
仮想ネットワークを考慮した SoftIRQ制御によるCPU割当ての手法
VMMのソフトウェア若化を考慮した クラスタ性能の比較
演習第4回 情報通信技術論 インターネット工学
B物理ゼミ Particle Detectors:Claus Grupen, Boris Shwartz (Particle id
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
仮想環境を用いた 侵入検知システムの安全な構成法
ATLAS実験における高速飛跡 トリガーシステムの開発と構築1
仮想マシンの監視を継続可能なマイグレーション機構
広島大学におけるHEPnet-J 利用状況
仮想マシンに対する 高いサービス可用性を実現する パケットフィルタリング
GbEにおける TCP/IP の研究について
ゼロコピー・マイグレーションを 用いた軽量なソフトウェア若化手法
KEK素核研 エレクトロニクスシステムGr. 仲吉一男
レポート課題1 基本問題:  課題1. あるマシンまでのRTT (Round Trip Time)を測定したところ 128msec(ミリ秒)であった。このマシンに対してウィンドウサイズ64KByteでTCPの通信を行う場合のスループットの予想値を計算せよ。 ヒント1: 授業中に説明したように、スループットの値は、ウィンドウサイズを往復遅延時間で割れば良い。Byteとbitの換算に注意する。計算を簡単にするために1024≒1000として計算して良い(もちろん、この概算を使わなくても良い)。スループットは、ど
ATLAS前後方ミューオントリガーシステム開発1
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
東大素セ 松本浩,田中純一, 上田郁夫,坂本宏,真下哲郎
情報ネットワーク 岡村耕二.
ソケットの拡張によるJava用分散ミドルウエアの高信頼化
Presentation transcript:

ATLAS実験イベントビルダへの 品質保証機能の適用と性能評価 信州大理,高エ研A,広工大工B,長崎総科大工C,阪大理D 長谷川庸司,安芳次A,真鍋篤A,長坂康史B,下島真C,能町正治D, 藤井啓文A,渡瀬芳行A 日本物理学会 年次大会 2003年3月30日 話の内容 ATLASイベントビルダ 品質保証機能 測定のセットアップ 測定結果 まとめ

ATLAS実験のイベントビルダ(1) Level2 Triggerを満足したイベントに対し,多数の検出器からの データ(Event Fragment) を集めEvent Buildを行う. ROS : Readout System 数100 − 1000ノード DFM : Data Flow Manager SFI : Subfarm Interface 数10ノード Event Build Rateは,1〜3 kHz以上でなければならな い. 1つのROSからSFIに転送さ れるEvent Fragment Sizeの 平均値 ≦ 1kBと予想される .

ATLAS実験イベントビルダ(2) Push シナリオ Pull シナリオ(要求・応答型) MulticastによりDFMがROSに転 送先のSFIを知らせる. 実装が単純. Traffic Shaping を行わないので ,転送先(SFI)でCongestionが起 こりやすく,結果としてパケッ トロスが起こりやすい. Pull シナリオ(要求・応答型) DFMからSFIにイベントIDが送 られ,それに基づいて,SFIは ROSにデータを要求する. 実装が複雑. Congestionが起こりにくい.

品質保証機能(Quality of Service; QoS) ネットワークを流れるData Flowに対し,帯域・エラーレート・ 遅延の制御を行う. キューの出口でSchedulerによりFlowが制御される. 宛先,ポート番号等を基にパケットをクラス分けし,それぞ れのキューに振り分ける. Estimatorは送出されるパケットを監視しフィードバックをか ける.

イベントビルダへのQoSの導入 Pushシナリオの欠点のCongestionを防ぐために,QoSによりTraffic Shapingを行う. 転送元(ROS)から送出されるデータフローに対しQoSを適用す る. イベントビルダプログラムを変更する必要がない. PushシナリオにQoSを適用し,Congestionが減り,性能が向上するかどうか確かめる.

セットアップ @ CERN DFM, ROS, SFI : Dual Xeon(2.2-2.4GHz) PCs with 1GB RAM, GbE NIC GbE Switch : BATM OS : RedHat 7.2 Linux kernel 2.4.9-31 (QoS included) with : Scheduling time HZ = 4096 (Hz)→ パケットの 送出時間間隔を細かく 制御(Default = 100). Kernel Buffer size = 8 MB →SFIでのCongestionを 防ぐ. EB software : DC-00-02-02 データ転送にはUDP/IP を用いる. PC Online software: Online-00-17-02 GbE スイッチ

1×1システム(QoSなし) ROS × SFI = 1×1,RoB Data Size 1kB (ROSから送出され るEvent Fragment Size) Trigger Rate (Level2 trigger rate)を変えてEvent Build Rate を測定. 最大レート: Push: 20 kHz → SFIの CPUで制限 Pull: 14 kHz → SFIのCPU で制限 Trigger Rateが40kHz以上にな ると,Event Buildできなくな る.

1×1システム(QoSなし) 1×1システムではPushとPullに定性的な差は見られない. ROSから送出されるRoB Data Sizeを変えてEvent Build RateとThroughputを測 定.Trigger Rage は25 kHz に固定. 最大Throughput : Push, Pull : 52 MB/s @RoB Data Size = 14 kB RoB Data Size ≧ 15 kB では Event Buildできなくなる. 1×1システムではPushとPullに定性的な差は見られない.

6×1システム(QoSなし) ROS × SFI = 6 × 1,RoB Data Size = 1 kB (ROSから 送出されるEvent Fragment Size) Trigger rate (Level2 trigger rate)を変えてEvent Build Rateを測定. 最大Event Build Rate: Push: 5 kHz → SFIの CPUで制限 Pull: 3.8 kHz → SFIの CPUで制限

6×1システム(QoSなし) PushはRoB Data Size > 5 kBで EventBuildできなくなる. SFIでCongestionが発生. SFIでの最大Throughput : Push : 82MB/s → SFIのCPU とSFIでのCongestionが制限 . Pull : 95MB/s → SFIのCPU が制限. PullもRoB Data Size > 14 kBで 性能が低下. PushシナリオにQoSを適用し,Congestionを防ぐことは可能か?

6×1システム(QoSあり) PushシナリオにQoSを適用 帯域設定 : 20, 40, 50 Mbps 20, 40MbpsではRoB Data Size ≧ 5 kBでEvent Build可能 → Congestionが起こらない. PushのSFIでの最大Throughput: 20Mbps : 18MB/s 40Mbps : 〜40MB/s 50Mbps ではCongestionが起こ る. QoSにより適当な帯域を設定することで,Pushシナリオの場合のCongestionを防ぎ,性能改善が可能である.

まとめ ATLAS DataCollection ソフトウエアにQoS機能を適用し,ROS × SFI = 6 × 1のシステムで性能評価を行った. RoB Data Size(EventFragment Size)が小さく,EventBuildできる条件 では,Pushシナリオの方がPullシナリオより性能が良い. Pushシナリオ: SFIが動くCPUの負荷が制限. Pullシナリオ : SFIが動くCPUの負荷が制限. Pushシナリオの場合,EventFragment サイズ≧ 5 kBでEventBuild で きなくなる.Pullシナリオではそのようなことが起こらない. PushシナリオでCongestionが起こっている. PushシナリオにQoSを適用: 帯域 ≦ 40Mbps : RoB Data Size ≧ 5kBでもEventBuildできる. 帯域 ≧ 50Mbps : QoSなしと変らずCongestionが起こる. Congestionが起きない範囲で帯域を設定しても,Pullシナリオ の性能に達するには至らなかった.

今後の展望 ATLAS実験で使われるような,より大きなシステムでテス トを行う.→ Scalabilityの確認. QoSを適用したPushシナリオの性能を,Pullシナリオより改 善することは難しい?. PullシナリオでもQoSを適用して性能が改善するところを考 える. 例えば,control メッセ−ジと dataメッセ−ジを,QoSによ り,別々のクラスに振り分け,controlメッセ−ジの帯域を 確保する.