E16実験へのDAQ-Middlewareの応用

Slides:



Advertisements
Similar presentations
DAQ-Middleware の現状報告 千代浩司 A,F 、仲吉一男 A,F 、安芳次 A,F 、 井上栄二 A,F 、長坂康史 B,F 、味村周平 C,F 、神徳徹雄 D,F 、安藤慶昭 D,F 、和田 正樹 E 高エネルギー加速器研究機構素粒子原子核研究所 A 広島工業大学 B 大坂大学 C 産業技術総合研究所.
Advertisements

ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送
情報理工学系研究科 コンピュータ科学専攻 上嶋裕樹
高エネルギー加速器研究機構 素粒子原子核研究所 濱田 英太郎
最新ファイルの提供を保証する代理FTPサーバの開発
セキュリティ機構のオフロードを考慮した仮想マシンへの動的メモリ割当
榮樂 英樹 LilyVM と仮想化技術 榮樂 英樹
Report of working at CERN PHOS readout test bench
COPPER/FINESSE System構築
J-PARC/MLFの実験データ収集システム
神奈川大学大学院工学研究科 電気電子情報工学専攻
KEK エレクトロニクスシステムグループでの 開発状況 KEK e-sys 庄子 正剛.
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
DAQ-Middlewareの開発環境と 適用事例
千代浩司 高エネルギー加速器研究機構 素粒子原子核研究所
USB2.0対応PICを用いたデータロガーの製作
DAQ-Middlewareトレーニングコース 実習
CsIシンチレータとMAPMT ヘッドアンプユニットを用いた 動作実験
帯域外リモート管理の継続を 実現可能なVMマイグレーション手法
MICE実験におけるSci-fi飛跡検出器 プロトタイプの性能評価
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
DAQ-Middleware トレーニングコース 実習
DAQ-Middleware の新機能 コンポーネント制御機能
R&D of MPPC including readout electronics
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
RT-Linuxを用いた 多入力パルス波高分析システムの開発
読み出し回路のアップグレードに向けた研究
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
Globusにおける GridFTPの性能評価
DiffServにおけるクラスの新しい設定方法の提案
VM専用仮想メモリとの連携による VMマイグレーションの高速化
GEM検出器用DAQ-Middleware
DAQ-Middlewareへの 機器制御機能の実装と性能評価
リモートホストの異常を検知するための GPUとの直接通信機構
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
理化学研究所 重イオン核物理研究室 馬場 秀忠
ネットワークの性能 牧野ゼミ3年 足立龍哉.
DAQ-Middlewareの新機能と 実験への展開
ATLAS実験イベントビルダへの 品質保証機能の適用と性能評価
非対称リンクにおける ジャンボフレームの性能評価
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
宇宙科学統合解析環境の構築とAstro-E2解析支援
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
Ibaraki Univ. Dept of Electrical & Electronic Eng.
複数ホストにまたがって動作する仮想マシンの障害対策
仮想ネットワークを考慮した SoftIRQ制御によるCPU割当ての手法
VMMのソフトウェア若化を考慮した クラスタ性能の比較
M. Uchida, Kyoto University
福岡工業大学 情報工学部 情報工学科 種田研究室 于 聡
広島大学におけるHEPnet-J 利用状況
New NKS 打ち合わせ資料 塚田 暁 2006/4/3.
GbEにおける TCP/IP の研究について
システム玩具を 応用した環境計測システムの構築
pixel 読み出し型 μ-PIC による X線偏光検出器の開発
ゼロコピー・マイグレーションを 用いた軽量なソフトウェア若化手法
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
KEK素核研 エレクトロニクスシステムGr. 仲吉一男
強制パススルー機構を用いた VMの安全な帯域外リモート管理
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
ガス電子増幅器を読み出しに用いた タイムプロジェクションチェンバー (GEM-TPC)の開発
特定ユーザーのみが利用可能な仮想プライベート・ネットワーク
東大素セ 松本浩,田中純一, 上田郁夫,坂本宏,真下哲郎
Report of working at CERN PHOS readout test bench
ソケットの拡張によるJava用分散ミドルウエアの高信頼化
強制パススルー機構を用いた VMの安全な帯域外リモート管理
総合政策学部3年 HORN 丸山大佑(marudai) 親:shunaokiさん
Presentation transcript:

E16実験へのDAQ-Middlewareの応用 森野雄平A, 高橋智則A, 中井恒BA, 川間大介A, 小原裕貴B KEK素核研, 理研A, 東大理B 2014/3/30 日本物理学会

目次 ・E16実験について ・DAQ-Middlewareについて ・作成したプロトタイプの紹介 ・まとめ 概要 2つの特徴 DAQ性能 2014/3/30 日本物理学会

E16実験 茨城県東海村 J-PARCハドロン実験施設で開始予定 ベクトル中間子の質量変化現象を高統計・高分解能で測定 2014/3/30 日本物理学会

自分の担当 DAQ-Middlewareを用いて、データ収集、保存、解析を行なうソフトウェアを作成 450MB/s ~96000 ch (56000+40000) DAQ-Middlewareを用いて、データ収集、保存、解析を行なうソフトウェアを作成 CERN RD51 SRS GEM APV25-hybrd Junction box DTC-LINK SRS ADC+FEC Tracker SRS SRU HBD Gas Cherenkov TRG-ADTX (ASD) SRS CTF Belle2 FTSW or alternative Network switch DAQ PC TRG-MRG (MUX, GTX) 450MB/s Belle2 UT-3 Leadglass EMCAL 3“ PMT LG-FEM Data flow Trigger primitive SRS SRU Shaper + FADC Global clock, global trigger ~1000 ch SRS CTF Discri + DRS4 DTC-LINK 2014/3/30 日本物理学会

DAQ-Middleware ネットワーク分散 分散して配置されたノード同士が連携して通信するネットワークを形成 PC1 PC2 PC3 PC4 Daq Operator 2014/3/30 日本物理学会

E16実験 DAQソフトウェア開発状況 PC1台を用いて構成されるプロトタイプを作成、評価 プロトタイプを利用して、全体の構築を行なっていく Operator 2014/3/30 日本物理学会

E16実験用プロトタイプ 概要 1リードアウトモジュール から送られるデータ Dispatcher Logger Gatherer Monitor PC 平均 最大値 1イベントあたりの データサイズ 14kB 45kB トリガーレート 1kHz 2kHz ・・・ Gatherer    :複数のリードアウトモジュールからデータを読み込み Dispacher :Gathererから受け取ったデータを、LoggerとMonitorに送信 Logger :全データをPCのハードディスクに保存 Monitor : 一定期間ごとにデータをモニタリング 2014/3/30 日本物理学会

特徴1 リングバッファの拡大 リングバッファを大きくする(最新の追加機能) HD書き込みのレイテンシの問題を解決 特徴1 リングバッファの拡大 ①受信したデータは、 リングバッファに格納 ②プログラムがバッファからデータを取得 Loggerコンポーネントでリングバッファが小さい場合 ①ハードディスクの書き込みにレイテンシが発生するときがある (しばらく書き込めない) ②書きこめない間、処理が進まない ③リングバッファにデータが溜まっていき、あふれてしまうことがある ④ソフトウェア全体が適切に動作しない PC Logger ・・・ Gatherer Dispatcher Monitor リングバッファを大きくする(最新の追加機能) HD書き込みのレイテンシの問題を解決 2014/3/30 日本物理学会

特徴2 コンポーネント間通信処理オーバヘッドの軽減 特徴2 コンポーネント間通信処理オーバヘッドの軽減 オーバヘッド コンポーネント間でのデータのやり取りを行なう際の転送以外の処理 多いとDAQ性能の低下につながる 影響を小さくする方法 コンポーネント間のデータのやり取りを少なくする データをまとめる Dispatcher Logger Gatherer Monitor 1event 1イベントごとに次の コンポーネントへ送る →オーバヘッド大きい 200KB 200KBたまったら次の コンポーネントへ送る →オーバヘッド小さい 2014/3/30 日本物理学会

DAQ性能 PC (DAQ PC) DAQ-MW テスト環境 PC (エミュレータ) 1リードアウトモジュール から送られるデータ CPU Intel(R) Xeon(R)     X5650 @ 2.67GHz 6コア Memory 24GB OS Scientific Linux 6.4 DAQ-MW テスト環境 PC (エミュレータ) 1リードアウトモジュール から送られるデータ テスト方法 エミュレータPCからDAQ PCにテストデータを送信 送ったデータの転送速度とプロトタイプの処理速度を比較 平均 最大値 1イベントあたりの データサイズ 14kB 45kB トリガーレート 1kHz 2kHz 2014/3/30 日本物理学会

DAQ性能 PC (DAQ PC) DAQ-MW テスト環境 PC (エミュレータ) テスト結果 1リードアウトモジュール CPU Intel(R) Xeon(R)     X5650 @ 2.67GHz 6コア Memory 24GB OS Scientific Linux 6.4 DAQ-MW テスト環境 PC (エミュレータ) テスト結果  1リードアウトモジュール から送られるデータ 平均 最大値 1イベントあたりの データサイズ 14kB 45kB トリガーレート 1kHz 2kHz 2kHzまで、プロトタイプは送られたデータ全てを処理している 2014/3/30 日本物理学会

DAQ性能 PC (DAQ PC) DAQ-MW テスト環境 PC (エミュレータ) テスト結果 1リードアウトモジュール CPU Intel(R) Xeon(R)     X5650 @ 2.67GHz 6コア Memory 24GB OS Scientific Linux 6.4 DAQ-MW テスト環境 PC (エミュレータ) テスト結果  1リードアウトモジュール から送られるデータ 平均 最大値 1イベントあたりの データサイズ 14kB 45kB トリガーレート 1kHz 2kHz 2kHzまで、プロトタイプは送られたデータ全てを処理している 2014/3/30 日本物理学会

まとめ E16実験DAQのソフトウェアを開発 現在は、1PCで動くプロトタイプを作成 E16実験用プロトタイプ 特徴 今後の予定    特徴 リングバッファの拡大 コンポーネント間通信処理オーバヘッドの軽減 性能 リードアウトモジュール1台の場合、実験の想定された性能を満たしている 今後の予定 多くのエミュレータを用意した場合のテスト プロトタイプを用いて、システム全体の設計を行なっていく 2014/3/30 日本物理学会

Backup 2014/3/30 日本物理学会

DAQ性能 PC (DAQ PC) DAQ-MW テスト環境 PC (エミュレータ) PC (エミュレータ) スケーラブルの変化ではない CPU Intel(R) Xeon(R)     X5650 @ 2.67GHz 6コア Memory 24GB OS Scientific Linux 6.4 DAQ-MW テスト環境 PC (エミュレータ) PC (エミュレータ) スケーラブルの変化ではない Gathererコンポーネントをが1つのCPUコアで処理されているから DAQ PCに求められる性能 テスト結果  平均 最大値 1イベントあたりの データサイズ 14kB 45kB トリガーレート 1kHz 2kHz 2kHzまで、プロトタイプは送られたデータ全てを処理している 2014/3/30 日本物理学会

コンポーネントの考えている構成 考えている構成 Gatherコンポーネントを1つのCPUコアで処理を行なっている (2つ以上のモジュールを読む場合でも) PC Logger ・・・ Gatherer Dispatcher Monitor PC 今 Gatherコンポーネントを1つのCPUコアで処理を行なっている (2つ以上のモジュールを読む場合でも) Logger Dispatcher Monitor Gatherer 2014/3/30 日本物理学会

全テスト結果 2014/3/30 日本物理学会

PC使用率 TOPコマンドを用いて、GathererコンポーネントのCPU使用率を取得 trigger rateをあがるにつれてCPU使用率も上昇 1イベントあたりのデータ量が上がるにつれてCPU使用率も上昇 2014/3/30 日本物理学会

overhead 性能テスト 1イベントあたりのデータ量 14kBの場合 2014/3/30 日本物理学会

DAQ性能 PC DAQ-MW テスト環境 PC (エミュレータ) 1イベントのデータを16回かけて送信 実験では、1kHz~2kHz CPU Intel(R) Xeon(R)     X5650 @ 2.67GHz 6コア Memory 24GB OS Scientific Linux 6.4 DAQ-MW テスト環境 PC (エミュレータ) 1イベントのデータを16回かけて送信 実験では、1kHz~2kHz   この間では、問題ない 2modulesにすると、性能が落ちる   Gatherが1コアで処理を行なって    いるから 2014/3/30 日本物理学会

4components Source Dispacher Sink の4つのコンポーネント SourceはDispacherに、データを送ります。 Dispacherは、exampleと変わっていません。2つのSinkにデータを送ります。 Source,Sinkは千代さんが以前、性能テストで使ったコンポーネントと同じことを行なっています。 各BufferSizeを5分間測定したときの結果です。

4components Source Dispacher Sink の4つのコンポーネント SourceはDispacherに、データを送ります。 Dispacherは、exampleと変わっていません。2つのSinkにデータを送ります。 Source,Sinkは千代さんが以前、性能テストで使ったコンポーネントと同じことを行なっています。 各BufferSizeを30分間測定したときの結果です。 これを5回行ないました。 (色の違いは、何回目に測定したか、です) 30分測定こともあり、ほとんど色にばらつきはありません この結果より、このコンポーネントの組み合わせの場合、最大約340MB/sのスループットで処理できることが分かりました。