ATLAS実験における 高速トラッキングトリガーシステムの シミュレーションによる最適化

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

RHIC-PHENIX 実験におけるシ リコン崩壊点検出器 (VTX) の アライメント 浅野秀光 ( 京大理) for the PHENIX collaboration 1 日本物理学会 2011 秋.
ガス検出器: 散乱体 反跳電子の飛跡と Energy シンチレーションカメラ : 吸収体 散乱γ線の吸収点と Energy μ-PIC+GEM.
寄田浩平 For ATLAS-FTK Group 早稲田大学理工学術院 (ATLAS-Institute: U of Chicago)
LHC-ATLAS実験アップグレードに向けた Micromegas検出器の中性子ビームを用いた動作試験
Report of working at CERN PHOS readout test bench
科研費特定領域第二回研究会 「質量起源と超対称性物理の研究」
COPPER/FINESSE System構築
MEG実験2009 陽電子スペクトロメータの性能評価
太陽ニュートリノのための スーパーカミオカンデIII 低エネルギーバックグランド低減の研究
ATLAS実験 宇宙線テストにおける シリコン飛跡検出器の検出効率の評価
相対論的重イオン衝突実験PHENIX におけるシミュレーションによる charm粒子測定の可能性を探る
Tohoku University Kyo Tsukada
CsIシンチレータとMAPMT ヘッドアンプユニットを用いた 動作実験
microTPC を用いたガンマ線 イメージング検出器の開発V
ATLAS実験シリコン飛跡検出器の宇宙線テストにおけるノイズ解析
ATLAS実験シリコン検出器の 飛跡再構成の精度解析
CYRIC Hyperball2 technical memo
読み出し回路のアップグレードに向けた研究
ATLAS実験における FTK受信モジュールの 開発構築と実機試験
ATLAS検出器におけるFake Leptonの割合と Higgs・SUSY粒子探索に与える影響の研究
寄田浩平 for ATLAS-FTK Group シカゴ大学 日本物理学会@山形大学 2008年9月23日(火)
γコンバージョン事象を用いた ATLAS内部飛跡検出器の物質量評価
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
ATLAS実験ミューオン検出器の 実験データを用いた 検出効率評価法の研究
E16実験へのDAQ-Middlewareの応用
ATLAS実験ホールにおける TGC検出器DAQシステムの構築
ATLAS前後方ミューオントリガーシステム開発1
ATLAS用 大型TGCに対する中性子照射試験
ATLAS実験におけるZ→μμ(W→mn)事象の測定
理化学研究所 重イオン核物理研究室 馬場 秀忠
ATLAS実験における J/Y->mm過程を用いたdi-muon trigger efficiency の測定方法の開発及び評価
K+→π+π0γ崩壊中の 光子直接放射過程の測定
Timing for PF Injection from GU_A1
高エネルギー重イオン衝突実験 PHENIXにおける 光子崩壊を用いた低質量ハドロン探索
ATLAS実験における高速飛跡トリガーシステムの開発と構築3
Belle II SVDに向けた SOI pixel検出器の検討
ATLAS実験におけるシミュレーションを用いたエンドキャップトリガーの性能評価
MICE実験用SciFi飛跡検出器の性能評価(2)
ATLAS実験イベントビルダへの 品質保証機能の適用と性能評価
LHC-ATLAS実験SCTシリコン 飛跡検出器のコミッショニング - II
3次元位置感応型ガンマ線検出器と それに必要なデバイス
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
ATLAS 実験における Inner Detector を用いた レベル2ミューオン・トリガーの性能評価
Scintillator と Gas Cherenkovと Lead Glass のデータ解析
ATLAS検出器におけるFake Leptonの割合と Higgs・SUSY粒子探索に与える影響の研究
シミュレーションサンプルを用いた光子コンバージョン再構成
Z(mm)イベントを用いた ATLAS LVL1 Muon Trigger Systemのコミッショニング
メッシュ付きμ-PICの メッシュ構造の最適化のシミュレーション Maxwell3DとGarfield
γコンバージョン事象を用いた ATLAS内部飛跡検出器の物質量評価
オルソポジトロニウムの寿命測定による束縛系QEDの実験的検証
アトラスシリコン半導体飛跡検出器:ATLAS Silicon-strip Tracking Detector
ダークマター検出器の だあくまたん 低圧ガスでの動作パラメータの最適化 京大理 中村 輝石 NEWAGE 低圧ガス ラドン除去システム
FINESSE 32ch Multi-Hit TDC
ATLAS実験における高速飛跡 トリガーシステムの開発と構築1
Layout changes Pixel layout ATLAS TDR DC1 B layer R=4 cm R=5.05 cm
μ+N→τ+N反応探索実験の ためのシミュレーション計算
Data Clustering: A Review
New NKS 打ち合わせ資料 塚田 暁 2006/4/3.
ガスの低圧化による ダークマター検出器の高感度化
pixel 読み出し型 μ-PIC による X線偏光検出器の開発
Measurements of J/ψ with PHENIX Muon Arms in 2003 p+p Collisions
LHC-ATLAS実験開始に向けた ミュー粒子トリガーシステムの統合試運転
LHC計画ATLAS実験における 超対称性の発見の研究
ILC衝突点ビームモニターのための 読み出し回路の開発
ATLAS前後方ミューオントリガーシステム開発1
ATLAS実験におけるSUSY の発見能力
2010年夏までの成果 測定器の性能の確認 既知粒子の再発見 W,Z ジェット 超対称性粒子の探索の始まり トップクォークの再発見
Report of working at CERN PHOS readout test bench
科研費特定領域 「質量起源と超対称性物理の研究」 第三回研究会
Presentation transcript:

ATLAS実験における 高速トラッキングトリガーシステムの シミュレーションによる最適化 千葉英誉, 木村直樹,寄田浩平 早稲田大学 ATLAS FTK Group 日本物理学会 2010年 春季大会 3月21日 岡山大学津島キャンパス 21aBE会場

ATLAS Trigger System & FTK(Fast TracKer) 飛跡検出器 Input&Process 飛跡検出器内部の Pixel/SCTからHit情報のみ貰い,Trackを再構成する。 FTK Output Pixel 3Layer Barrel SCT 8Layer 1GeV以上(|η|<2.5)の全てのTrackのPt,φ,η,Z,d をLVL2に渡す。 数週間前 Technical Proposal(p.93)を提出 現在TDAQ(USG)でレビュー中 2 1

FTKの目的 現行のデザイン b quark light quark LVL2以降のPCファームで WH(120)3×1034 PILEUP Black→OffLIneRed→FTK Impact Parameter light quark b quark 現行のデザイン LVL2以降のPCファームで 領域を選択し(RoI),Trackを再構成 FTK挿入後 100μsec以下の処理速度で事象中の 全てのTrack (1GeV以上) を再構成 Track情報の使用     bジェット同定,τ同定を飛躍的に向上 @LVL2 35 L=1034[cm-2 ・s-1]@Atlfast FTK有 FTK無 ⇒QCD事象をより多く破棄することできる。 ⇒マルチジェットトリガーのPt閾値を下げられるなど。(右図) 2.RoI以外のオブジェクトをLVL2トリガーに加えられる 3. eやμトリガーにも応用可能  など 高ルミノシティ下でも安定したTrack情報の供給 LVL2でより洗練されたAlgorithmが使用可能に 3 2

FTKの基本動作原理 2. Super Strip単位での 1. Hit情報をどの”Super Strip”に Pattern Recognition → ”Road” (Associative Memory) 1. Hit情報をどの”Super Strip”に 位置するか分ける。(Data Organizer) Layer4 Layer3 Road1 Road2 Layer2 Layer1 モジュール Super Strip Hit位置 <FTKの重要なパラメータ> 3. Track Fitting Stage 素早く処理できる構成方法 Full ResolutionのHit情報を使用 Super Strip size pattern sizeに影響 Layerの組み合わせ 現状の方法 2つ提案中 今回はコチラのみ SCT8Layer Fit ⇒ Pixel+SCT 11Layer Fit Pixel 3L+SCT 4L Fit ⇒ 11Layer Fit 3

Φ 16等分×η 4等分⇒64 Processor Unit FTKシステム FTK overlap regions Processor Unit Pixel & SCT cluster finding split by layer Super Strip Data Organizer (DO) Associative Memory (AM) Data Formatter (DF) RODs S-links Hit Road Hit Road Input 50kHz~100kHz Track Fitter (TF) 1st Stage SCT8Layerのみ計算 Hit Warrior (HW) Raw data ROBs 1等分に1Board X64 (each region) Processor Unit 2nd Stage 11Layer全てにおいて計算 Φ 16等分×η 4等分⇒64 Processor Unit 8(16) Processor Unit ⇒ 1 VME Crate Track Data ROB 但し,十分なOverlapを含んだRegion分け 5 4

Data Organizer / 1Board=1分割分 ☆LVL1のOutputは100kHzを仮定 1Regionにおける Layerごとの平均Hit数 Pixel 1 868.1 ± 6.4 Pixel 2 687.3 ± 4.2 Pixel 3 627.3 ± 4.2 SCT 4 411.1 ± 2.0 SCT 5 410.8 ± 2.0 SCT 6 446.0 ± 2.1 SCT 7 441.1 ± 2.1 SCT 8 404.0 ± 1.8 SCT 9 404.6 ± 1.9 SCT 10 387.4 ± 1.7 SCT 11 386.2 ± 1.7 1Evを10μsで処理が必要 WHbb L=3×1034[cm-2・s-1] Pile-up ☆Input&OutputはPipelineで100MHz  1Layer辺り,1000Hitまでなら 処理可能 (Input OK) ☆1つのDO に対し100MHzのClockで処理  #SS<#HitなのでOK Hits of SCT11 Hits of SCT 4 Hits of SCT 5 Hits of SCT 6 Hits of SCT 7 Hits of SCT 8 Hits of SCT 9 Hits of SCT10 100 MHz 100MHz DO hit SCT8L SS 5

Associative Memory "Pattern Recognition" Road AM 100 MHz SS 200 Input 100MHz #SS<#HitからOK LAMB 200MHz AM From DO DOから全てのSS情報を 得てから処理開始!! 平均Road数 3.1k →Output OK WHbb L=3×1034[cm-2・s-1] Pile-up <スペック> AMは4枚(LAMB)で処理する 1LAMB 200MHzの処理能力 4LAMB=4×200MHz=800MHz  → 8k Roadまで耐える! 6

Road内のHitをFull ResolutionでFitする Track Fitter / 1Board 100 MHz DO road & hit 100MHz TF 500MHz Fit1 Fit3 2ndDO⇒TF Road HitとRoadをTFに送る From AM 転送速度100MHz×4 4k以内のデータ量 3.1kRoadから転送可能 Road内のHitをFull ResolutionでFitする TF 平均Fit数 12.8k → OK WHbb L=3×1034[cm-2・s-1] Pile-up <スペック> 0.5GHz×4=2GHz 20kのFit Combination まで時間Lossなしに 処理することが可能 7

Timing Simulation <目的> 処理すべきInputの平均値が,各段階の平均処理速度を超えると処理が追いつかず,次のイベントの処理が遅れ続ける。 最初の1Hit情報が駆け抜ける時間 処理時間が遅れることによりTriggerのDead timeを生まないか確認のために <変数> ・Hit数 ・Boardの処理速度 ・Input,Output,Delay time Total時間を計算する!! パイプラインなので,それぞれで 時間かかるところが全体の出力時間に影響! Input Output DF DO AM DO TF HW 処理されてOutputの時間が延びる 全Hitを待つのでパイプラインではなくなる⇒時間がかかる 1data Fitも時間がかかる 8

Timing Simulationの式 DO AM SecDO TF i=0-8(DO 8CPU) , ProcTime(ClockTime)=10nsec , InTime(Input time)=10nsec , Delay=40nsec FwIn(i)=max[ 0, max(Pre_EwOut(i))-10μsec , max(Pre_Pre_SecDO_EwOut(I)) - 20μsec) ] EwIn(i)= #Hit(i)×InTime + FwIn(i) FwOut(i)= FwIn(i) + Delay EwOut(i)=max[ FwOut(i)+ProcTime×#Hit(i) , EwIn(i)+Delay ] AM j=0-4(LAMB4枚) , ProcTime(ClockTime)=5nsec , InTime(Input time)=10nsec , Delay=500nsec FwIn(i)=max[ min(DO_FwOut(i)) , max(Pre_EwOut(j))-10μsec , max(Pre_Pre_EwOut(j)) - 20μsec] EwIn(i)= max[ max(DO_EwOut(i)) , max(#SS(i))×InTime + max(DO_FwOut(i)) , max(Pre_EwOut(j)) - 10μsec , max(#SS(i))×InTime+max(Pre_EwIn(j)) - 10μsec max(#SS(i))×InTime+max(Pre_Pre_EwOut(j)) - 20μsec ] FwOut(i)= EwIn(j) + Delay EwOut(i)=FwOut(j)+max(ProcTime×#Road(j)) SecDO I=0-4(DO 4枚) , ProcTime(ClockTime)=5nsec , InTime(Input time)=5nsec , Delay=200nsec FwIn(I)=max[ min(AM_FwOut(j)) , max(Pre_EwOut(I)) - 10μsec) ] EwIn(I)= max[ max(AM_EwOut(j)) , max(#Road(j))×InTime + FwIn(I) ] FwOut(I)= FwIn(i) + Delay EwOut(I)=max[ FwOut(I)+ProcTime×#Road(j) , EwIn(I)+Delay ] TF k=0-4(TF 4枚) , ProcTime(ClockTime)=2nsec , InTime(Input time)=5nsec , Delay=300nsec FwIn(k)=max[ min(SecDO_FwOut(I)) , max(Pre_EwOut(k)) - 10μsec) ] EwIn(k)= max[ max(SecDO_EwOut(I)) , max(#Hit(i))×InTime + FwIn(k) ] FwOut(k)= FwIn(k) + Delay EwOut(k)=max[ FwOut(k)+ProcTime×#Fit(k) , EwIn(k)+Delay ] FwIn→最初のデータが処理部分に入る時 FwOut→最初のデータが処理部分から出る時 EwIn→最後のデータが処理部分に入る時 EwOut→最後のデータが処理部分から出る時 9

End Word Out Time 平均Hit数<Spec上限Hit数 処理時間は 蓄積され続けることはない (Deadtimeがない) 1イベント内の最後のデータがOutputされる時の時間と定義 WHbb L=3×1034[cm-2・s-1] Pile-up 処理できない場合  処理が蓄積して時間が増加する 処理できる場合  蓄積した処理時間はリセットされる 平均Hit数<Spec上限Hit数  処理時間は 蓄積され続けることはない (Deadtimeがない) 100KHzで100ev分走らせた結果 10

Event example (Total Process Time) AMは全LayerのSSを全て使うので SSを待つ時に時間がかかる。   最大処理時間がかかっているEvent 前のイベントの処理によって遅れている WHbb L=3×1034[cm-2・s-1] Pile-up WHbb L=3×1034[cm-2・s-1] Pile-up 8つのリージョンのうち最も遅いリージョンを最終的な事象プロセス時間とした 11

1RoI/1PC msec FTK processing time 平均24μsec μsecオーダーで処理することが可能! 現状のLVL2を想定したTrack再構成にかかる時間 ⇒RoIのみを1PC(Intel Core 2 Duo E8400 3.0GHz) でTrack計算しても 1RoIにmsecオーダーかかる。 μsecオーダーで処理することが可能! msec WHbb L=3×1034[cm-2・s-1] Pile-up WHbb with Pile-up 平均24μsec 1RoI/1PC 12

Time Simulationとしての予定 纏め ルミノシティ3×1034[cm-2・s-1]でも,現在のFTKのデザインでは平均Hit数, Road数,Fit数がBoardの許容範囲内であることが分かった。   → その結果、100μsec以下で処理が可能である。 100Evで確かめた結果,Dead Timeなしに処理することが可能である。 展望 Time Simulationとしての予定 DF,HWのデザイン最適化はまだ詰める必要がある。   ⇒ DFやHWの処理時間を考慮し,デザインの最適化に反映。 2nd Stageに関しても最適化を行う。 シミュレーションの統計数を増やす必要あり。 FTK 全体としての予定 全領域のEfficiencyを高めるために記憶パターンやSuperStrip sizeの最適化 Real Dataの有効利用    2012年のShutdown時での挿入(プロトタイプ版)を想定して開発・制作中! 13