ATLAS実験における シミュレーション&解析環境 東大ICEPP 田中純一 2005年1月22日 第一回LHC物理解析研究会
概要 道具 データ 我々の現状 プログラミング言語は? 環境は?フレームワークは? 実験データ MCデータ 何をやっているか? 話の中で、 どこにある?どうやってアクセスする? データの流れ:どうやってつくる? 我々の現状 何をやっているか? 話の中で、 “ローマ”という言葉が でてきたら、 今年6月にある ATLAS物理WSのこと 第一回LHC物理解析研究会 2005年1月22日
プログラミング言語 C++言語 Python Fortran ATLAS実験専用の解析フレームワーク ROOT 解析ジョブの引数に与えるテキストファイル内でオプションを記述する。 例:>> athena Higgs_VBF_tautau.py [return] Fortran Generator周辺の仕事 C++はSherpaだけ(?)、Herwig++とPythia7はまだ。 第一回LHC物理解析研究会 2005年1月22日
解析環境 Athena “アセナ” Grid “グリッド” ATLAS実験専用の巨大なフレームワーク 何もかも行う(予定)。 実験データのReconstruction MCデータの生成 物理解析 Grid “グリッド” 世界規模で接続されたPCの集合体 約60000CPUs(3GHz Xeon換算)@2008 約16PB(テープ)+約30PB(ディスク)@2008 第一回LHC物理解析研究会 2005年1月22日
Athena環境の開発状況 ローマ 第一回LHC物理解析研究会 2005年1月22日
データ 基本は以下の3種類。 RAW ESD AOD 実験データ、1.6MB/evt、HLT=~200Hz 例:物理事象=100Hzと仮定すると、 100x1年分(107)x1.6MB/evt = 1.7PB/年 MCデータ(Full)も実験データと同じ形式にする。2.0MB/evt ESD Event Summary Data、0.5MB/evt Reprocessに耐える内容を保持する予定。 AOD Physics Analysis Object Data、0.1MB/evt 第一回LHC物理解析研究会 2005年1月22日
流れ Generator Geant4 - simulation Fast - digitization simulation RAW Reconstruction ESD AOD Analysis 第一回LHC物理解析研究会 2005年1月22日
シミュレーション Full Simulation Fast Simulation Geant4とGeant3 ハドロンコライダーでは必須。 Full Simulationで統計的に十分なイベントを生成することはできない。 例:s=1nbのプロセス、10fb-1相当、1イベント5分を1ヶ月で生成する。 (10-9x10x1015x5) / (1ヶ月=5x104) = 103CPU (10-9x10x1015x5) x 2MB/evt = 108MB = 100TB Full Simulationのパフォーマンスを再現するように再調整が必要。 第一回LHC物理解析研究会 2005年1月22日
データアクセス AODは必要最小限の情報のみ保持。 ESD AOD Analysis AODは必要最小限の情報のみ保持。 データ解析中にAODにない情報(例えばセル)にアクセスしようとすると、該当するESDを探し出し必要な情報を取得することができる。 Athena環境では実現している。 第一回LHC物理解析研究会 2005年1月22日
データ生成 グリッドを利用する。 データチャレンジ(DC)プロジェクト:DC1、DC2(now)、DC3 データ管理 実験データのReprocess MCデータの生成 “ローマ”ための公式データが生成されている。 データチャレンジ(DC)プロジェクト:DC1、DC2(now)、DC3 グリッド上で実験データをきちんとプロセスできるかどうか? グリッド上でMCデータを生成できるかどうか? グリッド上のデータを利用して解析できるかどうか? 等の検証するR&Dが行われている。 第一回LHC物理解析研究会 2005年1月22日
第一回LHC物理解析研究会 2005年1月22日
CERN グリッド 日本 CERN分室 第一回LHC物理解析研究会 2005年1月22日
我々の現状 第一回LHC物理解析研究会 2005年1月22日
流れ(現状) ESDとAODはやっと姿を見せたところ。 Generator CBNT Geant4 - simulation Fast Combined ntuple ROOTファイル CBNTを生成してROOTで解析している。 我々はこれでローマを目指す。 Generator Geant4 - simulation - digitization Fast simulation RAW Reconstruction ESD AOD Analysis CBNT 第一回LHC物理解析研究会 2005年1月22日
単位はMeVとmm 第一回LHC物理解析研究会 2005年1月22日
Generator周辺の話題 Matrix Element General tool これらの道具を駆使してデータを生成している。 B.Webber TeV4LHC@FNAL PDF Underlying Event ME+PS Fragmentation p Jet cone/kT N(N)LO Matrix Element Grappa(日本製), Alpgen, MadGraphなどなど。 General tool Hadronization Parton Shower Pythia, Herwigなど Sherpa これらの道具を駆使してデータを生成している。 Signal:Higgs & SUSY(mSugra) BG:tt、W+njets、Z+njets、… 第一回LHC物理解析研究会 2005年1月22日
Higgsの話題:VBF H->tt HiggsのFirst Discoveryを目指して! Full Simulationでやるべきこと TauIDの研究(進行中) Et missingの研究 Forward Jetの研究 Fast Simulationでやるべきこと Z+njetsの影響(進行中) 第一回LHC物理解析研究会 2005年1月22日
Forward Jets Tau 第一回LHC物理解析研究会 2005年1月22日
解析ツール Particle ID関連は整備中@CERN B-tagging … モニター中 E/gamma Jet & MissingEt … ここをやりたい。 Muon Tau … 参戦中 開発はどんどん進んでいる。 複数の開発が同時に進むことも多い。 どれも使おうと思えば使えるが、Performanceには?が多い。 ATLAS Physics TDR(1999)と比較して。 第一回LHC物理解析研究会 2005年1月22日
資源 データ生成はICEPPの計算機で行っている。 データはICEPPの計算機に存在する。 NonGrid 約100CPUs 約30TB データはICEPPの計算機に存在する。 ICEPPの計算機ではAthena環境が利用できる。 CERNからミラーしている。 来年度からはCERN分室もフル活用。 我々(人の話)もCERNへお引越し。 第一回LHC物理解析研究会 2005年1月22日
まとめ 解析環境 データ生成と管理 自前の解析環境 実験開始に向け整いつつある。 @グリッドを目指している。 CERN & TOKYO 資源:データ保持とそのReprocessは十分可能(30fb-1ぐらいまで) 第一回LHC物理解析研究会 2005年1月22日
予定 ATLAS物理ワークショップ アトラス物理本 2005年6月7日ー11日@ローマ 予想:Full simulationのValidationが中心 アトラス物理本 ポスト・ローマはこれ! 2006年後半リリースを目指す。 実験データの解析(発見論文)のため、 大きな貢献をすることが最重要課題。 第一回LHC物理解析研究会 2005年1月22日
…To CERN 2007年に向け本拠地CERNへ 第一回LHC物理解析研究会 2005年1月22日