MLF計算環境の概要 大友季哉
Basic computing requirements at MLF High throughput of large data analysis On-line analysis of GB order data during an experiment Interpretation software (simulation) will be used on an experiment Data analysis affect on effective flux of neutron (muon) Fast and reliable data analysis and experiment systems are required Variety of experimental approaches Extreme experiments will become conventional Flexible instrument control Naïve experimental conditions Automatic and manual logging of experiment and analysis Large number of user Several ten thousands of cumulative users / year Database for user program should be implemented Computing environment should be user-friendly Security User identification and authorization are essential to enable flexible access to MLF/J-PARC Collaboratory system will open new style of experiment Computing environment is one of essential infrastructures of MLF
MLF計算環境グループの目的 ユーザーが実験に集中でき、新しい実験・解析アイディアを反映しやすい計算環境を構築する。
Component structure (old) “Working Desktop” component will control other components Users want to handle experiment component, analysis component, database and graphic engine simultaneously.
Working desktop (Python) Components 全てのユーザーのアクセスremote access”と見なすこともできる(?)なら、わざわざコンポとする必要はないかも Remote access 白抜きのコンポは未実装であることを示す。 Security Collaboratory Network “Network”はVLAN切替等のソフトのこと Working desktop (Python) Experiment Analysis Visualization Simulation DAQ Devices Logging Analysis Ab Initio Monte-Carlo etc GnuPlot IRIS exp, Matlab, etc Reduction Data fileへのアクセスとsecurityの関連は?? Data File Admin DB Experiment DB SAN / Grid Storage Data Fileは、NeXus準拠にする可能性あり
負荷分散のためのServer-client system(プロトタイプ稼働中) Data acquisition Detector driver client (LabVIEW etc) Client terminal (Python) Socket server (LabVIEW/Python) socket socket CPU CPU Data analysis Daemon (C++) Client terminal (Python) Python client (Manyo-lib) socket exec or Command Server (Python) CPU CPU Both acquisition and analysis component uses server-client model Both component will be work collectively
ハードウエア構成例(高速処理型) detectors detectors devices DAQ electronics 複数台 Serial cable Serial cable DAQ electronics DAQ electronics Serial cable Optical fiber Optical fiber CPU DAQ CPU DAQ CPU DAQ Optical fiber /GbE Optical fiber /GbE Main Storage Storage (SAN) Max 400Mbps Optical fiber /GbE Optical fiber /GbE Ethernet CPU D-Red CPU D-Red CPU DB Authentication Server CPU D-Ana + UI Router CPUs D-Ana DAQ: data acquisition, D-Red: data reduction, D-Ana: data analysis, DB: data-base, SAN: Storage Area Network
ハードウエア構成例(一般型) detectors detectors devices DAQ electronics 複数台 Serial cable Serial cable DAQ electronics DAQ electronics Serial cable Optical fiber Optical fiber CPU DAQ + D-Red CPU DAQ + D-Red CPU DAQ Main Storage Storage (RAID) Ethernet CPU DB Authentication Server CPU D-Ana + UI Router CPUs D-Ana DAQ: data acquisition, D-Red: data reduction, D-Ana: data analysis, DB: data-base, SAN: Storage Area Network, UI: user interface (working desktop) PC farm Supercomputer
Component usage Character base command establishment GUI design Python commands example >>> set_exp(dt_t=0.002, delay=500, samp_temp=20) >>> begin >>> save >>> get_spec ( qmax=5, qreso=0.5) >>> end Experiment Exp. DB Experiment Exp. DB Experiment Data file Analysis Visualization Experiment Data file / DB Character base command establishment GUI design
Analysis software architecture (draft) Inst. (Science) dependent Simulation component DB Vis. Simulation & Advanced Analysis Ab initio calculation, MD, modeling, neutron scattering simulation etc Virtual Reality? Imaging Tools & Num. Lib Resolution deconvolution, peak separation, peak fitting, smoothing, MEM, wavelet, ….. Basic Analysis TOF to intensity profile (Manyo-lib) Essential conventional Analysis component
Development scheme of components Experiment component Analysis component Simulation component MLF infrastructure Developed by MLF Exp. Database Admin. Database J-PARC Information System J-PARC infrastructure Security component Network
MLF computing environment design Minimum implementation will be finished until 2007 Dec. components Current status 2005~ Analysis: Data reduction (Manyo-lib) MLF Prototyping for “Day-1” instruments Continue Experiment: Data acquisition Prototype development of client-server system by upgrading “KENS control” Make a test installation at KENS combine with analysis component Event mode develop-ments Network /J-PARC Ready for construction Storage R&D for mass-storage system (Storage Area Network system) Make a test installation Database Conceptual design R&D Simulation (interpretation) Started to communicate with computer scientists in Japan Authentication Collaboratory Conceptual design / R&D
Schedule 2005 2006 2007 2008 2009 Manyo-lib Public release (?) Documentation Connection to Graphic engine (IRIS explore) DANCE Public release (?) Operation Development for each instrument Prototyping Started: Powder, Total, SANS, Chopper, Single x-tal To Be Started: Reflectometer, Inverted Spec, Spin Echo Analysis component Documentation (Guideline) Link to DB, authentication, Adv. Ana Numerical lib Link to Advanced visualization
計算環境グループの所掌範囲(ソフトウエア) 基盤部分については、計算環境グループが開発し、ガイドラインを提供する。 基盤部分に含まれないソフトウエアについては、各分光器グループがガイドラインに沿って開発する。ガイドラインが対応できない場合には、計算環境グループと議論する。 シミュレーションソフトウエア、可視化ソフトウエア、データベース等、共通で使用する市販ソフトウエアは計算環境グループから予算計上する。
計算環境グループの所掌範囲(ハードウエア) 計算環境グループで検討するハードウエア メインデータストレージ:分光器共通のストレージ 各分光器用情報コンセントまでのネットワーク PCファーム Web、Mail等のユーティリティーサーバー(J-PARC情報システム) その他のハードウエアの購入は、各分光器グループ所掌 具体的には要検討だが、計算環境グループが全て用意する訳ではない。
懸案事項 継続的な開発体制(人、予算)確保 ソフトウエア開発 ハードウエア 優先順位を決めて開発していく 維持体制に見合った開発をする セキュリティの考え方 どのようなアクセスが必要か? どのように守りたいか? 実験・解析ログデータベース開発 ハードウエア ストレージの大きさ どのくらいの期間をオンラインでアクセス可能にするか? データをパブリックにする場合、どのようにするか
MLF計算環境グループは、基盤的計算環境構築を第1目的とする。 基本的フレームワーク設計/開発 各装置グループの協力が不可欠 今年度中に計算環境ガイドラインを作成予定