格子QCDシミュレーションにおける固有値問題

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

1 宇宙は何からできてくるか ? 理学部 物理 森川雅博 宇宙を満たす未知のエネルギー:暗黒エネル ギー 局在する見えない未知の物質:暗黒物質 銀河・星・ガス 何からできているか … 2006/7/25.
QCD Sum rule による中性子電気双極子 モーメントの再評価 永田 夏海(名古屋大学) 2012 年 3 月 27 日 日本物理学会第 67 回年次大会 共同研究者:久野純治,李廷容,清水康弘 関西学院大学.
相対論的場の理論における 散逸モードの微視的同定 斎藤陽平( KEK ) 共同研究者:藤井宏次、板倉数記、森松治.
Generalized Form Factors of the Nucleon in the Chiral Quark Soliton Model カイラルクォークソリトン模型に基づく 核子の一般化形状 大阪大学 原子核理論研究室 D 1 中小路 義彦.
第 5 章 2 次元モデル Chapter 5 2-dimensional model. Contents 1.2 次元モデル 2-dimensional model 2. 弱形式 Weak form 3.FEM 近似 FEM approximation 4. まとめ Summary.
GPU上の大規模格子QCDシミュレーション に向けて
光学トラップ中の スピン自由度のあるボース凝縮系
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
AllReduce アルゴリズムによる QR 分解の精度について
クラスター変分法による 超新星爆発用 核物質状態方程式の作成
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
BRST対称性とカイラル対称性の破れの 格子QCDシミュレーションによる検証 scirqcd 帝京大学理工学部 古井貞隆
Pion mass difference from vacuum polarization in lattice QCD E. Shintani, H. Fukaya, S. Hashimoto, J. Noaki, T. Onogi, N. Yamada (for JLQCD Collaboration)
スパコンとJLDG HEPの計算環境 HEPnet-J
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
高エネルギー物理学特論 岡田安弘(KEK) 2007.1.23 広島大学理学部.
行列模型を用いたR×S3上のN=4 SYMにおける相関関数の数値的解析
原子核物理学 第4講 原子核の液滴模型.
文献名 “Performance Tuning of a CFD Code on the Earth Simulator”
現実の有限密度QCDの定性的な振る舞いに
現実の有限密度QCDの定性的な振る舞いに
非エルミート 量子力学と局在現象 羽田野 直道 D.R. Nelson (Harvard)
格子シミュレーションによる 非自明固定点の探索
原子核物理学 第8講 核力.
電子 e 光子 g 電磁相互 作用を媒介 陽子 中性子 中間子 p n ハドロン 核力を  媒介 物質の 究極構造 原子 原子核 基本粒子
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
複素ランジュバン法の正当化と正しい収束のための条件
山岡 哲朗 (共同研究者:原田 正康、野中 千穂)
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
研究課題名 研究背景・目的 有機エレクトロニクス材料物質の基礎電子物性の理解 2. 理論 3. 計算方法、プログラムの現状
D中間子崩壊過程を用いた 軽いスカラー中間子の組成の研究
まとめ 素粒子実験領域、素粒子論領域合同シンポジウム “2010年代のフレーバー物理” 岡田安弘(KEK)
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
LHC計画が目指す物理とは × 1:ヒッグス粒子の発見 2:標準理論を越える新しい物理の発見 未発見!
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
2重井戸型ポテンシャルに捕捉された 冷却原子気体の非平衡初期分布緩和過程に対する非平衡Thermo Field Dynamics
LHC計画で期待される物理 ヒッグス粒子の発見 < 質量の起源を求めて > 2. TeVエネルギースケールに展開する新しい物理パラダイム
LHC計画で期待される物理 ヒッグス粒子の発見 < 質量の起源を求めて > 2. TeVエネルギースケールに展開する新しい物理パラダイム
原子核の殻構造の相対論的記述 n n n σ ω n σ ω n 柴田研究室 石倉 徹也 1.Introduction n n
有限クォークおよび有限アイソスピン化学ポテンシャル
素粒子分野における計算機物理 大野木哲也 (京都大学基礎物理学研究所).
高エネルギー物理学特論 岡田安弘(KEK) 2008.1.15 広島大学理学部.
Perturbative Vacua from IIB Matrix Model
QCDの有効理論とハドロン物理 原田正康 (名古屋大学) at 東京大学 (2006年11月6日~8日)
? 格子QCDシミュレーションによる南部-ゴールドストン粒子の 質量生成機構の研究 質量の起源 ドメインウォールフェルミオン作用
インフレーション宇宙における 大域的磁場の生成
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
格子ゲージ理論によるダークマターの研究 ダークマター(DM)とは ダークマターの正体を探れ!
計画研究代表者 京都大学基礎物理学研究所 大野木 哲也
Marco Ruggieri 、大西 明(京大基研)
Massive Gravityの基礎と宇宙論
非等方格子上での クォーク作用の非摂動繰り込み
原子核物理学 第7講 殻模型.
格子QCDの理論的進展と フレーバー物理への応用II
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
行列模型から4次元は出るのか? ~ガウス展開法とシミュレーションの進展と展望~
原子核物理学 第6講 原子核の殻構造.
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
密行列固有値解法の最近の発展 (I) - Multiple Relatively Robust Representation アルゴリズム - 2004年11月26日 名古屋大学 計算理工学専攻 山本有作 日立製作所の山本有作です。 「~」について発表いたします。
媒質中でのカイラル摂動論を用いた カイラル凝縮の解析
実数および純虚数化学ポテンシャル領域における 2+1フレーバーPNJL模型を用いた QCD相構造の研究
Orientifolding of IIB matrix model
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
Massive Gravityの基礎と宇宙論
? リー・ヤンの零点 これまでの格子QCD計算の結果 今年度の計画 リー・ヤンの零点分布から探る有限密度QCDにおける相構造の研究
Presentation transcript:

格子QCDシミュレーションにおける固有値問題 松古 栄夫 (hideo.matsufuru@kek.jp) http://suchix.kek.jp/~matufuru/ High Energy Accelerator Research Organization (KEK) 2009年11月21-22日 特異値・固有値合同ワークショップ

目次 格子QCDとは 格子QCDで扱う行列 格子QCDにおける固有値問題 応用例 観測量としての固有モード 計算の高速化 測定量の改良 まとめ 紹介する結果はほとんど JLQCD Collaborationによるもの http://jlqcd.kek.jp/

JLQCD-TWQCD Collaboration: Members KEK: T. Aoyama, S. Hashimoto, T. Kaneko, H. Matsufuru, J. Noaki, N. Yamada, H. Ikeda Tsukuba: S. Aoki, N. Ishizuka, K. Kanaya, Y. Kuramashi, Y. Taniguchi, A. Ukawa, T. Yoshie, T. Yamazaki, K. Takeda Nagoya: H. Fukaya Osaka: T. Onogi, E. Shintani, H. Ohki Hiroshima: K.-I. Ishikawa, M. Okawa Taipei (TWQCD): T.W. Chiu, T.H. Hsieh, K. Ogawa IBM Blue Gene/L@KEK Hitachi SR11000@KEK 1

格子QCDとは

QCDと格子QCDシミュレーション QCD(量子色力学):「強い相互作用」の基礎理論 長距離で結合の強さが増大 (QEDとの違い) 陽子や中性子(ハドロン)を構成するクォークの間に働く クォークは「色」の自由度を持つ 「色」の変化  相互作用 (グルーオン場が媒介) 長距離で結合の強さが増大 (QEDとの違い)  解析的に解けない (摂動論が使えない) 非摂動的手法が必要 → 格子QCDに基づく数値シミュレーション

QCDと格子QCDシミュレーション 格子QCD: 格子時空上の場の理論 (K.G.Wilson, 1974) グルーオン場: リンク上の3x3複素行列 クォーク場:サイト上のグラスマン数    (計算機上で扱えないので手で積分) 経路積分量子化 → 統計力学系と同じ形 モンテカルロ法によるシミュレーション QCDを非摂動的に扱う唯一の一般的方法 QCDの構造: 真空状態、カイラル対称性と閉じ込め 標準理論の精密な予言:新しい物理を探すために必要 (LHCで見付かる?) 有限温度・密度での相構造、状態方程式 → 宇宙物理 核力の計算 → 原子核物理 QCD以外の場の理論 → 新しい物理の候補 超対称性を格子に乗せる試み

格子QCDシミュレーション 物理量の期待値: モンテカルロ法: グルーオン場の配位{U} (と擬クォーク場φ) を ..... の確率で生成 グルーオン場の「配位」: 分子動力学的に作る 各ステップでクォーク場に対する線形問題を解く必要

格子QCDシミュレーション 生成したグルーオン場の配位を使って、 物理量を計算 統計平均→物理量の期待値 陽子 効果的なシミュレーションのためには、 グルーオン場の配位の効率的生成 クォークの伝搬関数の高速計算(線形問題) 効果的な測定 (配位データの有効利用) が必要

格子QCDで扱う行列

格子QCDの行列 計算時間のほとんどは、線形方程式 Dx=b を解いている x, b は N=3(カラー) x 4(スピン) x サイト (例えば 164) の自由度を持つ 複素ベクトル [N~O(106-108)] Krylov部分空間法 フェルミオン演算子 D : N x N 巨大行列 (メモリに載せるのは U) Wilson演算子 シンプルな構造、 カイラル対称性は連続極限で回復 計算コストは比較的低い オーバーラップ演算子 (我々のメインターゲット) 格子上の厳密なカイラル対称性を持つ 計算コスト高: Wilson演算子をO(100)回かける必要 カイラル対称性はQCDの性質を理解するために非常に重要な対称性

Wilson演算子 D は N x N の巨大疎行列 κは質量に関係したパラメター x 3x3複素行列: リンク変数 SU(3) (グルーオン場の情報) 対角成分 +方向の隣接サイトとの結合 ー方向の隣接サイトとの結合 x μ U (x) κは質量に関係したパラメター

オーバーラップ演算子 格子上の厳密なカイラル対称性をもつ HW はWilson演算子 計算量大: Wilson演算子のO(100)倍 (質量ゼロの場合) 近似式で符号関数を評価 (l=1,..., N~20) を解く必要: マルチシフト・ソルバー HW の小さい固有モードの射影による高速化 固有値、固有ベクトルを求める必要 (後述)

並列化 格子を分割 例: 24x24x24x48 格子/2x8x8x8 ノード (Blue Gene@KEK) → ノード内演算+ノード間通信 例: 24x24x24x48 格子/2x8x8x8 ノード (Blue Gene@KEK) Wilson演算子の演算1回あたり ノード内演算: 934K Flop ノード間通信: 138KB 現実的な計算のためには、並列化は不可欠 超並列 (Blue Gene, etc) ファットノード並列 (T2K, etc) → 領域分割など メニーコア (GPGPU, etc) → ボード間の並列化をどうする?

格子QCDにおける固有値問題

固有値・固有ベクトルが必要な局面 クォークの演算子に対する固有値問題 観測量 固有値、固有モードそのものが重要な物理 スペクトルとカイラル対称性の破れ 固有ベクトルの局在と有限格子間隔で現れる相構造 高速化 ゲージ場の配位の生成、伝搬関数の計算のスピードアップ 低モード前処理 オーバーラップ演算子の特異性の除去 Wilson演算子の負の固有値モード 測定量のシグナルの改良 限られたゲージ場の配位数で、測定量の精度を上げる 低モード平均 (low mode averaging) All-to-all 伝搬関数 Cf. 大野さんのトーク

固有値ソルバー よく使われるアルゴリズム Implicitly Restarted Arnoldi/Lanczos ARPACKを使っているグループが多い 共役勾配法 (+直交化): Hermite の場合 (Kalkreuter & Simma, 1996) Chebyshev多項式による加速 Chebyshev多項式が[-1,1]の中でほぼゼロ、外で急激に増大することを 利用 ー 求めたい領域の固有値が大きくなるように変換する (H.Neff et al., 2001) 並列化と相性の良いアルゴリズムが必要 我々はHermite化した行列に IRL+Chebyshev加速 を適用 CG法も検討中 これまであまり気合いをいれて高速化していないので、 良いアルゴリズムがあったら教えてください

固有値ソルバーの例 例: オーバーラップ演算子の固有値計算 Wilson演算子についても固有モード を求める必要 H=5D はエルミート (Hの固有モードからDの固有モードを構成可) 163x32 lattice, on BG/L 512 node (2.7TFlops peak) IR-Lanczos のサイズ: 60+30 Chebyshev多項式の次数: 40x2 収束条件: 10-11 反復回数 5 で収束 30min/配位, 3M回のDW mult Wilson演算子についても固有モード を求める必要 オーバーラップ演算子の特異性の除去と高速化 Monte Carlo法 (分子動力学)の各ステップで実行 1回あたり 13 sec, 1配位(1-2 hours)あたり約60回 call

応用例 観測量として 計算の高速化 測定量の改良

カイラル対称性の破れ 「真空」の構造 ー 単純な「からっぽ」ではない! 「カイラル対称性」が自発的に破れた状態 「真空」の構造 ー 単純な「からっぽ」ではない! 「カイラル対称性」が自発的に破れた状態 Nambu & Jona-Lasinio, 1961 (2008年 Nobel 賞!) 右回りと左回りのクォークが独立に振る舞う対称性 クォークの質量がゼロのとき成り立つ (実際は小さな質量→ほぼ成立) 自発的破れ: 系の基底状態が対称性の破れた状態 クォーク凝縮 → クォークに「有効質量」を与える (陽子、中性子の質量の98%) Banks-Casher関係式 (Banks & Casher, 1980) クォーク演算子のゼロ付近のモード  クォーク凝縮 ゼロ付近の固有値分布によりカイラル対称性の破れを探る : spectral density of D

カイラル対称性の破れ 格子QCDシミュレーションで検証 JLQCD and TWQCD Collab., 2007 Finite V 有限体積 e-regime: 低エネルギー有効理論 ランダム行列理論 との比較 Finite V 数値計算の結果: 固有値密度分布 JLQCD-TWQCD, 2007 Nf=2, 163x32, a=0.11fm m~3MeV

低周波数モードの局在と格子特有の相構造 Physical region Aoki phase To be here 青木相: Wilson演算子では、有限の格子間隔で、 連続理論のQCDにはない相構造が出現                   (S.Aoki, 1984) オーバーラップ演算子が正しく定義される(局 所的)ためには、青木相の外にいることが必要 青木相では、ゼロ付近のモードの固有関数が非 局所的 (Golterman-Shamir, 2003) Cf. 物性理論のAnderson局在 Aoki phase Physical region To be here Wilson演算子の固有モードを求めて検証 (SU(2)の場合) スペクトル密度分布 固有関数密度の空間的分布 ゼロ付近で有限の分布密度 指数関数的に減少?

オーバーラップ演算子の特異性の改良 オーバーラップ演算子 HW はWilson演算子 HWの固有値がゼロになるところで不連続 質量mの場合 M0=1.6 近似式で符号関数を評価 (l=1,..., N~20) はシフトソルバーで解く HW の小さい固有モードが現れると近似の次数を上げる必 要 HW のゼロに近い固有モードの射影による改良 固有値、固有ベクトルを求める必要

Overlap operator 近似の精度: ~exp(-lthrs N) Zolotarev's Rational approximation |l| (eigenmode of HW) [lthrs ,lmax] での近似 lthrs が小さいほど大きな N が必要 近似の精度: ~exp(-lthrs N) HW の lthrs 以下の固有モード求めて陽に扱う --コストは低モードの密度で決まる (lthrs=0.045, N=10 in this work) 現在は IR-Lanczos+Chebyshev加速 求める固有値は数個 分子動力学の各ステップで必要 1回あたり 13 sec, 1配位(1-2 hours)あたり約60回 call   全体のコストの数分の1 → 改良したい This is the overlap operator with quark mass m. For numerical implementation of the sign function, we adopt the Zolotarev's rational approximation. Here (HW2 + constant) must be inverted, and these terms can be determined simultaneously by the multishift CG algorithm. This formula is valid only in certain region of the eigenvalues of HW. Here lthrs denote the lower edge of that region. To approximate the sign function of near-zero mode precisely, we need large N, the number of terms. The situation is sketched in the figure. Instead, if one first determines low-lying modes of HW, one can project out these modes, and directly determine the sign function of them. The approximate formula is applied to the rest. So the cost depends on the low-mode density, because if there are lots of low-modes, determination of them takes much time.

Low-mode averaging ハドロンの相関関数の計算 クォークの伝搬関数: 線形方程式を解く Dov(x,y)Sq(y,z)= (x,z) 低固有値モードと高固有値モードの寄与に分解 メソン相関関数の場合: 低固有値モードを求めておけば、ソース点の位置について、全てのサイ トで和を取れる (平行移動に対する対称性) “Low-mode averaging” (DeGrand, 2004; Giusti et al., 2004) 低固有値モードが重要な場合は多い 高固有値モード: ノイズ法で和を取る → 「All-to-all 伝搬関数」 Before showing the results of pion mass and decay constant. I would like to mention the technical improvement. We first obtain 50 pairs of low-lying eigenmodes of overlap operator. Then the solver is applied to the source vector after projecting out these low-modes. This makes solver 8 times faster. For these low-lying modes, the correlators are averaged over all the space time lattices. This low-mode averaging significantly improves the signals of the meson correlators as shown in the figure. The filled and open symbols are results with and without the low-mode averaging. averaging

Low-mode averaging Low-mode averaging の例 (JLQCD Collaboration) 50 ペア(対で現れる)の固有モードを求めておく(重要な観測 量) ソルバーの前処理にも利用 (8倍の高速化) Low-mode averaging (DeGrand, 2004, Giusti et al., 2004) 低モードについて、ソースの位置について足し上げ Meson correlator with overlap fermions Open symbols: w/o LMA Filled symbols: with LMA Before showing the results of pion mass and decay constant. I would like to mention the technical improvement. We first obtain 50 pairs of low-lying eigenmodes of overlap operator. Then the solver is applied to the source vector after projecting out these low-modes. This makes solver 8 times faster. For these low-lying modes, the correlators are averaged over all the space time lattices. This low-mode averaging significantly improves the signals of the meson correlators as shown in the figure. The filled and open symbols are results with and without the low-mode averaging. JLQCD Collaboration, Nf=2, a=0.12fm, Q=0 3 smallest msea=mval.

All-to-all 伝搬関数 Foley et al., 2005 各点で 1 or -1 の値のランダムな場に対するクォークの伝搬 関数 高モードについても、ノイズ法によって全てのサイトの和を取る Foley et al., 2005 各点で 1 or -1 の値のランダムな場に対するクォークの伝搬 関数 Low mode と high mode に分解 Low mode 部分は固有ベクトルから High mode 部分はノイズ法 1 or -1の値の(r 番目の)ランダム場 ランダム場をソースとして解いた伝搬関数

All-to-all 伝搬関数 例: 重いクォークを含むメソンの相関関数 重いクォークは静的(無限に重い) → 計算は軽い 軽いクォークはWilson演算子で記述 → all-to-all伝搬関数 Negishi, HM, Onogi, 2007; Ohki, HM, Onogi, 2008 All-to-all伝搬関数を使うとシグナルは改善 統計揺らぎはトータルの伝搬関数より速く増大する いつでも有効とは限らない 軽いクォーク質量:小 軽いクォーク質量:大

まとめ 格子QCDでは固有値問題の高速なアルゴリズムが必要 低固有モードは重要な観測量 計算の高速化、特異性の除去 観測量のシグナルの改良 大規模並列化に適したアルゴリズムが必要 Implicitly restarted Arnoldi/Lanczos Conjugate Gradient 良いアルゴリズムがあれば教えてください