コンピューティングパワー拡大に伴う技術課題

コンピューティングパワー拡大に伴う技術課題
計算機アーキテクチャ研究会(IPSJ-ARC) コンピューティングパワー拡大に伴う技術課題 2007年5月31日富士通株式会社　井上　愛一郎

プロセッサ開発の履歴自己紹介を兼ねてﾒｲﾝﾌﾚｰﾑ用ﾌﾟﾛｾｯｻ SPARC64 ﾌﾟﾛｾｯｻ高性能技術高信頼技術 90nm
Tr=約5億CMOS 銅配線 + Low-k 90nm プロセッサ開発の履歴自己紹介を兼ねて Tr=約5億4千万 CMOS 銅配線 + Low-k 90nm ﾒｲﾝﾌﾚｰﾑ用ﾌﾟﾛｾｯｻ GS21 SPARC64 VI 高性能技術 Tr=1億9千万 CMOS Cu 130nm SPARC64 V + Tr=約4億 CMOS 銅配線 + Low-k 90nm ･マルチコア･マルチスレッド GS21 Tr=4千6百万 CMOS Cu 180nm ･L2キャッシュ内蔵 SPARC64 V ･ノンブロッキングキャッシュ･アウトオブオーダ･スーパースカラ GS8900 Tr=1億9千万 CMOS Cu 130nm Tr=3千万 CMOS Al 250nm / 220nm GS8800B SPARC64 GP SPARC64 GP GS8800 ･1チップCPU Tr=3千万 CMOS Cu 180nm / 150nm Tr=1千万 CMOS Al 350nm ･ストア突き放し･ブランチヒストリ･プリフェッチ･キャッシュ ECC ･レジスタ/演算器パリティ･命令リトライ･キャッシュ動的縮退･RC/RT/ヒストリ SPARC64 ﾌﾟﾛｾｯｻ高信頼技術 GS8600 SPARC64 II :半導体テクノロジ世代 SPARC64 ～1995 1996 ～1997 1998 ～1999 2000 ～2003 2004～

スーパーコンピュータの性能拡大 Peta + Tera + + + + Giga + + + Mega + Flop/s
July 20, 2005 スーパーコンピュータの性能拡大 Flop/s 永遠に性能拡大できるのか？障害は何か？ Peta 15 10 ～　Moore’s Low ＝　× 　2 /1.5years BG/L EarthSim. + PRIMEQUEST Tera ASCI Q ASCI White + 12 ASCI Blue HPC2500 10 ASCI Red + VPP5000 + NWT + VPP800 CRAY T90 Giga VP2000 9 + CRAY C90 10 VP400 + CRAY Y-MP CRAY X-MP + CRAY2 ILLIAC4 VP200 Mega CRAY1 6 10 + 230-75/APU 1970 1980 1990 2000 2010 年 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. "

進化を支えたCMOSスケーリングトランジスタを微細化することで、集積度の向上と高速化が同時に達成でき、さらにその利益をすべてつぎこんでも、チップの大きさが変わらなければ消費電力が変わらないデバイスパラメータと結果としての影響比例縮小係数長さ：L, 幅:W, ゲート酸化膜厚:tox 1/α 供給電圧:Vdd 電界:E 1 ゲート遅延電力消費(トランジスタあたり) 1/α2 しかし、もともと誰も理想的スケーリングが成り立つとは思っていないさらに、微細化そのものが限界に達しつつある

微細化にともなう問題点などすでに限界に達した、あるいは達しつつあること
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 微細化にともなう問題点などすでに限界に達した、あるいは達しつつあることゲート酸化膜厚(←ハフニウムなどのHigh-K材料で緩和されるが...) ゲート長L(～30nm) 電子やホールの移動度(歪シリコン) 配線材料(アルミ⇒銅)　配線抵抗→スピードが上がらない配線層間材料(Low-K材料) 配線層数(～10数層) 配線コストの上昇⇒遅延がゲートよりも配線によって決まる、また、配線の充放電が電力の多くの部分を占める。チップあたりのIOピン数(～2000signal) 消費電力と発熱量(チップあたり、発熱密度) それでも微細化と集積度の向上は続く(65nm→45nm→32nm→22nm→…) 困ること(進化を阻害する要因) 製造設備に必要な投資額の増大(ビジネスとして成り立ちにくい) 製造工程の複雑化(レチクル枚数の増加と製造コストの上昇) ニーズの下方シフト(FPGAの台頭など) FPGAでOOOEのCPUが出来てしまう。少量多品種をSoCが助長。 5

Microprocessor Architecture
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 Microprocessor Architecture プロセッサの最重要なパラメータは: 性能, 消費電力, 信頼性(別の機会に) 並列処理が前提のスーパーコンピュータでは、 Performance/watt. :消費電力あたりの性能が特に重要システムの集積度消費電力の絶対値運用コスト 6

性能指標一般的な性能指標 MIPS (Million Instructions Per Second )
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 性能指標一般的な性能指標 MIPS (Million Instructions Per Second ) 　=f[Mhz]*IPC (Instruction Per Cycle) HPC用途の性能指標 FLOPS (Floating point number Operations Per Second) =f*FPC (Floating point number operations Per Cycle) 7

性能とトランジスタ数の関係一般に、IPCやFPCを改善すると回路量が増加 Intelの経験則(ポラックの法則) 性能∝~√ダイサイズ
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 性能とトランジスタ数の関係　一般に、IPCやFPCを改善すると回路量が増加 (少ない回路で高いIPCやFPCを実現するのは腕の見せ所だが) Intelの経験則(ポラックの法則) 　性能∝~√ダイサイズトランジスタ数TR#⇒回路量⇒ダイサイズ TR#とIPC(FPC)の関係は IPC(FPC) ∝ ~√TR# MIPS(FLOPS) ∝~f*√TR# 8

消費電力はどうか? Power = Pactive + Pstatic Pactive = Ceff × Vdd2 × f
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 消費電力はどうか? Power = Pactive + Pstatic Pactive = Ceff × Vdd2 × f IPC(FPC)∝~√回路量、回路量∝~Ceff だから IPC(FPC)↑⇒ Power↑↑ また f∝~Vdd だから Pactive ∝~f3 さらに、早いトランジスタ⇒リーク大⇒ Pstatic↑↑ なので f↑⇒ Power↑↑↑ 性能向上は消費電力を非常に大きくする 9

評価尺度の定義性能ポテンシャル f*√TR# fルートラ消費電力あたり性能のポテンシャル (f*√TR#)/Power fルートラPP
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 評価尺度の定義　性能ポテンシャル　　f*√TR#　　　　　fルートラ消費電力あたり性能のポテンシャル　 (f*√TR#)/Power 　fルートラPP マイクロアーキや論理構造とは独立に物理的な側面からポテンシャルを示す尺度 MIPSやFLOPSに対応する尺度としてf*√TR# 消費電力あたり性能Performance/Watt.に対応する尺度として(f*√TR#)/Power 半導体の微細化が、これらの尺度にもたらしてきた、あるいは、今後もたらす影響を見ていく 10

CMOSスケーリングでは? パラメータαで縮小し、同じ面積のチップを作ると TR# ⇒α2倍 f ⇒α 倍 Power⇒変わらない
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 CMOSスケーリングでは? パラメータαで縮小し、同じ面積のチップを作ると TR# ⇒α2倍 f　　 ⇒α 倍 Power⇒変わらない f*√TR# ⇒α*√α2 =α2 (f*√TR#)/Power⇒α*√α2/1=α2 理想的スケーリングが成り立っていると、普通にやっていれば！世代ごとに性能ポテンシャルがα2倍に改善消費電力あたり性能ポテンシャルもα2倍に改善 11

f*√TR#で見たマイクロプロセッサの進化
スーパーコンピュータの性能向上率と一致ムーアの法則どおりの進化 ⇒長期的に理想的なCMOSスケーリングと一致 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. "

理想的スケーリングと実際 x86チップの例理想実際 < << ≒ 大幅な周波数向上（理想的スケーリングの7倍）
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 理想的スケーリングと実際 x86チップの例理想　　　実際 < << ≒ 大幅な周波数向上（理想的スケーリングの7倍） Vdd⇒1.40/0.85=1.6倍では説明できない電力は10倍(大幅抑制) f×Ceff×Vdd2⇒3400/467×125/46.9×(1.4/0.85)2=53倍 f*√TR#は理想的スケーリングを大きく超え、 (f*√TR#)/Powerは理想的スケーリングとほぼ一致理想的スケーリングが成り立たない中でデバイスが進化＋チップの設計努力の両面で達成した快挙 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 13

マイクロプロセッサの比較 (f*√TR#)/PowerがPentium4を上回るものがある
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 マイクロプロセッサの比較 (f*√TR#)/PowerがPentium4を上回るものがある "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 14

マイクロプロセッサの比較 Pentium4からWoodcrest
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 マイクロプロセッサの比較 Pentium4からWoodcrest (f*√TR#)/powerの改善はもとより、マルチコア化とマイクロアーキの改善で実性能を大幅に改善した。 Woodcrestは、(f*√TR#)/PowerがPentium4から向上 90nm→65nmの理想的スケーリングと同程度マルチコア化し、動作周波数を少し下げた実際には消費電力あたりの性能改善大(周知の事実) "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 15

確認ですが… 周波数が低ければ(f*√TR#)/Powerは向上
Pactive ∝~f3、Pstaticも周波数fに強く依存するだからPowerは周波数fを下げると激減 (もちろん、そういう設計をし、電圧を下げた場合) 周波数f半分でトランジスタ数TR#一定ならば、(f*√TR#)/Powerは1桁改善

マイクロプロセッサの比較 BlueGene/Lの位置づけ
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 マイクロプロセッサの比較 BlueGene/Lの位置づけ α=2.7で縮小したら周波数fは320MHz程度低い動作周波数で消費電力を抑えて(f*√TR#)/Powerを大きくしておいて、専用化によって演算性能を上げた。結果として消費電力あたりの演算性能がとても大きい。 ←周波数が低い(but理想的スケーリングの2倍) 浮動小数点演算性能を強化←専用化の利点 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 17

半導体の微細化による今後の改善例：BlueGene/Lからチップサイズ一定で移行
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 半導体の微細化による今後の改善例：BlueGene/Lからチップサイズ一定で移行理想的スケーリングが成り立つならば、(f*√TR#)/Powerは世代ごとに倍増これまでは、その通りしかし今後は無理電源電圧(正確にはVtが下げられない) 動作周波数 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 18

半導体の微細化による今後の改善例：BlueGene/Lからチップサイズ一定で移行
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 半導体の微細化による今後の改善例：BlueGene/Lからチップサイズ一定で移行 !1：速度を保つためには電圧を下げられない。配線コストが大きくなる分をトランジスタ数と消費電力に反映現実的なテクノロジー移行(某社に限らず一般に) 電源電圧　⇒下がらない動作周波数⇒上がらない (f*√TR#)/Powerは改善しない(90nmあたりがピーク) 電力密度増大(周波数は一定だが) チップの集積度がシステム実装密度に貢献しない？ BlueGene/Lだけが苦しいのではなく、一般的な半導体の微細化による影響 "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 19

ちょっと脱線してSPARC64 Vの宣伝 (2004年当時の比較データ)
他社製品は発表資料等にもとづいて推定消費電力を抑えつつ、高い演算性能を実現

マイクロプロセッサの比較 SPARC64の位置づけ
Fujitsu's new SPARC64 V for Mission Critical Servers October 15, 2002 July 20, 2005 マイクロプロセッサの比較 SPARC64の位置づけ (f*√TR#)/Powerが悪化し悪化自体は課題、しかし、限られた(f*√TR#)/Powerでも大幅な性能向上が可能 SPARC64 Vは、(f*√TR#)/Powerがとても良い SPARC64 VIは、 (f*√TR#)/Powerが悪くなった(課題) しかしSPARC64 VIの性能はSPARC64 Vのおよそ4倍(Linpackソケットあたり性能) "All other company/product names mentioned may be trademarks or registered trademarks of their respective holders and are used for identification purpose only. " 21

わかったことこれまで数多くのトランジスタを、高い周波数で使い、かつ電力を抑制してきたこれからこれまでの成功の前提は崩壊
理想的なスケーリングを超えるf*√TR#の向上理想的なスケーリングと同レベルの (f*√TR#)/Power これからこれまでの成功の前提は崩壊微細化は進み集積度は向上する (f*√TR#)/Powerの継続的向上は期待できない

これからやっていかなければならないことトランジスタの使い道消費電力削減マイクロアーキテクチャの革新が求められている
July 20, 2005 これからやっていかなければならないことトランジスタの使い道性能向上にリニアに直接効く使い方　　(ex. 2倍のトランジスタで2倍の性能) f*TR#/Powerならば継続的向上が期待できる？消費電力削減マイクロアーキテクチャの革新が求められている (もちろん半導体デバイスの改善を望む！) ハイエンドのチップのインプリメントの技術が活かせる

トランジスタの使い道～マルチコアは悪くない
July 20, 2005 トランジスタの使い道～マルチコアは悪くない 1/nの大きさのコアをn個並べたチップは性能√n 倍コアあたり性能：1/√n チップあたりのIPC/FPCの総和：n×コア性能⇒ √n 倍　(キャッシュやバス共有の影響を無視) 世代ごとに回路量の増加分を全てコア数増に割り当てると性能はムーアの法則の線上の成長コアの回路量と周波数：一定コア数：α2倍コア性能の総和：α2倍　(使う側に努力を強要するが…) √TR#ではなく、TR#に応じた性能向上 (但し、単体性能ではなくスループット性能) WoodcrestやSPARC64 VIはデュアルコア、BlueGene/Lもデュアルコア

マイクロアーキテクチャマルチコアは効果的演算器強化は効果的行き過ぎ(大きすぎ、速すぎ)の是正は効果的しかし
コアの縮小は消極的、万能ではない周波数を下げるのは消極的、万能ではない抜本的解決は見えていないブレークスルーが必要

若いプロセッサ設計者に贈る12ヶ条トランジスタがあり余っているという考えは捨てる機能の要不要を切り分ける(性能評価、テスト機能)
July 20, 2005 若いプロセッサ設計者に贈る12ヶ条トランジスタがあり余っているという考えは捨てる機能の要不要を切り分ける(性能評価、テスト機能) 僅かに高い性能よりも効率を優先周波数とIPCのトレードオフ少ないトランジスタで効率の良い回路を作る論理構造で決まる無理のない動作周波数を狙うトランジスタを大きくして無理やり周波数を上げるのはNG 配線ファクタを大きくしないコンパクトな実装無用な高速回路の排除(ターゲット周波数を決めて、それにちょうど良い速さの回路) クリティカルパスのハンドチューン大きさと電力を下げる最適チューン(ツール) 何かにしわ寄せするのではなく全体でバランスを取るやることは変わらないが、目指す方向と、どこまで徹底するかが違うハイエンドのチップのインプリメントの技術が活かせる

SPARC64プロセッサの消費電力リーク電力はプロセス差が大きく影響（FF1.9σ：120W⇔TYP：80W）
July 20, 2005 SPARC64プロセッサの消費電力何れも机上値リーク電力はプロセス差が大きく影響（FF1.9σ：120W⇔TYP：80W）少し遅いプロセスではリーク電力は抑制される装置搭載時には消費電力が少ないものは温度が下がるため、更に効果大アクティブ分はSPARC64 VIで改善

熱抵抗と消費電力リーク大のチップリーク小のチップ

SPARC64の今後の取り組み電力を抑制しながら高性能化システム全体での省電力化
次機種SPARC64 VIIは、65nmに展開し4コア化省電力設計を更に推進アクティブ電力抑制（クロックゲーティング、SRAM制御など）リーク電力抑制（High-Vth使用率向上など） CPUコアを物理的に小さく作るシステム全体での省電力化部品数削減チップ冷却改善

まとめこれまでマイクロプロセッサは半導体の微細化とともに、一本調子で性能向上
(f*√TR#)/Power の尺度で、これまでと、これからを評価 90nmあたりにターニングポイントマイクロアーキテクチャが重要抜本的改善は見えていない、ブレークスルーが必要マルチコア、演算器強化消費電力削減論理、実装の両面で効率を重視した最適化の徹底

商標について Sun、Sun Microsystems、サンのロゴマーク、Sun Fire、Solaris、Javaは、米国Sun Microsystems, Inc. の米国およびその他の国における商標または登録商標です。すべてのSPARC商標は、米国SPARC International, Inc. のライセンスを受けて使用している同社の米国およびその他の国における商標または登録商標です。SPARC商標がついた製品は、米国Sun Microsystems, Inc. の開発したアーキテクチャに基づくものです。 SPARC64は、米国SPARC International, Inc. のライセンスを受けて使用している同社の商標です。 SPECは、米国およびその他の国におけるStandard Performance Evaluation Corporationの登録商標または商標です。その他各種製品名は、各社の製品名称、商標または登録商標です。

Fujitsu's new SPARC64 V for Mission Critical Servers
July 20, 2005 October 15, 2002 32

コンピューティングパワー拡大に伴う技術課題

Similar presentations

Presentation on theme: "コンピューティングパワー拡大に伴う技術課題"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

コンピューティングパワー拡大に伴う 技術課題

Similar presentations

Presentation on theme: "コンピューティングパワー拡大に伴う 技術課題"— Presentation transcript:

Similar presentations

About project

フィードバック

コンピューティングパワー拡大に伴う技術課題

Presentation on theme: "コンピューティングパワー拡大に伴う技術課題"— Presentation transcript: