慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ　慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp.

慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp
新しいアーキテクチャ　慶應義塾大学理工学部天野英晴

将来のマイクロプロセッサ半導体技術の進展スーパスカラプロセッサの複雑化面積に見合った性能をいかに得るか？面積は大きくなる
しかし、性能はさほど向上しなくなる 0.1μm以降：スケーリング則の崩壊スーパスカラプロセッサの複雑化 →設計コストの増大、性能向上の頭打ち面積に見合った性能をいかに得るか？拡張されたVLIW方式 SMT　(Simultaneous　MultiｰThreading) マルチプロセッサ化 Reconfigurable　Systems

Intel Itanium 64bit用命令セットIA-64に対応 VLIWの考え方を導入投機的実行を支援
コンパイラ主導による複数命令同時発行動的スケジューリングを行わないしかし、単純なVLIWではなく柔軟性が高い一方、構造はかなり複雑投機的実行を支援ループ処理向けの様々な機能を持つ

柔軟なVLIW（命令のグループ化） add r6=＠gprel(a＃)，gp；； group1 r6=ａ［］
ldfpd　ｆ１，f2=［r6］　group2　f1=a［0］，f2=a［1］ ldfd　　f3=［r5］，16；； f3=a［2］ fma．d　f4=f1，f2，f3 　group3　f4=f1*f2+f3

柔軟なVLIＷ（グループとバンドル）ｇｒｏｕｐ Bundle(128bit) Template(5bit) Cycle Break

パイプライン構成 10段パイプライン、６命令同時発行Ｉｎｓｔｒｕｃｔｉｏｎ Delivery Operand Delivery
Execution Front　end IPG FET ROT EXP REN WLD REG EXE DET WRB IPG：Instruction　Pointer　ｇｅｎｅｒａｔｉｏｎ FET：Fetch ROT：Rotate EXP：Expand REN：Rename WLD：Word-line　decode ＲＥＧ：Register　ＲｅａｄＥＸＥ：Execute　ＤＥＴ：Ｅｘｅｃｕｔｅ　ｄｅｔｅｃｔ WRB：Write　Back

Block Diagram ＯｆｆＣｈｉｐＬ３Ｃａｃｈｅ L2 Cache B B B M M I I F F
L1　Instruction　Cache・Fetch/Prefetch　Engine IA-32 ＤｅｃｏｄｅａｎｄＣｏｎｔｒｏｌＯｆｆＣｈｉｐＬ３Ｃａｃｈｅ L2 Cache Branch Prediction B B B M M I I F F RegisterStuck/Re-mapping Score ｂｏａｄｅｔｃ．Ｂｒａｎｃｈ UnitｓＩｎｔｅｇｅｒＭＭＵＵｎｉｔｓ FP UnitｓＢｕｓ　Ｃｏｎｔｒｏｌｌｅｒ

分岐命令の削減 predication register
１の時だけ指定されたレジスタを有効にする cmp　eax，ebx jne L30 mov　ebx，CONST1 jmp　　Ｌ３１ L30：　mov　ebx，CONST2 L31： cmp．eq　p7，p8=r14，r15；；（ｐ７）　movi　r15=CONST1 (p8) movi r16=CONST2

Advanced Load Advanced Load ld4．a r2=［r33］ add r3=4，r0；； add r3=4，r0；；
st4　［r32］=r3 ld4．c　r2=［r33］；； add　r5=r2，r3 add　r3=4，r0；； st4　［r32］=r3 ld4　r2=［r33］；； add　r5=r2，r3 Check st命令との間のデータ依存性は、ALAT(Advanced　Load Address　Ｔａｂｌｅ）によって解決する。

Speculative Ｌｏａｄ add5： cmp．eq r6，p5=r32，r0；； add5: ld8.s r1=[r32]
(p6)　 add　r8=-1，r0 (p6)　 br．ret　 (p5)　 ld8　r1=［r32］ add　r8=5，r1 br．ret；； add5: ld8.s r1=[r32] cmp.eq p6,p5=r32,r0;; (p6) add r8=-1,r0 (p6) br.ret (p5) chk.s r1,return_error add r8=5,r1 br.ret page faultした場合、loadは待たされる

ループ演算の性能向上カウンタ付きループ命令ポストインクリメント命令昔から存在する複合命令だが、VLIW並列実行の枠組みを
利用して、実行サイクル数を避けることができる

Software Pipelining ｉ Loop： LD F0，０（R1) ADDD F4,F0,F2 SD ０（R1),F4
SUBI R1,R1,#8 BNEZ R1,Loop Loop： SD　0(R1)，F4 ADDD　F4,F0,F2 LD　F0，-16(R1) SUBI　R1,R1,#8 BNEZ　R1,Loop ｉ-1 i-2 どのようなマシンにも利用可能（これはDLXでのコード例）しかし、初期化と最後の部分がたいへん

Software Pipeliningのサポート
Modulo　Schedule　loop命令 loop　counterが０になっても実行を終了せず、新たなエピローグカウンタECが０になるまで実行レジスタローテーションループ毎に自動的にレジスタ番号を一つ増やしてリネームする。

その他レジスタスタックによる関数呼び出しの高速化関数呼び出し時のリネーミング

まとめ単純なVLIWではない命令セットは複雑であるが、RISCの高速化技法を数多く取り入れているコンパイラへの依存が中途半端
代償として構造の複雑化を招く危険性がある IA-32の実行も可能だが遅い

Simultaneous Multithreading (SMT)
スーパスカラプロセッサ複数命令同時発行マルチスレッドプロセッサコンテキストスイッチをハードウェアでサポート SMTは両方の特徴を継承プロセッサの利用効率が向上

SMTの動作 Issue Slots Issue Slots Issue Slots Clock Cycles superscalar
fine-grained multithreaded superscalar superscalar SMT

スーパスカラとの比較 SPECInt Apache ＯＳ無し有り superscalar 3.0 2.6 1.1 SMT 5.9 5.6
Instruction Per Cycle（IPC）による比較 SPECInt Apache 　　　　ＯＳ無し有り superscalar 3.0 2.6 1.1 SMT 5.9 5.6 4.6 SPECInt ： not OS intensive application Apache ： OS intensive application

SMTの利点並列度をスレッドレベルから命令レベルへレイテンシの隠蔽が可能コンテキストスイッチをハードウェアで実行 IPC の向上
OS（kernel）の影響が減少コンテキストスイッチをハードウェアで実行

ユニプロセッサと並列計算機の境目どのようなレベルの並列性を利用するか？
ILP(Instruction　Level　Parallelism) 命令レベルの並列処理 Trace　Level　Parallelism 数命令から成る命令列 Thread　Level　Parallelism 一定の大きさの命令列(複数プロセス) Process　Level　Parallelism プログラマ、コンパイラが分割した一定の処理を行う命令列ユニプロセッサ並列計算機

同時発行数の増加vs．プロセッサを接続単一パイプライン高性能化複数命令同時発行複数Thread同時実行オンチップ化
密結合共有メモリ、共有レジスタプロセッサを接続

Flynnの分類命令流(Instruction Stream)の数： M(Multiple)/S(Single)
データ流（Data　Streaｍ）の数：M/S SISD ユニプロセッサ（スーパスカラ、VLIWも入る） MISD：存在しない（Analog　Computer） SIMD MIMD

SIMD 全プロセッサが同一命令で動作柔軟性が低い Illiac-IV/マルチメディア命令タイプ（粗粒度） CM-2タイプ（細粒度）
命令メモリ命令演算プロセッサデータメモリ

ＳＩＭＤ型の分類粗粒度型：各ノードで浮動小数点演算処理が可能細粒度型：各ノードは１bitまたは数bitの演算しかできない
ILLIAC-IV，BSP,GF-11 最近の高性能CPUのマルチメディア命令細粒度型：各ノードは１bitまたは数bitの演算しかできない ICL　DAP,　CM-2，MP-2 コネクションマシンは応用分野を人工知能に拡大（CmLispの功績）

CM-2のプロセッサ Flags A B F OP C Context s c 256bit memory 1bit serial ALU

CM2のプロセッサチップ 4096チップで命令 64K PE １チップ構成 P Router P P P
4x4 Processor Array 12links 4096 Hypercube connection 256bit x 16 PE RAM

SIMD型の将来粗粒度SIMD 細粒度SIMD 専用SIMDは、将来大いに伸びる可能性がある大規模なものの復活はないだろう
マイクロプロセッサの高速化技術として小規模なものが生き残る細粒度SIMD 画像処理等で圧倒的に有利 CM2　→　CM5のようにマルチプロセッサ化した方が性能が高い専用SIMDは、将来大いに伸びる可能性がある

全プロセッサが自分の命令を独立に実行同期が必要汎用性が高い様々な構成法が存在 MIMD プロセッサ結合網メモリ(命令・データ）

共有メモリの形態による分類 UMA(Uniform Memory Access Model）
どのプロセッサからでも同様にアクセスすることができる共有メモリを持つ NUMA(Non-Uniform　Memory　Access　Ｍｏｄｅｌ）共有メモリは持つがレイテンシが異なる NORA/NORMA（No　Remote　Memory　Access　Model）共有メモリを持たずメッセージ交換で処理を行う

UMA 最も単純な共有メモリ型単一プロセッサの延長プログラム、OSの開発が楽小規模システムに限られる
バス結合型スイッチ結合型システム全体をLSI中に収める動きがあるオンチップマルチプロセッサ

UMAの一例：バス結合型 Main Memory shared bus PU Snoop Cache PU Snoop Cache PU
SMP(Symmetric MultiProcessor)として標準部品化オンチップに格納可能

スイッチ結合型UMA Local Memory ．．．． CPU Interface Switch …． Main Memory
スイッチとバスの区別はどんどんなくなりつつある

Stanford’s Hydra ＣＰＵ I/O Bus Interface Considerations in the design
of Hydra CSL-TR , ＣＰＵ Mem.　Cont. Ｌ１　Ｉ Cache L1　D On-chip　L2　Cache Off-chip　L3　Cache　Int. I/O Bus Interface Rambus Memory interface Cache SRAM Array Write Through Bus(64b) Read/Replace Bus(256b) DRAM Main Memory I/O

Ｄａｙｔｏｎａ（Ｌｕｃｅｎｔ）ＭＥＳＩ Protocol RISC+DSP
Pipelined operation of bus and memory controller. 128bit STBus 0．25μm CMOS　4．5m×6mm (small chip)

Daytona(Lucent) STBus L1 PE0 Memory and Ｉ／ＯＣｏｎｔｒｏｌｌｅｒ L1 PE1
Ｉ／Ｏ　Ｃｏｎｔｒｏｌｌｅｒ PE1 L1 PE2 L1 semaphores ａｒｂｉｔｅｒ PE3 L1

Power4(IBM) 0.18μm copper process, 400m㎡ 17000M Tr.
Inter-chip interface for MCM(Multi-Chip Module） TLP（Thread Level Parallelism) Design considering memory bandwidth Shared cache + links

Power4(IBM) CPU1 CPU2 L3 Cache Main Memory L3 Tags L2 Shared Cache
>100GByte/s >333MHz >10GByte/s CPU1 CPU2 L3 Cache Main Memory Chip-to-Chip Interconnect L2 Shared Cache L3 Tags >500MHz, Wave-Pipelined Expansion Buses >10GByte/s Chip-to-Chip Interconnect >500MHz >35GByte/s

ＭＡＪＣ Hierarchical structure Variable length VLIW processing element
Shared cache I/O for inter-processor communication I/O for PCI,DRAM MAJC5200:0．22μｍ CMOS 220mm square

MAJC(Microprocessor Architecture for Java Computing：ＳＵＮ）
ＲａｍｂｕｓＩ／ＯＮ－ＵＰＡＰＣＩ　Ｉ／ＯＧｒａｐｈｉｃ Processor ＦＵ０１２３ I-Cache ＦＵ０１２３ I-Cache ＳｗｉｔｃｈＳｈａｒｅｄＣａｃｈｅＳ－ＵＰＡ

NUMA それぞれがローカルメモリを持ち、他のプロセッサのメモリをネットワーク経由でアクセスする
アドレス変換、キャッシュ制御が必要でハードウェア制御が複雑スケーラブル： UMAのプログラムがそのまま移植可能プロセッサ数を大きくした分の性能向上が得られるクラスタ＋ソフトウェアDSMと競合中

典型的な構成論理アドレス空間 Node ００ Node １１ＩｎｔｅｒｃｏｎｎｅｃｔｏｎＮｅｔｗｏｒｋ２ Node 2 ３

NUMAの分類（ただの）NUMA： CC-NUMA：Cache Coherent
リモートメモリをキャッシュしない構成が単純、リモートメモリのアクセスにコストがかかる CC-NUMA：Cache　Coherent キャッシュの一致制御を保証複雑なハードウェアが必要 COMA:Cache　Only　Memory　Architecture ホームメモリを持たないハードウェアがより複雑

Interconnection Network (16GB/s x 2)
Earth Simulator (2002,NEC) Peak performance 40TFLOPS Interconnection Network (16GB/s x 2) Vector Processor … 1 7 Shared Memory 16GB Vector Processor … 1 7 Shared Memory 16GB Vector Processor … 1 7 Shared Memory 16GB …. Node 0 Node 1 Node 639

SGI Origin Main MemoryはHub Chipから直接リンクを出す２PEで１Cluster
Bristled　Hypercube Main　Memory Hub　Chip Ｎｅｔｗｏｒｋ Main　MemoryはHub　Chipから直接リンクを出す２PEで１Cluster

DDM(Data Diffusion Machine）
Ｄ．．．．．．．．．．．．

NORA/NORMA 共有メモリを持たない交信はメッセージのやりとりで行う最も単純な構成で最大性能を得ることができる
一面、プログラムが難しい。汎用性に乏しい技術的な問題は、プロセッサ間接続、パケット転送チップ間接続網とパケット転送クラスタコンピューティング

Ｆｉｎｅ　ｇｒａｉｎ　ＳＩＭＤＣｏａｒｓｅ　ｇｒａｉｎ　マルチプロセッサコントロールフロー制御バス結合型ＵＭＡスイッチ結合型ＵＭＡＳｉｍｐｌｅ　ＮＵＭＡＣＣ－ＮＵＭＡＣＯＭＡＭＩＭＤＮＵＭＡＮＯＲＡマルチコンピュータシストリックアーキテクチャデータフロー制御混合制御要求駆動その他

シストリックアーキテクチャ Data列ｘ演算アレイ Data列ｙ特定の演算能力を持つアレイ列に一定の間隔で
リズミカルにデータを送りこみ、並列演算

帯行列の行列積 y=Ax y0 y1 y2 y3 a11 a12 0 0 a21 a22 a23 0 0 a32 a33 a34
ｙｉｙｏＸ＋ｙｏ＝ａｘ＋ｙｉ x

帯行列の行列積 y=Ax a11 a12 0 0 a21 a22 a23 0 0 a32 a33 a34 0 0 a43 a44
Ｘ＋ x1

帯行列の行列積 y=Ax a11 a12 0 0 a21 a22 a23 0 0 a32 a33 a34 0 0 a43 a44 a33
Ｘ＋Ｘ＋ x2 x1

帯行列の行列積 y=Ax a11 a12 0 0 a21 a22 a23 0 0 a32 a33 a34 0 0 a43 a44

Ｘ＋Ｘ＋ x2 x3

Ｘ＋ x3 x2

シストリックアーキテクチャの特長入出力ピン数が少ない単純な同期制御近接接続のみで構成可能
1980年代Kungらの提案により注目されたがLSI実装面積の不足により普及しなかった他の「VLSIアルゴリズム」と共に復活の可能性オンチップメモリが活用されないのが問題

データフローアーキテクチャデータをトークンとして考え、到着と共に計算処理が駆動される。記憶要素を明示的に指定しない。
アルゴリズムの持つ並列性を最大限に引き出すことができる。

データフローグラフｄｅｃｘａｂ＋＋ｘ（ａ＋ｂ）ｘ（ｃ＋（ｄｘｅ））

命令実行サイクル命令読み出しデータ待ち合せデータ読み出し命令読み出し命令実行命令実行データ格納あて先指定データフローマシン
通常のプロセッサ

データフローマシンの問題点純粋なデータフローマシン（Dennisのマシン）は無駄が多い。
色付きトークン等の導入でデータフローグラフの再利用。構造の複雑化演算器レベルの処理時間とそれに要する時間の比率の問題局所性の無視

Reconfigurable System （Custom Computing Machine）
SRAM型プログラマブルデバイスから構成されるシステム上で問題の解法アルゴリズムを直接ハードウェア化して実行する専用マシンのスピード汎用マシンの柔軟性プログラム格納型計算機とはまったく異なる原理でしかも堂々たる体系を作ることができるしかし誰も騒いでくれない

最近のFPGA/PLD ｹﾞｰﾄ数は１０００Kｹﾞｰﾄに及ぶ（半分嘘だけど、、）最大動作周波数は設計次第だが30MHz程度ならば容易に実現
内部データ格納用SRAMを持つ単純なゲートアレイは、使われなくなっている。

(Field Programmable Gate Array)
SRAM型FPGA (Field　Programmable　Gate　Array) 5入力テーブルスイッチ設定 Configuration　Memory 2　F．F． I/O Logic　Block Look　Up　Table Switch

(Complex Programmable Logic Device)
SRAM型CPLD (Complex　Programmable　Logic　Device) I/O SRAM(Configuration　Memory） Logic　Block Switch

代表的なReconfigurable System
独立実行型スタンドアローンで動作 Splash　１・２，　RM-I,II,III,IV，　ＦＬＥＭＩＮＧコ・プロセッサ型汎用プロセッサの一部の処理を高速化 PRISM　I,II、　ＤＩＳＣ　ＩＩ

Reconfigurable Systemの分類
スタンドアローン型独立性の高い専用システム Splash　１・２，　RM-I,II,III,IV，　RASH（三菱）、ATTRACTOR（NTT）コ・プロセッサ型汎用プロセッサの一部の処理を高速化 PRISM　I,II、DISC-II、PipeRench、CHIMAERA，Chameleonなど

Reconfigurable Systemの発達
Stand　Alone Co-processor New　Device 1990年第1回FPL SPLASH MPLD PRISM-I 1992年第1回Japanese　FPGA/PLD　Conf. SPLASH-2 PRISM-II RM-I WASMII 1993年第1回FCCM RM-II Cache　Logic RM-III DISC RM-IV 1995年 YARDS Mult．Context　FPGA RM-V DISC-II HOSMII ATTRACTOR FIPSOC Cont．Switch．FPGA RASH PipeRench DRL PCA 2000年 CHIMERA Chamereon

Splash-2 (Arnoldら 92) 米国計算機科学センター
文字列検索、画像処理、ＤＮＡの塩基配列間の距離を求める問題でCray-ＩＩの330倍の性能を発揮直線シストリックアレイ構造 VHDL,　並列Cによるプログラミング Annapolis　Micro　Systems社より商用化（WILDFIRE)

Ｓｐｌａｓｈ-ＩＩ米国計算機科学センタ文字列検索、画像処理、ＤＮＡの塩基配列間の距離を求める問題でCray-IIの330倍の性能を発揮
Ｓｐｌａｓｈ-ＩＩ　米国計算機科学センタ文字列検索、画像処理、ＤＮＡの塩基配列間の距離を求める問題でCray-IIの330倍の性能を発揮直線アレイ構造 VHDL,並列Cによるプログラミング

RM-IV(神戸大学) ＦＰＧＡ mem．ＦＰＧＡ mem． FPIC Ｉｎｔｅｒｆａｃｅ

RASH (三菱電機) 1Unit: 最大6枚のEXEボードとCPUボード（Pentium) 複数のUnitを接続可能ディスプレイ
CompactPCI bus EXE- ボード CPUボードディスプレイ disk Ethernet LAN RASH unit CD 1Unit: 最大6枚のEXEボードとCPUボード（Pentium) 複数のUnitを接続可能 &p This slide is supported by Dr.Nakajima of Mitsubishi.

EXEボードの構成 FPGA Altera FLEX10K100A (62K-158KGate) リンク接続とバス接続 2系統のクロック
PCI-bus リンク接続とバス接続 2系統のクロック PCIバスＩ／ＦＳＲＡＭ搭載 DRAM付加ボード搭載可 PCI-bus I/F PCI Local-bus SRAM （2MB） EXE-board controller Clocks／Cont. signals Local-bus FPGA FPGA FPGA FPGA FPGA FPGA FPGA FPGA FPGA　Altera　FLEX10K100A　(62K-158KGate) &p

ATTRACTOR（NTT）高速シリアルリンク（1Gbps） RISC FPGA RISC FPGA ATM I/O RAM （LUT)
SW Buffer RISC RISC RISC RISC Ethernet Compact　PCI MPU ATM通信処理に特化したシステム多種類のボードを接続 Mem. ボードレベルで再構成可能

コ・プロセッサ型 Core CPUと密接続プログラムの一部を高速化
NAPA,　Garp,　Chameleon,　Chimaera,　PipeRench

PRISM II（Brown大学）プログラムのよく使う部分を高速化コプロセッサ型の元祖 Am2955 CPU ＤａｔａＡｄｄｒｅｓｓ
Ｃｏｎｔｒｏｌ Boot　ROM Sｗｉｔｃｈ DRAM Burst　Mode Memory　Controller DRAM ＦＰＧＡ　ＭｏｄｕｌｅＦＰＧＡ　ＭｏｄｕｌｅＦＰＧＡ　Ｍｏｄｕｌｅプログラムのよく使う部分を高速化コプロセッサ型の元祖

Garp (Hauserら 97) UCBのプロジェクト MIPSコアとReconfigurable Arrayが強結合しメモリ階層を共有
Memory queue UCBのプロジェクト MIPSコアとReconfigurable Arrayが強結合しメモリ階層を共有コンパイラの静的解析によりループ処理を抽出しハードウェア化画像処理などでUltrasparcの43倍の性能 MIPS Cache Q Q Q Crossbar 32bit buses x 5 Reconfigurable Array

DISC (Wirthlinら 95) Brigham Young大学動的な部分書き換え機能を用いた汎用プロセッサ
FPGA 3 Processor Core System Memory Brigham Young大学動的な部分書き換え機能を用いた汎用プロセッサ任意のカスタム命令を基本命令セットに追加可能各モジュールをユーザが設計 C言語上から関数として利用 FPGAをカスタム命令モジュールのキャッシュのように使用 FPGA 1 Bus I/F Configuration Controller FPGA 2 Custom Instruction Space Host P/C

CHIMAERA (Yeら 2000) Northwestern大学スーパスカラプロセッサのデータパスに可変構造アレイを挿入
シャドウレジスタファイルから9レジスタを一度に読込み Out of Order制御 10～20%の高速化シャドウレジスタファイルレジスタファイル可変構造アレイ uPコアコントローラ

Chameleon（Cｈameleon社）
Field　Programmable　System　Level　Integrated　Circuits　(FPSLICs) 疎粒度のReconfigurable　Processing　Fabric、RISC　Core、PCI　Controller、Memory　Controller、DMA　Controller、SRAMを1チップ上に混載信号処理、通信プロトコル処理用、高速DSPの5-10倍の性能

Chameleon CS2112 32-bit PCI Bus 64-bit Memory Bus PCI Cont. RISC Core
Controller 128-bit RoadRunner Bus Configuration Subsystem DMA Subsystem Reconfigurable Processing Fabric 160-pin Programmable I/O

Reconfigurable Processing Fabricの構造
CTL中の最大８命令をDPU中で実行可能 CTLは、同じサイクルで次の命令を決定可能新しいbit　ｓｔｒｅａｍをloadすることで構成を変えられる Reconfigurable Processing Fabricの構造 DPU CTL LM Tile　0 Slice　0 LM DPU CTL Tile　0 Slice　3 108のDPU(Data　Path　Unit)が４つのSlice（各３Tile）を構成 1Tile:　９DPU＝32bit ALU X 7 16bit + 16bit乗算器　X　２

DPUの構成 OP：C、Verilog演算子サポート DPU単位のSIMD,パイプライン Instruction Routing
Register ＆ Mask Routing MUX OP Register Barrel Shifter Register Register ＆ Mask Routing MUX

Reconfigurable Systemの問題点
SRAM型FPGAの演算器は専用CPU,DSPよりも10倍遅く、10倍集積度が劣るメモリとの接続が脆弱アルゴリズムを変換するための標準的方法が存在しない問題サイズがシステムサイズを越えるとお手上げ

おわりに様々な新しいアーキテクチャを概観した今回の話はイントロのみ
個人的には並列アーキテクチャとReconfigurable　Systemsに中心を置いて研究を進めている

慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ　慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp.

Similar presentations

Presentation on theme: "慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ　慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp."— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

慶應義塾大学理工学部 天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ 慶應義塾大学理工学部 天野英晴 hunga@am．ics．keio．ac．jp.

Similar presentations

Presentation on theme: "慶應義塾大学理工学部 天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ 慶應義塾大学理工学部 天野英晴 hunga@am．ics．keio．ac．jp."— Presentation transcript:

Similar presentations

About project

フィードバック

慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ　慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp.

Presentation on theme: "慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp 新しいアーキテクチャ　慶應義塾大学理工学部天野英晴 hunga@am．ics．keio．ac．jp."— Presentation transcript: