キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）

キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）
CacheであってCashではないので注意元々はコンピュータの主記憶に対するものだが、IT装置の色々なところに使われるようになったディスクキャッシュ、ページキャッシュ..etc.. 当たる(ヒット）、はずれる（ミスヒット）ミスヒットしたら、下のメモリ階層から取ってきて入れ替える(リプレイス）マッピング（割り付け）主記憶とキャッシュのアドレスを高速に対応付ける Direct map　⇔　Full associative cache 書き込みポリシーライトスルー、ライトバックリプレイス（追い出し）ポリシー LRU　(Least Recently Used)

アドレスマッピング（割り付け）ワード単位に割り付けるのは効率が悪い順番に割り付けていって１周したら、元に戻る
一定の連続アドレスのブロック（ライン）を管理単位とするブロックサイズは8byte-128byte程度ここでは8word(16byte)を使うやや小さい順番に割り付けていって１周したら、元に戻るキャッシュのブロック数（セット数）が2のn乗、ブロックサイズが2のm乗とすると、、、残り n m タグ　（キー) インデックスブロック内アドレス

… Direct Map のアドレス割り付け主記憶：1024ワードブロックサイズ：8ワードキャッシュ：64ワード =8ブロック
　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… … Direct Map のアドレス割り付け主記憶：1024ワードブロックサイズ：8ワードキャッシュ：64ワード　　　　　　　=8ブロック 000 001 010 011 100 101 110 111 Index Tag （Key) 　　　　… ブロック内アドレス

Direct Map From CPU 0011010 0011 010 100 … … 010 010 Main Memory
(1KB=128Lines) Yes：Hit = Data 0011 Cache (64B=8Lines) Cache Directory (Tag Memory) 8 entries X (4bit ) ディレクトリは小さくて済む

Direct Map (Conflict Miss)
From CPU 0000 010 100 … … 010 010 Main Memory No: Miss Hit = 0000 0011 Cache 010を共通するキャッシュラインは Conflict　Missを起こす Cache Directory (Tag Memory)

… 2-way set associative のアドレス割り付け 00 01 10 11 Index Tag （Key) キャッシュ内
　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… 　　　　… … 2-way set associative のアドレス割り付け 00 01 10 11 Index Tag （Key) 　　　　… キャッシュ内アドレス

2-way set associative Map
From CPU 00110 10 100 … … 10 Main Memory (1KB=128Lines) Yes: Hit = Data 00110 Cache (64B=8Lines) 10 No = 00000 Cache Directory (Tag Memory) 4 entries X 5bit X 2

From CPU 00000 10 100 … … 10 Main Memory (1KB=128Lines) No = 00110 Cache (64B=8Lines) 　　10 Data Yes: Hit = 00000 Cache Directory (Tag Memory) 4 entries X 5bit X 2 Conflict　Missが減る

From CPU 001101 100 … … Main Memory (1KB=128Lines) 001101 = Ｄａｔａ = = 000000 Cache (64B=8Lines) Cache Directory (Tag Memory) 2 entries X 6bit X 4 =

8-way set associative Map → Full Map
From CPU … … 100 Main Memory (1KB=128Lines) = = = Ｄａｔａ = = = = Cache (64B=8Lines) Cache Directory (Tag Memory) 7bit X 8 =

Way数のトレードオフ大きくすると、、、ヒット率が改善遅延時間が大きくなる（マルチプレクサの遅延） 8くらいまでが多い
Direct Map→2way set associative 32人で1つの椅子を争う　VS. 64人で2つの椅子を争う　　偶然同じ時間に椅子を狙うライバルが居る場合は効果的サイズを倍にするのと同じ程度の効果が見込まれるそれ以上はどんどん効果が減る 4以上はあまり効果が上がらない遅延時間が大きくなる（マルチプレクサの遅延） 8くらいまでが多い

書き込みポリシー Write Through Write Back 書き込み時に主記憶にもデータを書く
Direct Write:ミス時は主記憶だけに書く Fetch-on-write:ミス時はリプレイスしてから書く主記憶に合わせると性能ががた落ち（Verilogの設計はそうなっている）だが、Write bufferがあれば性能がさほど落ちることはない Write Back 書き込みはキャッシュのみキャッシュと主記憶が一致：Clean、違う：Dirty Dirtyなキャッシュブロックは書き戻し（Write Back)をしてからリプレイス

Write Through （Hit） 0011010 … … From CPU Main Memory (1KB=128Lines)
100 主記憶も同時に更新 0011 Hit Cache (64B=8Lines) Write Data Cache Directory (Tag Memory) 8 entries X (4bit )

Write Through （Miss：Direct Write）
… … From CPU Main Memory (1KB=128Lines) 0000 010 100 主記憶のみ更新 0011 Miss Cache (64B=8Lines) Write Data Cache Directory (Tag Memory) 8 entries X (4bit )

Write Through （Miss：Fetch on Write）
… … From CPU Main Memory (1KB=128Lines) 0000 010 100 0011 0000 Miss Cache (64B=8Lines) Write Data Cache Directory (Tag Memory) 8 entries X (4bit )

Write Back （Hit） 0011010 … … From CPU Main Memory (1KB=128Lines) 0011
100 Dirty 0011 1 Hit Cache (64B=8Lines) Write Data Cache Directory (Tag Memory) 8 entries X (4bit+1bit )

Write Back （Replace） 0000010 0011010 … … From CPU Write Back
Main Memory (1KB=128Lines) 0000 010 100 Dirty 0000 0011 1 Miss Cache (64B=8Lines) Cache Directory (Tag Memory) 8 entries X (4bit+1bit )

ライトスルーとライトバック「ライトスルーは主記憶を待たなければならないので非効率」というのは嘘ライトバック
ちゃんとライトバッファを装備すれば性能的に悪くはならないしかし、シングルライトが必要→DRAMに合わない常にデータの一致が取れるのがメリット、観測性が高い、I/Oで有利ライトバック常にデータ転送がブロック単位→DRAM、高速バスに適合バスの利用率が下がる→マルチコアに適合大体世の中はライトバックになりつつある

リプレイスポリシーリプレイスの際、どのWayを選ぶか？ LRU (Least Recently Used)
Direct map以外のキャッシュで問題になる LRU (Least Recently Used) 最近もっとも使っていないwayを選ぶ 2-wayならば簡単→ Verilog記述参照 4-way以上は結構面倒→　擬似的なLRUでも大体OK 他にランダム、FIFOなどが考えられるが実際上あまり用いられない

キャッシュの性能キャッシュオーバーヘッド付きCPI(Clock cycles Per Instruction)＝理想のCPI +
　　命令キャッシュのミス率×ミスペナルティ　＋　　データキャッシュの読み出しミス率×読み出し命令の生起確率×ミスペナルティこの式の問題点ミスペナルティは書き戻しを伴うかどうかで違ってくる（Write Back) ライトバッファの容量、連続書き込み回数によっては書き込みミスでもストールする書き込み直後に読み出しをするとキャッシュが対応できないでペナルティが増えることもある→ノンブロッキングキャッシュ実際は階層化されているのでそれぞれの階層を考えないといけないプロセッサがOut-of-order実行可能ならば読み出し時にストールしないかもしれない（この話は後ほど、、、）ちゃんと評価するにはシミュレータを使うしかない、、、、

ミスの原因：３つのC Capacity Miss：容量ミス Conflict Miss:衝突ミス
絶対的な容量不足により起きる Conflict Miss:衝突ミス容量に余裕があっても、indexが衝突することで、格納することができなくなる Compulsory Miss (Cold Start Miss) 初期化ミススタート時、プロセス切り替え時に最初にキャッシュにブロックを持ってくるためのミス。避けることができない

キャッシュサイズとそれぞれもミスの割合 Hennessy & Patterson Computer Architectureより

ミスを減らす容量を増やす Way数を増やすブロックサイズを大きくする〇容量ミスはもちろん減る。衝突ミスも減る。
×コストが大きくなる。ヒット時間が増える。チップ（ボード）に載らない Way数を増やす〇衝突ミスが減るキャッシュ容量が小さいと効果的、2Wayは、2倍の大きさのDirect Mapと同じ位のミス率になるキャッシュ容量が大きい場合、残った不運な衝突ミスを減らす効果がある ×コストが大きくなる。ヒット時間が増える。4以上はあまり効果がない。ブロックサイズを大きくする　〇局所性によりミスが減る。　×ミスペナルテイが増える。（ブロックサイズに比例はしないが、、）　　　キャッシュが小さいと衝突ミスが増える容量に応じて適切なブロックサイズを選ぶ。32byte-128byte

ブロックサイズとミスの割合 Hennessy & Patterson Computer Architectureより

演習ｘとｙは互いにコンフリクトミスを起こす番地に配置されている。Direct Mapキャッシュで、以下のパターンで読み書きを行ったとき、Write Through（Direct Write)とWrite　Backキャッシュで（１）ヒットするかミスするか(2)リプレイスが起きるかライトバックが起きるかを示せ。なお最初のｘに対する読み出しはミスすると仮定する。１．xから読み出し２．yに書き込み３．yを読み出し４．xを読み出し５．yに書き込み６．xに書き込み

キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）

Similar presentations

Presentation on theme: "キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

キャッシュ 頻繁にアクセスされるデータを入れておく小規模高速なメモリ 当たる(ヒット）、はずれる（ミスヒット） マッピング（割り付け）

Similar presentations

Presentation on theme: "キャッシュ 頻繁にアクセスされるデータを入れておく小規模高速なメモリ 当たる(ヒット）、はずれる（ミスヒット） マッピング（割り付け）"— Presentation transcript:

Similar presentations

About project

フィードバック

キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）

Presentation on theme: "キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）"— Presentation transcript: