第４章　記憶装置の構成 4.1記憶階層方式 4.1.1記憶装置への要求事項 (1)速度：アクセスタイムとサイクルタイム (2)容量

Slides:

Advertisements

Similar presentations

3章主記憶装置(pp ) 4章補助記憶装置(pp ). 記憶装置の分類主記憶装置（メインメモリ）単に「主記憶」とも．コンピュータの電源が入っている間に，作業中の情報を蓄える．実行中のプログラムの，プログラム本体実行中のプログラムの使う情報（Ｃ言語では，変数の値）

Advertisements

DATE : 11. メモリ五島正裕今日の内容メモリ  SRAM  DRAM  Flash Memory.

ディジタル回路 11. メモリ五島正裕ディジタル回路今日の内容メモリ  SRAM  DRAM  Flash Memory.

Linuxを組み込んだマイコンによる遠隔監視システムの開発

オペレーティングシステムJ/K 2004年10月18日(5時限目)

オペレーティングシステム (仮想記憶管理)

キャッシュの高速化手法と仮想記憶天野英晴.

計算理工学基礎「ハイパフォーマンスコンピューティングの基礎」

情報検索概説II 第8回パソコン組み立てと記憶装置 1999/11/25.

計算機工学III オペレーティングシステム #14 ファイル：より進んだファイルシステム 2006/07/21 津邑公暁

CPU、記憶装置について情報機器工学 2015年4月20日　Ⅳ限目.

情報システム基盤学基礎１コンピュータアーキテクチャ編第６回記憶階層

基本情報技術概論（第10回）埼玉大学理工学研究科堀山貴史

Ibaraki Univ. Dept of Electrical & Electronic Eng.

計算機システムⅡ キャッシュと仮想記憶和田俊和.

ダイレクトマップキャッシュの構成例：メモリアドレス＝３２ビットキャッシュ容量C＝256Kbyte　C=B×A×S ブロックサイズ（ラインサイズ）B＝３２byte セット数（ブロック数、ライン数）S=8K アソシアティビティA=1 (ダイレクトマップは１) メモリアドレス＝３２ビットタグ１４ビット.

第６回　仮想記憶とページングページングページ取り出し方式ページ置き換え方式中間テスト（４０分）

オペレーティングシステム第10回仮想記憶管理(1)

システムソフトウェア講義の概要計算機システムの復習：中央演算処理装置(CPU)，プログラムの実行，主記憶装置，補助記憶装置

記憶管理（１）オペレーティングシステム第9回.

計算機工学III オペレーティングシステム #9 主記憶管理：ページング 2006/06/09 津邑公暁

オペレーティングシステム (割り込み＆仮想記憶管理)

基本情報技術概論（第12回）埼玉大学理工学研究科堀山貴史

入出力管理オペレーティングシステム 6/26/09.

10. メモリ五島正裕.

Ibaraki Univ. Dept of Electrical & Electronic Eng.

～補助記憶装置～　主記憶装置に記憶されるデータは，パソコンの電源を切ると記憶内容が消えてしまう。また，容量にも限界があるので，補助記憶装置にデータを記憶させる。補助記憶装置はパソコンの電源を切っても記憶内容は消えない。補助記憶装置の内容は主記憶装置上で利用することができる。電源OFF 電源OFF.

計算機システムⅡ 主記憶装置とALU，レジスタの制御

計算機システム概論・４回目本日のトピック：メモリの管理と仮想記憶メモリ管理におけるOSの役割メモリの割当方法について

オペレーティングシステム第11回仮想記憶管理(2)

オペレーティングシステム第9回実記憶管理 38号館4階N-411 内線5459

3章主記憶装置(pp ) 4章補助記憶装置(pp )

キャッシュ頻繁にアクセスされるデータを入れておく小規模高速なメモリ当たる(ヒット）、はずれる（ミスヒット）マッピング（割り付け）

地理情報システム論第３回コンピュータシステムおけるデータ表現(1)

情報技術基礎処理装置の構成と動作 D17kog706pr101 始.

記憶管理（２）オペレーティングシステム第10回.

『コンピュータ構成要素』（C）Copyright, Toshiomi KOBAYASHI,

ソフトウェア階層分類具体例応用ソフト基本ソフトアプリケーションソフト個別アプリケーションＳＥやユーザが開発するプログラム

オペレーティングシステム第12回仮想記憶管理(3)

第７章　データベース管理システム７．１データベース管理システムの概要７．２データベースの格納方式７．３問合せ処理.

Ibaraki Univ. Dept of Electrical & Electronic Eng.

オペレーティングシステム i386アーキテクチャ(2)

基本情報技術概論（第８回）埼玉大学理工学研究科堀山貴史

パソコンの歴史～1970年 1970年代 1980年代 1990年～ ▲1946 ＥＮＩＡＣ（世界最初の計算機、1,900加算/秒, 18,000素子） ▲1947 ＵＮＩＶＡＣⅠ（最初の商用計算機） ▲1964 IBM System/360（5.1MHz, 1MB, 2億円） ▲1974 インテル8080（8.

メモリ管理 4.3, 4.4 章さだ.

型付きアセンブリ言語を用いた安全なカーネル拡張

オペレーティングシステム (仮想記憶管理)

メモリとHDD.

オペレーティングシステム (仮想記憶管理)

第６回メモリの種類と特徴主記憶装置、ROM、RAM

作りながら学ぶコンピュータアーキテクチャ（改訂版）授業資料テキストページ対応天野英晴

コンピュータを知る１Ｅ１６Ｍ００９－１梅津たくみ１Ｅ１６Ｍ０１７－８小沢あきら１Ｅ１６Ｍ０３５－０柴田かいと

Ibaraki Univ. Dept of Electrical & Electronic Eng.

オペレーティングシステムJ/K (仮想記憶管理)

第7回授業計画の修正中間テストの解説・復習前回の補足（クロックアルゴリズム・PFF) 仮想記憶方式のまとめ特別課題について

コンピュータの基本構成について 1E16M001-1 秋田梨紗 1E16M010-2 梅山桃香 1E16M013-3 大津智紗子

Ibaraki Univ. Dept of Electrical & Electronic Eng.

第5回メモリ管理（２）オーバレイ方式論理アドレスとプログラムの再配置静的再配置と動的再配置仮想記憶とメモリ階層セグメンテーション

コンピュータアーキテクチャ第 9 回.

地理情報システム論（総）／国民経済計算論（商）

第４回　メモリ管理主記憶（メインメモリ）の管理固定区画方式と可変区画方式空き領域の管理スワッピング.

計算機アーキテクチャ１（計算機構成論（再））第一回計算機の歴史、基本構成、動作原理

2013年度プログラミングⅠ ～内部構造と動作の仕組み（２）～.

アルゴリズムとデータ構造1 2009年6月15日

第４回 CPUの役割と仕組み２命令の解析と実行、クロック、レジスタ

「コンピュータと情報システム」 02章ハードウェア

アルゴリズムとデータ構造 2010年6月17日

Ibaraki Univ. Dept of Electrical & Electronic Eng.

分散メモリ型並列計算機上での行列演算の並列化

Ibaraki Univ. Dept of Electrical & Electronic Eng.

Presentation transcript:

第４章　記憶装置の構成 4.1記憶階層方式 4.1.1記憶装置への要求事項 (1)速度：アクセスタイムとサイクルタイム (2)容量 (3)不揮発性（Non-Volatile) ：電源切っても記憶は残る (4)書換え可能性 (5)ランダムアクセス性 (6)可搬性

4.1.2各種の記憶デバイスの速度と容量（１）半導体メモリ SRAMとDRAM S:Static 　電気を入れておけば安定に情報を記憶 D:Dynamic 　電気を入れておいても、ときどき読み出さないと記憶がなくなる→リフレッシュが必要

SRAM フリップフロップたすきがけ：正帰還 D G NMOS G電位大　D-S導通 S

DRAM コンデンサの電荷で０，１を表現

V1=（VpCp-VsCs+VDCs)/(Cp+Cs) V1+V2=VD V1Cp-V2Cs=VｐCp-VsCs V1=（VpCp-VsCs+VDCs)/(Cp+Cs) 電荷保存則

　ＤＲＡＭ１の読み出し時：ＶｐＣｐ／（Ｃｐ＋Ｃｓ）０の読み出し時：（ＶｐＣｐ＋ＣｓＶＤ）／（Ｃｐ＋Ｃｓ） Vｐ＝VD／２とすると，１の読み出し時：VD（１－Cｓ／（Ｃｐ＋Ｃｓ））／２０の読み出し時：VD（１＋Cｓ／（Ｃｐ＋Ｃｓ））／２高速ページモード，ＳＤＲＡＭ，ＲＤＲＡＭ　リフレッシュ　　セル当たり９６msecごと　　１行単位で同時に読み出して書き込む

DRAMについての私の経験・１Kb DRAM １９７４に購入（東光株式会社）アクセスタイム 350nsec 容量２５６KB 価格１０００万円・２５６Mb　DRAM ２００１年にパソコンのアドオンメモリとして購入アクセスタイム　７０nsec 容量１２８MB 価格５０００円

(2)固定型補助記憶装置ハードディスク　　年率：６０％で容量増加　　浮上隙間は１０~２０ｎｍ程度　　トラック数：5,000~30,000 　　セクタ数：100~500 　　セクタバイト数：５１２B 　　シーク（seek）時間：５~12msec 　　回転待ち（rotation　latency）　　　3,600~15,000RPM（Rotations　Per　Minute）　　　3,600RPMで1/（2＊60)=8msec 　　　7,200RPMで４msec

(3)可搬（リムーバブル）型補助記憶装置フロッピディスク（FD）フラッシュ（flash memory） SuperDisk, 光および光磁気ディスク CD-R（追記型，一回の書込みのみ可能） CD-RW（複数回の読出し書込みが可能） MO（Magneto－Optical） DVD（Digital Versatile Disk）－RAM カセット型磁気テープ２倍速，４倍速のドライブ装置: 音楽用ＣＤの基準データ転送速度１５０ＫＢ／ｓの何倍

(4)リードオンリメモリ（ROM）マスクROM PROM（Programmable　ROM） EPROM（Erasable　PROM） EEPROM（Electrically　Erasable　PROM）　OSなどの基本プログラム部分の格納　　例えばローダ　制御記憶などのデコーダ　文字パターン　関数表

4.1.3記憶階層方式参照の局所性（locality　of　references）時間局所性（temporal　locality）空間局所性（spatial　locality）アナロジ：頭の中、メモ帳、机上の本、引出しのファイル、部屋の本箱、地下倉庫

4.2仮想記憶　ユーザのアドレス空間：４GB 実記憶容量：　　４MB 4.2.1基本方式 (1)ページング方式 (2)セグメンテーション方式 4.2.2写像方式 (1)直接写像ページテーブル多重レベルページングセグメントテーブルセグメンテーション＋ページング Pentiumの方式ページ化セグメンテーション

１次元アドレス

ページングでの仮想アドレスの生成　　IBMメインフレームのアドレッシングモード　　　例インデックスモード　　　　　Rb＋Rｘ＋変位　　　　　Rb:ベースレジスタ（汎用レジスタ使用）　　　　　Rx：インデックスレジスタ（同上）　　　　　OP　Rｄ　Rｂ　Rｘ　D 　　　　　　８　　４　　４　　４　１２

２次元アドレスセグメント：あるまとまったデータとかプログラム、可変長オフセット、変位：8086で16ビット、Pentiumで32ビット２次元アドレス　　　　　　　セグメント：あるまとまったデータとかプログラム、　可変長 Pentiumではセグメントセレクタ

Pentiumでのセグメンテーションセングメントの種類　　コード、データ、スタック、．．．セグメントレジスタ：セグメントセレクタを格納　　CS：コード　　SS：スタック　　DS：データ　　　ES,FS,GS：予備

ここにセグメント番号（セレクタ）を入れておくセグメントベースへの変換が必要各命令のオペランドごとに対象となるセグメントレジスタが暗黙に決まっている。そのセグメント内でアドレッシングモードを適用

４KBの小ページを１M個指定４GBの大ページを１０２４個指定

セグメントごとのアクセス制御も可能。R,R/W

Eの追い出し詰め（コンパクション）フラグメンテーション、断片化

１次元の非常に大きな仮想アドレスフラグメンテーションはあるが、気にならないくらいスペースがある

(2)連想写像ページフレームテーブルハッシュ法 TLB法ＴＬＢミスの対処ハードまたはソフト

実際のアドレス空間の大きさ IBMメインフレーム１９６４年 S３６０２４ビット１９７０年 S３７０２４ビット、仮想記憶の導入　１９８３年　S370ーXA　３１ビット　１９８８年　ESA/３７０（Enterprise　Systems 　　　　　　　Architecture）　１９９０年　ESA/３９０　２０００年　ｚ/Architecture　６４ビット　　　

z/Architectureでのページテーブルページテーブルウオークページテーブル　　ウオーク K.E.Plambeck：Development　and　Attributes　of　z/Architecture,　IBM　J.Res　Dev,46,4/5,2002

Intel マイクロプロセッサ 1978 8086 １MB １６ビットセグメント長最大６４kB 286 16MB 最大実アドレス容量 Intel マイクロプロセッサ 1978　8086　　１MB １６ビット　セグメント長最大６４kB 286 16MB 386 4GB　３２ビット　セグメント長最大4GB 486 4GB　　　　　　　　セグメント数：16383 Pentium 4GB 1995 Pentium Pro 64GB 1997 Pentium II 64GB Pentium III 64GB 2000 Pentium 4 64GB 仮想アドレス空間１４ビット：セグメント番号指定３２ビット：セグメント内アドレス指定計４６ビット

4.2.3 ページフレームの管理 (1)各種管理テーブル (2)ページ置き換えアルゴリズムＦＩＦＯ：First　In　First　Out ＦＩＮＵＦＯ：First　In　Not　Used　First　Out　ＬＲＵ：Least　Recently　Used ワーキングセット：Working　Set (3)多重プログラミング制御と置き換えアルゴリズムグローバルＬＲＵ法ワーキングセット法 4.2.4 仮想空間の共有と保護多重仮想記憶方式

ページ要求時刻-1、-0 プロセス０，１仮想ページ０、仮想ページ１０要求ページフォールト時刻１プロセス１仮想ページ０ページ枠０時刻-1、-0　プロセス０，１　仮想ページ０、仮想ページ１０要求　　　　　ページフォールト時刻１　プロセス１　仮想ページ０　ページ枠０　　　　　実行中へ時刻３　プロセス２　仮想ページ１０　ページ枠１　　　　　プロセススイッチで実行中時刻４　プロセススイッチでプロセス１へ　　　　　仮想ページ256　ページ枠２時刻５　プロセス１　仮想ページ５１２　ページ枠３　　　　　ＴＬＢフル　仮想ページ０　ＴＬＢ追い出し時刻７　プロセス１　仮想ページ７　レジデントセット限界　　　　　仮想ページ０に対応したページ枠０を置き換えて　　　　　仮想ページ７に割り付け

０ページフォルトプロセススイッチ時刻-１０ TLBミスプロセス１仮想ページ０要求０１２３

時刻-0 ０００プロセス２仮想ページ10要求０２０ 10 TLBミス０ 10 ０１２３ページフォルトプロセススイッチ

時刻１ディスク終了割込み１０＃１仮想ページ０読出しプロセス１実行１０００１０プロセス２仮想ページ10要求０３２

時刻３ディスク終了割込み１０＃１仮想ページ１０読出し１０００１１１０プロセス２ページ10参照００２＃２１０ 10 プロセススイッチプロセス２実行０１０３１ 10 ページフレーム使用ベクトル１使用リスト０１２３

時刻５プロセス１１０＃１仮想ページ５１２読出し１００２１１０ 256 ２１１３１ TLBフル没ＴＬＢ０ＴＬＢ１プロセス２ページ10参照００ 0:2 ＰＦＮ：２ VPN：256 ２ 10 １０３＃２１０プロセススイッチプロセス２実行０１０３１ 10 １使用リスト０１２３

プロセス１１０５２＃１ 512 仮想ページ５１２読出し時刻５１００２３１１０４ 256 ２３１１３１１０１０５５１２ TLB書き換えＴＬＢ０ＴＬＢ１プロセス２ページ10参照０３ 0:１ＰＦＮ：２ VPN：256 ２ 10 １０３＃２１００１０３１ 10 １使用リスト０１３２４

時刻７プロセス１１０５２＃１ 512 仮想ページ７読出しレジデントセット限界：FIFO ０１０２３０１１０４ 256 ２３仮想ページ０置き換え１１０７１１０１０５５１２ TLBに追加ＴＬＢ０ＴＬＢ１プロセス２ページ10参照０３ 0:１ＰＦＮ：２ VPN：256 ７１０７＃１時刻７２ 10 １０３＃２１００１０３１ 10 １使用リスト０１３２４

時刻７プロセス１１０５２＃１ 512 仮想7ページ７読出しレジデントセット限界：LRU ０１０２３１１０７４ 256 ２３１１３１１０１０５５１２比較 TLBに追加ＴＬＢ０ＴＬＢ１プロセス２ページ10参照０３ 0:１ＰＦＮ：２ VPN：256 ７１０７＃１２時刻７ 10 １０３＃２１００１０３１ 10 １使用リスト０１３２４

ページ置換えアルゴリズム：FIFO 参照仮想ページ番号ページフォールト：９回ページフォールト：１０回

ページ置換えアルゴリズム：FINUFO

包含関係ドノバン

TLB Miss とページウオークペナルティ：１５－３０サイクル M.J.Flynn:Computer　Architecture,Jones　＆　Bartlett,1995

仮想アドレス空間の共有と保護

4.３キャッシュ・メモリ 4.3.1基本原理　参照の局所性を利用 on demand メモリとの写像ブロック単位で写像：空間局所性、６４Ｂ程度セットアソシアティブ方式セット分割　　　　　セット数１：フルアソシアティブ方式　ロー数　　　　　ロー数１：ダイレクトマッピング(旧プロセッサ）

キャッシュメモリの容量　ブロックサイズ＊セット数＊ロー数キャッシュメモリの実効アクセス時間　　ＴＣ＝ＴＨ (1- β）＋ β（TH+ＴＬ１）=TH+ βＴＬ１　　　β：ミス率、ＴＬ１：メモリからの転送時間　　容量大→β小、ＴＨ増大容量：６４ｋＢ程度ブロックサイズ：空間局所性　　　　　　　　　　３２~６４Ｂ程度

６４B

4.3.2置換えアルゴリズム各セットでＬＲＵ（Least　Recently　Used） 4.3.3実記憶への書込み (1)ストアスルー（store through、write through）書込み時：メモリにも同時に書込み (2)ストアイン（store inまたはwrite back）　　　書込み時：メモリにはすぐには書かず、　　　　　　　　　　置換え時に格納

4.3.4仮想アドレスキャッシュと実アドレスキャッシュ・キャッシュディレクトリへのアドレスの与え方　　仮想アドレス：Virtually Indexed 　　実アドレス　 :Physically Indexed ・キャッシュディレクトリ内の情報　　仮想アドレス（ページ番号）：Virtually Tagged 　　実アドレス（ページフレーム番号）：Physically Tagged ・実アドレスキャッシュ：　P/P ・仮想アドレスキャッシュ：V/V,　V/P

(1)実アドレスキャッシュ仮想アドレス→ＴＬＢ→実アドレス→ キャッシュディレクトリ→データアレイ高速化：ページ境界とセット境界同一化　　仮想アドレス→ＴＬＢ→実アドレス→ 　　キャッシュディレクトリ→データアレイ高速化：ページ境界とセット境界同一化シノニム問題なしキャッシュコヒーレンス容易仮想ページ番号仮想アドレス実ページフレーム番号実アドレスセットアドレスキャッシュアドレスアドレス変換後確定

実アドレスキャッシュの高速化 P/P方式 1024個のページフレーム６４セット×１６ロウ Physically　Indexed　Physically　Tagged 境界を揃えるセットアドレス：仮想・実変換に無関係

(2)仮想アドレスキャッシュ（V/V方式）高速で，　　TLBを通常引く必要がない　　しかしシノニム問題が生じる

仮想アドレスキャッシュ① V/V方式 Virtually Indexed Virtually Tagged方式キャッシュヒット：TLBは引かない

XXX ○○○ シノニム問題仮想アドレスキャッシュＴＬＢ TLB 実アドレスキャッシュ

シノニム問題の回避　　　V/V方式　　　(a)共有空間を同一仮想アドレスに　　　　　設定（ソフト的）：セットアドレスを含むビット (ｂ)全キャッシュパージ法　　　　　プロセス切り替え時にキャッシュを無効化 (ｃ)逆変換バッファ法（ＲＴＢ）　　　V/P方式 (ｄ)仮想実アドレスの混合型

シノニムの回避（a），（ｂ）仮想アドレスキャッシュ無効化と書き戻し回避(a)：00とする（ｂ）リードミスＴＬＢ TLB ○○○ XXX ○○○ 仮想アドレスキャッシュ無効化と書き戻し回避(a)：00とする（ｂ）リードミスＴＬＢ TLB

シノニムの回避（ｃ）仮想ページＡ仮想ページＡｘｘｘ００００００１０ｘｘセット仮想ページＢ。。。１１００００１０ｘｘセット　ｘｘｘ００００００１０ｘｘセット仮想ページＢ。。。１１００００１０ｘｘセット仮想ページ番号を記憶仮想ページＢに設定

V/P方式仮想アドレスキャッシュページ実ページフレーム番号を記憶 TLBヒット：メモリからキャッシュへ転送 Virtually　Indexed Physically　Tagged 仮想アドレスキャッシュ

シノニムの回避（ｄ）仮想アドレスＡｘｘｘ００００００１０ｘｘ０１００仮想アドレスＢ。。。１０００００１０ｘｘセット１１仮想アドレスＡ　ｘｘｘ００　００００１０ｘｘ　　　　　　　　　　　　　０１仮想アドレスＢ　。。。１０　００００１０ｘｘ　　　　　　　　　　　　　１１００セットページ実ページ番号を記憶Ａ実行Ｂへ切替えＢ実行シノニムの回避（ｄ） V/P方式の利用

ソフトウェア管理のアドレス変換 TLBは必要ない？ V/V型仮想アドレスキャッシュ　　キャッシュヒット時：TLB参照の必要なしセカンドキャッシュ：数MB 　　ほとんどセカンドキャッシュでヒットセカンドキャッシュミスヒットのとき　　ページテーブルウオークをする　　　　OS起動あるいは　　　　ハードウェア支援 TLB：ARMで１７％電力消費

B.Jacob,T.Mudge: Uniprocessor　Virtual　Memory　without　TLBs,　IEEE　Trans　Computers,50,5,pp.482-499,2001

L2キャッシュミス：１０００命令で５回（０．５％） L2キャッシュミスのときのペナルティ：１０－４０サイクル　　１０００命令で５０－２００サイクル　　オーバヘッドCPI：０．０５－０．２ TLBを用いた場合と遜色がない

4.3.5高速化技法 (1)命令キャッシュとオペランドキャッシュの分離物理的に使用する場所が異なるキャッシュミスの時の性能への影響命令キャッシュには、書込み操作がない．分離型キャッシュの場合命令キャッシュ，データキャッシュミスヒット率：βＩS，βDS 実行命令数ＮＩ，内ミスヒット回数ＮＩＭデータ参照回数ＮＤ，内ミスヒット回数ＮＤＭｋ＝ＮＤ／ＮＩ：１命令での平均データアクセス回数ロード命令とストア命令の出現頻度０．３４

１命令を実行するのに必要とされるキャッシュに関係した実行時間ＴｓＮＩＴｓ＝ＴＨ＊Max（ＮＩ，ＮＤ）＋（ＮＩＭ＋ＮＤＭ）ＴＬより，Ｔｓ＝ＴＨ＋（βＩS＋ｋβDS）ＴＬ

統合型キャッシュの場合キャッシュメモリヒット時命令とデータアクセスで競合ＮＩの命令の実行でＮＩ＋ＮＤ個のキャッシュアクセス，優先度が低いＮＤ個は待たされ，２ＴＨ必要ミスヒット率：βｕ１命令を実行するのに必要とされるキャッシュに関係した実行時間ＴuはＮＩＴｕ＝ＴＨ＊ＮＩ＋ＴＨ＊ＮＤ＋（ＮＩＭ＋ＮＤＭ）ＴＬより，Ｔｕ＝ＴＨ＋ｋＴＨ＋（ＮＩ＋ＮＤ）／ＮＩ＊（ＮＩＭ＋ＮＤＭ）ＴＬ／（ＮＩ＋ＮＤ）＝ＴＨ＋ｋＴＨ＋（１＋ｋ）βｕＴＬ

６４B

分離型と統合型キャッシュの性能比較ＴＨ＝１サイクル，ＴＬ＝３０サイクル３２ＫＢ，３２ＫＢ分離型６４ＫＢ統合型命令パイプライン６４ＫＢ統合型命令パイプライン分離型キャッシュ：（０．００２２＋０．３４Ｘ０．０２８９）Ｘ３０＝０．３６統合型キャッシュ：０．３４＋（１＋０．３４）Ｘ０．００６７Ｘ３０＝０．６１大きい：数命令同時読み出しでカバー可能

(2)２階層キャッシュメモリ基本原理ＴＣ＝ＴＨ＋βＴＬ１＋βγＴL２ β＝０．０２，γ＝０．２，ＴＬ１／ＴＨ＝５，ＴL２／ＴＨ＝５０の場合ＴＣ＝１．３ＴＨ (3)キャッシュバイパスバッファ　　　キャッシュ内のアクセスバイトから転送

キャッシュメインメモリ 2ndキャッシュ１ｓｔキャッシュ β：ミス率転送時間TL T=TH＋ βTL=2TH β＝0.02，TH=１ns，TL＝50TH 転送時間TL１ γ：ミス率転送時間TL2 T=TH＋ βTL１＋β γTL2=1.3TH γ=0.2,TL1=5TH

Power4の記憶階層？ Pentium4の記憶階層 L1 Data ８KB レイテンシ２ L2 ２５６KB レイテンシ１８ latency 　　４１２？１６MB eDRAM外付け３４０ Pentium4の記憶階層 L1　Data　８KB　レイテンシ　２ L2　　　２５６KB　レイテンシ１８

IEEE Micro, March,2003　

(4)ノンブロッキングキャッシュ　　　　先行命令でキャッシュミスでも　　　　　後続命令どんどん実行　　　　パイプラインバブル減少　　　　データの先読みによる遅延時間　　　　　（レイテンシ）減少：コンパイラによる　　　　　キャッシュ制御ＶＳオンデマンド制御 (5)ストアバッファ　　　ストアスルーでメモリ書込みを待たないで　　　　先実行：置いてきぼり制御 (6)命令バッファ　　　命令キャッシュから数命令同時フェッチ

キャッシュミキャッシュミス Lｄ　R0　M(R1) キャッシュミキャッシュミス他の多数命令の実行 Lｄ　R0　M(R1) ADD　R2　R３　R0 ADD　R2　R３　R0 待ち R0にデータ到着

４．３．６キャッシュメモリの有効性１０２４ｘ１０２４の２次元配列AとベクトルXの積B Bi＝ΣｊAｊiXj 各要素データは８B キャッシュブロックのサイズは６４B （すなわち８要素の格納が可能）キャッシュ容量：１８KB

タイリング法単純なプログラム DO １０ I=1,1024 DO １０ J＝１，１０２４ B（Ｉ）＝Ａ（Ｉ，Ｊ）＊Ｘ（Ｊ）１０ＣＯＮＴＩＮＵＥ改良プログラムＤＯ１０Ｉ＝１，１０１７，８ＤＯ１０Ｋ＝１，４ＤＯ１０Ｊ＝２５６（Ｋ－１）＋１，２５６Ｋ B（Ｉ）＝Ｂ（Ｉ）＋Ａ（Ｉ，Ｊ）＊Ｘ（Ｊ） B（Ｉ＋１）＝Ｂ（Ｉ＋１）＋Ａ（Ｉ＋１，Ｊ）＊Ｘ（Ｊ）・・・・・・ B（Ｉ＋７）＝Ｂ（Ｉ＋７）＋Ａ（Ｉ＋７，Ｊ）＊Ｘ（Ｊ）タイリング法

４．６主記憶装置インターリーブ　　　　　ストアスルーの時：同時書込み可能で　　　　　　　　　　　　　　　　　高速化　　　　　ストアインの時：メモリバス幅が　　　　　　　　　　　　　　　　　太ければよい　　　　　　　　　　　　　　　ブロック単位の転送

スーパコンピュータ：１０２４バンク構成（ベクトルプロセッサ）演算器メモリ LatencyとThroughput バンク０バンク１ 0.1nsec/データのチャネル演算器バンク２メモリバンク３１０GFLOPS ０．１nsec/データ 0.1nsecX1024個転送 100nsec バンク1021 最初の１０２４個起動バンク1022 次の１０２４個起動その次の１０２４個起動バンク1023 各バンク：１００nsec/データ１００nsec メモリレイテンシ次の１０２４個転送開始最初の１０２４個転送開始

スキュードメモリ（直交メモリ化）