SMP/マルチコアに対応した型付きアセンブリ言語

Slides:

Advertisements

Similar presentations

G ゼミ 2010/5/14 渡辺健人. パフォーマンスの測定 CUDA Visual Profiler CUDA の SDK に標準でついているパフォーマンス測定用のツール使い方： exe ファイルのパスと作業ディレクトリ指定して実行するだけ注意点 : GPU のコード実行後にプログラム終了前に,

Advertisements

Region-based Memory Management in Cyclone について発表者 : 前田俊行.

プログラミング言語論第10回（演習）情報工学科　木村昌臣　篠埜　功.

【講座3】 MP T-Kernel入門（株）日立超LSIシステムズ豊山祐一

2006/10/26 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

メモリコンシステンシモデル memory consistency model

IaaS 仮想マシン(VM)をネットワーク経由で提供負荷に応じてVM数や性能を変更できるハードウェアの導入・管理・維持コストの削減

スレッドの同期と、スレッドの使用例スレッドの同期 Lockオブジェクト： lockオブジェクトの生成

全体ミーティング (4/25) 村田雅之.

2006/11/30 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

オペレーティングシステムJ/K 2004年10月7日

プログラミング言語論第6回　型情報工学科　篠埜　功.

ファイルシステムキャッシュを考慮した仮想マシン監視機構

小型デバイスからのデータアクセス情報処理系論第5回.

F11: Analysis III (このセッションは論文２本です)

2007/1/11 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

システムプログラミング第１１回　シグナル情報工学科　　篠埜　功.

ネストした仮想化を用いた VMの安全な帯域外リモート管理

ML 演習第 7 回新井淳也、中村宇佑、前田俊行 2011/05/31.

CONCURRENT PROGRAMMING

アスペクト指向プログラミングを用いたIDSオフロード

サスペンドした仮想マシンのオフラインアップデート

TAL : Typed Assembly Language について

型付きアセンブリ言語を用いた安全なカーネル拡張

細かい粒度でコードの再利用を可能とするメソッド内メソッドのJava言語への導入

Lazy Release Consistency

細かい粒度でコードの再利用を可能とするメソッド内メソッドとその効率の良い実装方法の提案

XenによるゲストOSの監視に基づくパケットフィルタリング

暗黙的に型付けされる構造体の Java言語への導入

セキュリティ（３） 05A2013 大川内　斉.

最適化の方法中田育男著コンパイラの構成と最適化朝倉書店, 1999年第１１章.

A Provably Sound TAL for Back-end Optimization について

クラウドにおけるIntel SGXを用いた VMの安全な監視機構

　型推論１（単相型） 2007.

依存型で型付けされた副作用のある関数のための型保存コンパイラ

計算機構成第3回データパス：計算をするところテキスト14‐19、29‐35

そろそろvolatileについて一言いっておくか

アスペクト指向言語のための独立性の高いパッケージシステム

Intel SGXを用いた仮想マシンの安全な監視機構

オペレーティングシステムJ/K 2004年11月15日2時限目

先週の復習: CPU が働く仕組みコンピュータの構造 pp 制御装置＋演算装置＋レジスタ制御装置がなければ電卓と同様

Cell/B.E.のSPE Isolationモードを用いた監視システム

JAVAバイトコードにおけるデータ依存解析手法の提案と実装

アルゴリズムとプログラミング (Algorithms and Programming)

プログラミング 3 2 次元配列.

実装について前田俊行.

全体ミーティング (5/23) 村田雅之.

同期処理のモジュール化を可能にするアスペクト指向言語

米澤研究室全体ミーティング 2010/07/07 M2 渡邊裕貴.

仮想マシンに対する高いサービス可用性を実現するパケットフィルタリング

コンピュータアーキテクチャ第 5 回.

VMリダイレクト攻撃を防ぐための安全なリモート管理機構

アルゴリズムとデータ構造1 2009年6月15日

6.5 セマフォセマフォ（semaphore）: 複数のタスク（もしくはスレッド）が「同期」または「相互排除」の制御のために取得（acquire）・リリース（release）できるカーネルオブジェクトの総称.

ネットワーク・プログラミングデバイスドライバと環境変数.

オペレーティングシステムJ/K (並行プロセスと並行プログラミング)

コンピュータアーキテクチャ第 5 回.

強制パススルー機構を用いた VMの安全な帯域外リモート管理

プログラムの一時停止時に将来の実行情報を提供するデバッガ

IPmigrate：複数ホストに分割されたVMのマイグレーション手法

アルゴリズムとデータ構造 2010年6月17日

複数ホストにまたがるVMの高速かつ柔軟な部分マイグレーション

全体ミーティング(6/3) 修士2年　飯塚　大輔.

システムプログラミング第１１回　シグナル情報工学科　　篠埜　功.

全体ミーティング(9/15) 村田雅之.

L4-Linux のメモリ管理における問題点とその解決策

全体ミーティング (9/12) 村田　雅之.

プログラミング演習II 2003年12月10日（第7回）木村巌.

オブジェクト指向言語論第六回知能情報学部新田直也.

Presentation transcript:

SMP/マルチコアに対応した型付きアセンブリ言語前田俊行東京大学大学院情報理工学系研究科

型付きアセンブリ言語 (TAL) とは「強く型付けされた」アセンブリ言語型検査により以下の安全性を保証できるメモリ安全性制御フロー安全性型が付いていること以外は普通のアセンブリ言語と変わらない Type-preserving compilation の分野で研究がはじまった[Morrisett et al. 1999]

TAL のフレームワークの概観: バイナリの生成型情報 TAL で書かれたソースプログラム TAL のアセンブラバイナリプログラム

TAL のフレームワークの概観: バイナリの検査安全型情報 TAL の型検査器バイナリプログラム危険

TALK: TAL for Kernel OS カーネルを書くために型システムを強化した TAL メモリ管理機構やスレッド管理機構そのものを記述可能従来の TAL では不可能だった外部のメモリ管理機構 (= GC) に依存していたため SMP/マルチコア環境や割込みにも対応している [前田,米澤 DSW2007,DSW2008]

TALK の特徴 Strong update を実現している

メモリ管理と strong update の関係メモリの再利用の例 int* の領域を int として再利用する int* reuse(int** o) { int* p = (int*)o; *p = 42; return p; }

メモリ管理と strong update の関係メモリの再利用の例 int* の領域を int として再利用する型 int** int* reuse(int** o) { int* p = (int*)o; *p = 42; return p; } 型 int* このメモリを再利用する型 int

メモリ管理と strong update の関係メモリの再利用の例 int* の領域を int として再利用する型 int* int* reuse(int** o) { int* p = (int*)o; *p = 42; return p; } 型 42 int Strong update 型 int

メモリ管理と strong update の関係メモリの再利用の例 int* の領域を int として再利用する型 int* int* reuse(int** o) { int* p = (int*)o; *p = 42; return p; } 型 42 int Strong update 型ポインタ o が他の場所で使われていないことは型システムで保証する int

SMP/マルチコア環境におけるメモリ管理と strong update の関係難しいところ複数スレッド間でのポインタのエイリアス関係を追跡しなければだめ複数スレッドに関する情報が型に含まれていない int* reuse(int** o) { int* p = (int*)o; *p = 42; return p; } 危険!!! : 他のスレッドがまだポインタ o を使っているかも

SMP/マルチコア環境において安全な strong update を実現する従来の TALK の型付け手法メモリの型を 2 種類に分ける: ローカルメモリ 1つのスレッドからしかアクセスされないメモリ共有メモリ複数スレッド間で共有されるメモリローカルメモリローカルメモリローカルメモリスレッドスレッドスレッド共有メモリ

SMP/マルチコア環境において安全な strong update を実現する従来の TALK の型付け手法他のスレッドはアクセスできないので共有メモリには (基本的には) strong update を許さないただし、条件付きで許すローカルメモリローカルメモリローカルメモリスレッドスレッドスレッド共有メモリ

共有メモリに対する strong update を許す条件共有メモリの型が実際の命令実行の前後 (右図のマーク) で変わらないこと Strong update は 1 CPU命令 + pseudo 命令の間 (右図のマークの間) なら実行できる Pseudo 命令 = 型のみを操作する、実行時に影響のない命令こうすると他のスレッドからは型が不変であるかのように「見える」 CPU 命令 CPU 命令 Pseudo 命令 CPU 命令 Pseudo 命令 CPU 命令 CPU 命令 CPU 命令命令実行の流れ

ロックの獲得の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock …

ロックの獲得の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … アドレス p: (0, q) 共有メモリ q: data スレッドローカルメモリ

ロックの獲得の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … アドレス p: (0, q) 共有メモリスレッド q: data ローカルメモリ

ロックの獲得の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … アドレス p: (1, q) 共有メモリスレッド q: data ローカルメモリ

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} (r1 : p, r2 : ??)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} (r1 : p, r2 : 1)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  (i, q)} [q  data if [i == 0]] (r1 : p, r2 : 1)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  (i, q)} [q  data if [i == 0]] (r1 : p, r2 : 1) Strong update: 次の次のCPU命令までに型を元に戻さなくてはならない

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  (1, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data if [i == 0]] (r1 : p, r2 : i) 型が元に戻ったのでOK

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data] (r1 : p, r2 : i)

ロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 xchg [r1], r2 pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data] (r1 : p, r2 : i) ロックで保護されていたメモリ領域 q を共有メモリから取り出せた

ここまでの型付け手法の問題点 SMP/マルチコア環境における「メモリコンシステンシモデル」を考慮していない「緩い」メモリコンシステンシの共有メモリ上ではメモリ安全性が破られる可能性がある

「緩い」メモリコンシステンシとはあるスレッド (CPU) で実行されたメモリ操作が他のスレッド (CPU) から観測可能となる順序が元のメモリ操作の順序と異なるようなメモリコンシステンシのこと

「緩い」メモリコンシステンシの例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得る x: y: アドレス x: 共有メモリの初期状態 y: Thread1: st [x]  1 st [y]  1 Thread2: ld r1  [y] ld r2  [x]

「緩い」メモリコンシステンシの例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得る x: y: アドレスこの 2 つの st 命令が他のスレッドから「見える」順番が入れ替わるかも x: この 2 つの ld 命令が他のスレッドから「見える」順番が入れ替わるかも y: Thread1: st [x]  1 st [y]  1 Thread2: ld r1  [y] ld r2  [x]

他のスレッドから「見える」順番が入れ替わるかも「緩い」メモリコンシステンシの例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得るアドレスこの 2 つの st 命令が他のスレッドから「見える」順番が入れ替わるかも x: y: Thread1: st [x]  1 st [y]  1 Thread2: ld r1  [y] ld r2  [x] 4 2 1 3

他のスレッドから「見える」順番が入れ替わるかも「緩い」メモリコンシステンシの例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得るアドレス x: この 2 つの ld 命令が他のスレッドから「見える」順番が入れ替わるかも y: Thread1: st [x]  1 st [y]  1 Thread2: ld r1  [y] ld r2  [x] 2 4 3 1

「緩い」メモリコンシステンシ上でメモリ操作の「見え方」を制御する方法今日の多くの CPU は以下の 2 つの機能を提供するアトミック命令実行機能メモリ操作反映順序制御機能

アトミック命令実行機能命令の行うメモリ操作の結果が他のスレッドから「全て見えない」か「全て見える」かのどちらかになる中途半端なメモリ状態が他のスレッドから見えなくなる

メモリ操作反映順序制御機能 Acquire メモリ操作 Release 操作この操作より後のどのメモリ操作よりも先に他のスレッドから観測可能となる操作 Release 操作この操作より前のどのメモリ操作よりも後に他のスレッドから観測可能となる操作

メモリ操作反映順序制御機能の例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得ない x: y: アドレス x: 共有メモリの初期状態 y: Thread1: st [x]  1 release st [y]  1 Thread2: ld r1  [y] acquire ld r2  [x]

メモリ操作反映順序制御機能の例以下の 2 つのスレッドの実行結果が「r1 = 1 かつ r2 = 0」となり得ない x: y: アドレス x: 共有メモリの初期状態 y: Thread1: st [x]  1 release st [y]  1 Thread2: ld r1  [y] acquire ld r2  [x] 必ず x より後に y に書き込まれるように「見える」必ず x より前に y が読み込まれるように「見える」

「緩い」メモリコンシステンシに対応するための型付け手法以下の 2 つの制約を型システムで検査する共有メモリに対するメモリ操作には常に「アトミック命令実行機能」を用いること共有メモリとローカルメモリの間でメモリ領域を移動する場合は「メモリ操作反映順序制御機能」を用いること共有メモリ  ローカルメモリ : acquire ローカルメモリ  共有メモリ : release

「緩い」メモリコンシステンシに対応したロックの獲得の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock …

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} (r1 : p, r2 : ??)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} (r1 : p, r2 : 1)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (i, q)} [q  data if [i == 0]] (r1 : p, r2 : 1)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (i, q)} [q  data if [i == 0]] (r1 : p, r2 : 1) まだ acquire していないのでアドレス q はアクセス不可

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (1, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (1, q)} [q  data if [i == 0]] (r1 : p, r2 : i) アトミックにメモリ操作しているのでOK

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (1, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  (1, q)} [q  data if [i == 0]] (r1 : p, r2 : i) acquire 操作の結果アドレス q にアクセス可能になった

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data if [i == 0]] (r1 : p, r2 : i)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data] (r1 : p, r2 : i)

「緩い」メモリコンシステンシに対応したロックの獲得の型検査の例 {p∃i.{qdata if [i==0]}. (i, q)} (r1 : p) lock: mov r2  1 unpack r1 atomic xchg [r1], r2 acquire pack r1 bne r2, 0, lock … 型検査器の状態 {p  ∃i.….(i, q)} [q  data] (r1 : p, r2 : i) 既に acquire 済みなのでアドレス q はアクセス可

関連研究マルチスレッドに対応した型付きアセンブリ言語 [Vasconcelos et al. 2006] 同期機構やスレッド機構そのものを記述することはできない Lock や unlock 、スレッド機構はプリミティブとして提供されているその他、型でロックの整合性を保証する研究[Flanagan et al. 1999, 2007, Iwama et al. 2002, Grossman 2003, etc.] レースコンディションやデッドロック等を防ぐことを主な目的としている一方我々の手法はメモリ安全性等のみを目的としている

関連研究「緩い」メモリコンシステンシモデルに関する検証 SMP/マルチコア環境におけるプログラム検証 [Ghughal et al. 2000, Chatterjee et al. 2002] 「緩い」メモリコンシステンシの「実装」の検証 [Burckhardt et al. 2008] TSO 上のプログラムが SC を満たすことをチェックする [Boudol et al. 2009, Atig et al. 2010] 「緩い」メモリコンシステンシの共有メモリを持つシステムの操作的意味論を定義してプログラム検証に使う SMP/マルチコア環境におけるプログラム検証 [Dinsdale-Young et al. 2010] 共有メモリに対する不変条件を扱えるように separation logic を拡張しているただし「緩い」メモリコンシステンシモデルを考慮していない

まとめ SMPやマルチコア環境に対応した型付きアセンブリ言語を提案したロック等の同期機構そのものを記述できる複数スレッド間で共有されるメモリに対しては strong update を 1CPU命令 + pseudo命令のみで許可することで実現した「緩い」メモリコンシステンシモデルにもとづく共有メモリのもとでもメモリ安全性を保証できる型付けによって以下の 2 つの制約を検査する共有メモリに対する操作は「アトミック命令実行機能」を用いること共有メモリとローカルメモリの間でメモリ領域を移動するときには「メモリ操作反映順序制御機能」を用いること共有メモリ  ローカルメモリ: acquire ローカルメモリ  共有メモリ: release