Development of Certified Program Translators to Verify Low-Level Language Programs Toshihiro YOSHINO (Yonezawa Lab, Univ. of Tokyo) <tossy-2@yl.is.s.u-tokyo.ac.jp>

Slides:

Advertisements

Similar presentations

２．５プログラムの構成要素（１）文字セット ① ASCII （ American Standard Code for Interchange ） JIS コードと同じ ② EBCDIC （ Extended Binary Coded Decimal for Information Code ） 1.

Advertisements

オブジェクト指向言語論知能情報学部新田直也. 講義概要  私の研究室： 13 号館 2 階 (13-206)  講義資料について :  参考図書 : 河西朝雄 : 「原理がわかるプログラムの法則」,

プログラミング言語論第10回（演習）情報工学科　木村昌臣　篠埜　功.

2006/10/26 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

コンパイラ 2011年10月17日

全体ミーティング (4/25) 村田雅之.

言語処理系（４）金子敬一.

データ構造とアルゴリズム第10回 mallocとfree

LMNtalからC言語への変換の設計と実装

オブジェクト指向言語論知能情報学部新田直也.

LMNtalからC言語への変換の設計と実装

プログラミング言語論第6回　型情報工学科　篠埜　功.

2012年度計算機システム演習　第4回白幡　晃一.

プログラミング言語論理工学部情報システム工学科新田直也.

プログラミング言語論理工学部情報システム工学科新田直也.

2007/1/18 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

情報科学１（G1）２０１６年度.

2006/10/19 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

条件式 (Conditional Expressions)

データ構造とアルゴリズム知能情報学部新田直也.

コンパイラ 2012年10月15日

2007/1/11 山下諒蔵佐藤春旗前田俊行大山恵弘佐藤秀明住井英二郎

ML 演習第 7 回新井淳也、中村宇佑、前田俊行 2011/05/31.

M2 吉野寿宏全体ミーティング 12/13 修士研究進捗報告 M2　吉野寿宏

プログラミング基礎ａ第８回プログラムの設計アルゴリズムとデータ構造

概要 Boxed Economy Simulation Platform（BESP）とその基本構造 BESPの設計・実装におけるポイント！

型付きアセンブリ言語を用いた安全なカーネル拡張

プログラミング言語入門手続き型言語としてのJava

言語プロセッサ2007 平成19年９月26日（水）（Ver.2 平成19年10月3日変更）

セキュリティ（３） 05A2013 大川内　斉.

最適化の方法中田育男著コンパイラの構成と最適化朝倉書店, 1999年第１１章.

プログラミング言語入門.

プログラミング演習I ２００３年5月7日（第4回）木村巌.

アルゴリズムとデータ構造補足資料5-1 「メモリとポインタ」

A Provably Sound TAL for Back-end Optimization について

依存型で型付けされた副作用のある関数のための型保存コンパイラ

計算機構成第3回データパス：計算をするところテキスト14‐19、29‐35

プログラミング基礎ａ第８回プログラムの設計アルゴリズムとデータ構造

第５章　計算とプログラム本章で説明すること・計算の概観と記述法・代表的な計算モデル・プログラムとプログラム言語.

情報とコンピュータ静岡大学工学部安藤和敏

先週の復習: CPU が働く仕組みコンピュータの構造 pp 制御装置＋演算装置＋レジスタ制御装置がなければ電卓と同様

　型推論３（MLの多相型）.

データ構造とアルゴリズム第11回リスト構造（１）

情報基礎Ⅱ （第１回）月曜４限担当：北川晃.

計算機プログラミングI 木曜日 1時限・5時限担当: 増原英彦第1回 2002年10月10日(木)

アルゴリズムとデータ構造1 2009年6月15日

情報処理Ⅱ 第７回 2004年11月16日（火）.

情報処理Ⅱ ２００５年１０月２８日（金）.

エイリアス関係を考慮した Javaプログラム用静的スライシングツール

情報処理Ⅱ ２００７年１２月３日（月）その１.

オブジェクト指向言語論第二回知能情報学部新田直也.

コンパイラ 2012年10月11日

アルゴリズムとデータ構造 2010年6月17日

プログラミング入門２第６回関数情報工学科　篠埜功.

PROGRAMMING IN HASKELL

オブジェクト指向言語論第一回知能情報学部新田直也.

プログラミング言語論第九回理工学部情報システム工学科新田直也.

情報数理Ⅱ 第10章　オートマトン平成28年12月21日.

2005年度データ構造とアルゴリズム第２回「C言語の復習：配列」

オブジェクト指向言語論第七回知能情報学部新田直也.

オブジェクト指向言語におけるセキュリティ解析アルゴリズムの提案と実現

プログラミング言語論第九回理工学部情報システム工学科新田直也.

オブジェクト指向言語論第七回知能情報学部新田直也.

情報処理Ⅱ ２００５年１１月２５日（金）.

POPL ミーティング 6/7 Inside ADL

オブジェクト指向言語論第三回知能情報学部新田直也.

情報処理Ⅱ 小テスト 2005年2月1日（火）.

１．２言語処理の諸観点（１）言語処理の利用分野

第1章文字の表示と計算 printfと演算子をやります.

オブジェクト指向言語論第六回知能情報学部新田直也.

Presentation transcript:

Development of Certified Program Translators to Verify Low-Level Language Programs Toshihiro YOSHINO (Yonezawa Lab, Univ. of Tokyo) <tossy-2@yl.is.s.u-tokyo.ac.jp>

研究の動機プログラム検証のための理論はあっても、実際に検証器を作るのには手間がかかる特に低級言語を相手にしようとする場合には顕著往々にしてad-hocに実装してしまうこともあり、コードの再利用を妨げる特に低級言語を相手にしようとする場合には顕著アーキテクチャ依存性が高く、システムの移植性が低下 ⇒ 検証器を作るたびにモデル化の必要もともとの言語の意味論が(λ計算やMLなどの高級言語に比べ)複雑 PPL2007 Poster

共通言語を使って解決方針: 検証対象のプログラムを共通言語に変換 → 変換されたプログラムに対して検査利点欠点方針: 検証対象のプログラムを共通言語に変換 → 変換されたプログラムに対して検査利点システムの移植性が向上する共通言語の意味論に対してのみ検証ロジックを設計すればよい変換部分を取り替えることで複数の入力言語に対応可能欠点検証のためのロジックに加え、変換器の正しさを保証してやる必要がある PPL2007 Poster

共通言語を使って解決検証器変換器検証結果検証ロジック共通言語の意味論共通言語に変換されたプログラム低級言語のプログラム Success /Fail 検証ロジック共通言語の意味論 PPL2007 Poster

変換器の「正しさ」とはプログラム変換の前後での意味論に対応がつかなくては、検証結果が信頼できない ⇒ 正しさの定義、またそれをどうやって保証するか、がこの研究における一番の課題対応がつけられれば、progress-preservationの形をした検証ロジックは正しく動くことを(informalに)証明 [Yoshino 2006] PPL2007 Poster

変換器の「正しさ」とは変換元のプログラム変換後のプログラムプログラム = 機械の状態集合上の関数主なターゲットは低級言語なので手続き型として仮定変換の正しさ = 入力・出力のプログラムに対して、変換前後2 つの言語の間に、状態の「対応」が整合的に構成できる状態 State State 変換元のプログラム変換後のプログラム状態’ State’ State’ PPL2007 Poster

Formal Definition PPL2007 Poster

共通言語の設計特定のアーキテクチャに依存しない低級言語に近いレベルの記述なるべくシンプルな言語構造種々の低級言語を記述するための言語なのでデータの幅が 32bit とか 64bit であるとかいう制限はできるだけ排除低級言語に近いレベルの記述 λ計算のように抽象度の高い記述は変換が手間レジスタ・メモリに対する操作を明示的に記述できる程度を狙うなるべくシンプルな言語構造基本となる命令数が多いと意味論が複雑化 PPL2007 Poster

共通言語の設計レジスタ・メモリなどを扱う手続き型言語意味論は conservative に定義 5 種類のコマンドの組合せで記述 nop, error, 代入, goto, if-then-else アセンブリ言語よりも、C などに近い記法中置演算子、カッコ付きの式 if 文による自由な条件分岐実行遷移をいじる命令は goto, if-then-else のみ意味論は conservative に定義実機との対応が自然につくように注意、だめならエラーに「行儀の悪い」プログラムは記述できずともよいポインタは加減算ができれば、配列や構造体を扱うには十分 PPL2007 Poster

共通言語: 構文定義 PPL2007 Poster

プログラム変換: 直観的には共通言語 x86 命令単位で変換 data: ... main: %ebx = &data; %eax = 0; goto &lp; lp: %eax = %eax + *[4](%ebx); %ebx = *[4](%ebx + 4); if %ebx == &null then goto &end else goto &lp; end: goto &end; 共通言語 data: ... main: movl $data, %ebx movl $0, %eax lp: addl 0(%ebx), %eax movl 4(%ebx), %ebx cmpl $0, %ebx je end jmp lp end: jmp end x86 ・出してみたら？命令単位で変換 PPL2007 Poster

プログラム変換のアルゴリズム低級言語の命令はコンテクストを持たない ⇒ 命令ごとに対応するコマンド列へ変換してやればよいレジスタの値、メモリの値以外によって挙動が変わることはない ⇒ 命令ごとに対応するコマンド列へ変換してやればよい命令種別ごとに変換ルールを記述変換の正しさについても、命令ごと(ルールごと)に調べてやればよい PPL2007 Poster

アーキテクチャ記述例 (IA-32、抜粋) #operand { eax = %eax; ax = %eax[0,2]; al = %eax[0,1]; ah = %eax[1,1]; ebx = %ebx; ... } mov(D, S) { D = S; add(D, S) { // calculate the result first D = D + S; // ZF calculation if D : int then if D == 0 then %_zf = 1 else %_zf = 0 else if (D - &null) : int then if (D - &null) == 0 then %_zf = 1 else %_zf = junk; ... } この画面で実際にマッピングを黒板で説明したほうがいいと思う PPL2007 Poster

実際のアーキテクチャとの対応付け Conservative Simulation を満たす状態の対応関係を(機械的に)構築できればよい全数検査は現実的ではないある程度の抽象化が必要整数と整数のみならず、ポインタと整数値の対応関係などを考える必要メモリブロックの検証のためにポインタをfat pointerにしているが、実機上では整数と区別されていないポインタとの対応関係の検証は毎回使いまわされると予想 PPL2007 Poster

二段階アプローチ値の種類を整数のみに制限した中間言語を用意変換元言語と中間言語のsimulationを証明共通言語からは(一部捨てるだけで)簡単に変換可能変換元言語と中間言語のsimulationを証明中間言語と共通言語のsimulationを証明低級言語　　(変換元) 共通言語中間言語 PPL2007 Poster

中間言語⇔共通言語演算は下記のように定義されており、対応関係を保存することは簡単に証明できる基本的には conditional by kind のみが問題ポインタの比較を conservative にやるため加減算以外の演算子について: PPL2007 Poster

中間言語⇔共通言語 (続き) アイデア: Symbolic Execution を行うポインタあり側で junk になる場合はさておき、そうならない場合に対応がつくことを証明 Simplify (自動定理証明器)などをバックエンドとして用いればできるのではと考えている共通言語から中間言語への変換は、基本的に conditional by kind を消して値を対応づけるだけでよい PPL2007 Poster

実機⇔中間言語実機の意味論をなんらかの方法で記述し、等価性を証明する ⇒ Coq などの証明支援系を使えないか？現在はこちらをメインで着手している中間言語の意味論を Coq のモジュールシステムを用いて実装してみた PPL2007 Poster

今回のデモ中間言語との間の対応関係の証明変換アルゴリズムと、検証器フレームワークの実装中間言語の意味論をライブラリとして用意 Coqのモジュール機構を用いて実装してみた簡単な仮想アーキテクチャを定義し、中間言語に変換後の意味論との対応づけを証明基礎の数論のところにいくつかAxiomが残っているが、上層はとりあえず証明できた変換アルゴリズムと、検証器フレームワークの実装 L3Cover Framework: http://www.yl.is.s.u-tokyo.ac.jp/~tossy-2/l3cover/ PPL2007 Poster

Future Work 数論の定理を充実させる必要実際の命令には単純なコマンド列にならないものもある特にmod 2nの系での演算に関して call命令は戻り先として次命令のアドレスを要求 Delayed branchは変換途中で後続命令の変換が必要 ⇒ 他言語の助けを借りる等すれば実装できるが… PPL2007 Poster