C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク

C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク
栗田洋輔　千葉滋東京工業大学

従来のJITコンパイラの開発と問題点本格的なJITコンパイラプラットフォーム依存の中間表現を作成し、それを機械語に変換移植性の問題
マシンごとにプラットフォーム依存の中間表現を作成実装の容易性の問題高い開発スキルが必要バイトコードから中間表現への変換中間表現から機械語への変換バイトコード機械語プラットフォーム依存の中間表現

本研究の目的 JIT コンパイラ作成を容易にするフレームワーク移植性が高い短いコンパイル時間でそこそこの品質のコードを生成実装の容易性
実行速度コンパイル時間ネイティブコンパイラ △ × ◎ インタープリタ従来のJITコンパイラ ○ 本フレームワークを用いて開発するJITコンパイラ

そこそこの最適化本質的なオーバーヘッドを除去することで高速化を行う本質的なオーバーヘッド
広い範囲のインタープリターに適用できる汎用的な手法本質的なオーバーヘッドバイトコードインタープリター次の命令をフェッチしてデコードするコストバイトコードのオペランドをメモリからロードするコスト抽象構文木のインタープリター抽象構文木を巡回してノードをデコードするコスト

命令をフェッチ・デコードするオーバーヘッド (1/2)
命令ポインタ(ip)のインクリメントとメモリからのフェッチインタープリタートレース char *ip = code – 1; for (;;) { char* bcode = *++ip; switch (bcode) case PUSH_CONST: *++sp = (int)*++ip; break; case ADD: --sp; *sp += sp[1]; /* other cases …*/ } フェッチデコード本体 bcode = *++ip; PUSH_CONST 2 3 ADD バイトコード switch (bcode) ip *++sp = (int)*++ip; ip ip フェッチデコード本体 bcode = *++ip; ip switch (bcode) ip *++sp = (int)*++ip; フェッチデコード本体 bcode = *++ip; switch (bcode) --sp; *sp += sp[1];

命令をフェッチ・デコードするオーバーヘッド (2/2)
バイトコードのデコード switchによる条件分岐で実装インタープリタートレース char *ip = code – 1; for (;;) { char* bcode = *++ip; switch (bcode) case PUSH_CONST: *++sp = (int)*++ip; break; case ADD: --sp; *sp += sp[1]; /* other cases …*/ } フェッチデコード本体 bcode = *++ip; PUSH_CONST 2 3 ADD バイトコード switch (bcode) *++sp = (int)*++ip; フェッチデコード本体 bcode = *++ip; switch (bcode) *++sp = (int)*++ip; フェッチデコード本体 bcode = *++ip; switch (bcode) --sp; *sp += sp[1];

命令をフェッチ・デコードするオーバーヘッドの除去
高速化を達成フェッチ・デコード部分を削除本体部分のみを並べる命令ポインタの指すアドレスが不正フェッチデコード本体 bcode = *++ip; *++sp = (int)*++ip; bcode = *++ip; *++sp = (int)*++ip; switch (bcode) *++sp = (int)*++ip; フェッチデコード本体 switch (bcode) *++sp = (int)*++ip; --sp; *sp += sp[1]; フェッチデコード本体 switch (bcode) --sp; *sp += sp[1];

バイトコードのオペランドをメモリからロードするコストの削減
オペランドの値が既知の場合には不必要フェッチデコード本体 bcode = *++ip; *++sp = (int)*++ip; bcode = *++ip; *++sp = (int)*++ip; switch (bcode) *++sp = (int)*++ip; *++sp = 2；フェッチデコード本体 *++sp = 3； switch (bcode) *++sp = (int)*++ip; --sp; *sp += sp[1]; --sp; *sp += sp[1]; フェッチデコード本体 switch (bcode) --sp; *sp += sp[1];

JIT コンパイラ・フレームワークの提案プラットフォーム独立な中間表現テンプレート中間表現から機械語への変換はフレームワークが担当
高い移植性を実現（フレームワーク自体の移植は必要）テンプレート中間表現の各ノードに対応する機械語のひな形中間表現のセマンティクスを与える JITコンパイラの作成者が実装テンプレートバイトコード機械語プラットフォーム独立な中間表現

テンプレートの書き方インタープリターの主ループそのもの記述は容易一部の命令は、テンプレート用に書き換えが必要
命令ポインタ (IP) を使っている場合生成される機械語に IP は含められない IP でオペランド（即値）を取得する HOLEマクロを利用 gccインラインアセンブリに展開機械語生成時に即値を挿入 IP で分岐先を決定する分岐命令にはテンプレート不要テンプレート char *ip = code – 1; for (;;) { char* bcode = *++ip; switch (bcode) case ADD: --sp; *sp += sp[1]; break; case PUSH_CONST: *++sp = (int)*++ip; case TMPL_PUSH_CONST: HOLE(hole1, int_val); *++sp = int_val; } case TMPL_PUSH_CONST: HOLE(hole1, int_val); *++sp = int_val; break;

プラットフォーム独立な中間表現各ノードバイトコード命令（あるいは式）に対応属性中間表現への変換は容易
テンプレートのどの部分を使って機械語を生成するか HOLE に挿入する即値の値中間表現抽象構文木バイトコード PLUS label: TMPL_PUSH holes: {hole1:=2} second third PUSH 2 NUMBER: 2 NUMBER: 3 PUSH 3 label: TMPL_PUSH holes: {hole1:=3} ADD 中間表現 label: PLUS label: TMPL_ADD holes: NULL label: NUMBER holes: {hole1:=2} label: NUMBER holes: {hole1:=3}

中間表現への変換は容易インタープリタの制御構造を流用可能 appendCmpnt addHoleInfo
を作るコードインタープリタの制御構造を流用可能 appendCmpnt BlockCmpntをリストの末尾に追加 addHoleInfo Holeに埋め込む値を設定 char *ip = code – 1; for (;;) { char* bcode = *++ip; switch (bcode) case ADD: cmpnt = appendCmpnt(cmpnt, ip v_ADD); break; case PUSH_CONST: appendCmpnt(cmpnt, ip, v_TMPL_PUSH_CONST); addHoleInfo(cmpnt, ip, v_push_const_hole, *((int *)(++ip)) ); } 中間表現 label: TMPL_PUSH_CONST holes: {push_const_hole := 2} holes: {push_const_hole := 3} label: ADD holes: NULL

フレームワークによるコード生成入力：中間表現、出力：機械語機械語生成の流れコンパイル済みテンプレートの逆アセンブル情報を利用する
１．中間表現で指定されたコンパイル済みテンプレートを、最後のjmp命令やret命令を除きコピー２. 相対アドレスを用いた部分をコードが移動した分だけずらす３. 中間表現で指定された即値命令に指定された即値を埋め込む４. バイトコードの分岐命令は機械語の分岐命令に変換中間表現コンパイル済みテンプレート機械語 label: TMPL_PUSH holes: {hole1 := 2} 参照コピー TMPL_PUSH movl $1234, %eax … movl $2, %eax … hole1: movl $1234, %eax … label: TMPL_PUSH holes: {hole1 := 3} movl $1234, %eax … movl $3, %eax … … TMPL_ADD label: TMPL_ADD holes: NULL …

バイトコードの分岐命令の処理分岐先バイトコードのアドレスが入った中間表現を作る機械語の分岐命令に変換
バイトコードのアドレスを機械語のアドレスへフレームワークが変換バイトコード unsigned char code[] = { …, GOTO, -0x100, …}; 中間表現 label: … バイトコード番地: 0x0200 機械語 … 0x label: … バイトコード番地: 0x0204 … 0x 中略中略 label: NULL バイトコード番地: 0x0300 type: jump ジャンプオフセット: -0x0100 jmp 0x 0x

中間表現での最適化中間表現のノードの並べ替え複数ノードを最適化された１ノードへ置換例定数の畳み込み中間表現 (最適化前)
例　定数の畳み込み中間表現 (最適化前) label: TMPL_PUSH_CONST holes: {push_const_hole => 2} holes: {push_const_hole => 3} label: ADD holes: NULL 中間表現 (最適化後) label: TMPL_PUSH_CONST holes: {push_const_hole => 5} ・中間表現の範囲内で任意の最適化アルゴリズムを組み込み可能・ユーザーが望むバイトコードの最適化機能をJITコンパイラに追加できる　・中間表現のオープンな仕様・やり方　・　。。。・例：定数の畳み込み

抽象構文木インタープリターの場合抽象構文木を直接解釈するインタープリター switch文がオーバーヘッド eval 関数が再帰呼び出し
バイトコードインタープリターと同様 eval 関数が再帰呼び出しインタープリター int eval(List* expr) { switch (testElementType(expr)) { /* ... */ case PLUS : return eval(getSecond(expr)) + eval(getThird(expr)); case NUMBER : return getIntegerElement(expr); }} 抽象構文木 PLUS second third NUMBER: 2 NUMBER: 3

入れ子の関数呼び出しの中間表現中間表現を木構造に入れ子で呼ばれる関数を表すノードを木構造の子ノードに抽象構文木 PLUS
second third NUMBER: 2 NUMBER: 3 中間表現 label: PLUS label: NUMBER holes: {hole1 := 2} label: NUMBER holes: {hole1 := 3}

入れ子の関数呼び出しのテンプレート引数なしのvoid関数がテンプレート LABEL マクロ値の受け渡しはグローバル変数で
テンプレートの内部に他のテンプレートを挿入可能中間表現テンプレート PLUS PLUS_label1 PLUS_label1 void code_PLUS() { LABEL(PLUS_section); sp--; *sp = sp[1]; } LABEL(PLUS_label1); NUMBER 2 NUMBER 3 機械語 void code_PLUS() { void code_NUMBER() { int ret_val; HOLE(hole1, ret_val); *++sp = ret_val; } *++sp = 2; *++sp = 3; sp--; *sp = sp[1]; }

フレームワークのマシン非依存性 JITコンパイラの作成者フレームワーク自体マシンアーキテクチャを意識しない
中間表現はプラットフォーム独立フレームワーク自体マシンアーキテクチャ固有の実装コンパイル済みテンプレートの機械語の解析インラインアセンブリに展開されるマクロ即値命令に定数を埋め込む方法機械語の分岐命令相対アドレスの調整 gccが必要 gccインラインアセンブリを使用

予備的な実験ディスパッチにswitchを用いた抽象構文木インタープリター Intel Xeon CPU 3.06GHz x 2
memory 2GB linux gcc 4.1.1 glibc 2.4

関連研究 Cコンパイラが生成した機械語を利用する研究 ErtlらのJITコンパイラの移植に関する研究 [Ertl 04]
命令ポインタを除去して高速化するところが本研究に類似インタープリタを書き換えないため、バイトコードの即値命令を機械語の即値命令に書き換えられない場合がある本研究はフレームワークおよびそれが解釈する中間表現を提供している DyC [Grant 00] 伝統的なMultiflow Compilerをベースにしている移植性に焦点が当てられていない Tempo [Noel 98] ランタイムコンパイラをフロントエンドからバックエンドまで提供ネイティブコードの生成が自動化されているため、バイトコード命令レベルの最適化を行えない

まとめ JITコンパイラを作成するフレームワークテンプレートが中間表現にセマンティクスを与える高い移植性そこそこの品質のコードを生成
プラットフォーム独立なコードを書くだけそこそこの品質のコードを生成オーバーヘッドを除去命令のフェッチ・デコードオペランドのロード実装が容易インタープリタの実装を流用可能テンプレートが中間表現にセマンティクスを与える置き換えで独自の最適化が可能

終わりご清聴ありがとうございました

C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク

Similar presentations

Presentation on theme: "C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク

Similar presentations

Presentation on theme: "C言語を用いたマシン非依存な JITコンパイラ作成フレームワーク"— Presentation transcript:

Similar presentations

About project

フィードバック