Presentation is loading. Please wait.

Presentation is loading. Please wait.

言語プロセッサ2015 Language Processors 2015

Similar presentations


Presentation on theme: "言語プロセッサ2015 Language Processors 2015"— Presentation transcript:

1 言語プロセッサ2015 Language Processors 2015
平成27年9月28日(月)~ 平成28年1月20日(木) 東京工科大学 コンピュータサイエンス学部 亀田弘之 url: kameken.clique.jp/Lectures/Lectures2015/Compiler2015/

2 まずはイントロから… なぜ言語プロセッサを学ぶのか? (Why do we study a course 言語プロセッサ ?)
Copyright© School of Computer Science, Tokyo University of Technology

3 Copyright© 2015 School of Computer Science, Tokyo University of Technology

4 (参考)これからはIoTの時代 IoT Japan 2014 (10月15日~17日開催) IoTの概要図 (出典) Copyright© School of Computer Science, Tokyo University of Technology

5 情報システム Copyright© School of Computer Science, Tokyo University of Technology

6 Copyright© 2015 School of Computer Science, Tokyo University of Technology

7 複雑だなぁ セキュリティ ネットワーク クラウドコンピューティング モバイル
Copyright© School of Computer Science, Tokyo University of Technology

8 Divide and Conquer (困難は分割し、しかる後に統合せよ!)
Copyright© School of Computer Science, Tokyo University of Technology

9 何が基本なのかなぁ? Copyright© School of Computer Science, Tokyo University of Technology

10 ディスプレイ 本体 キーボード Copyright© School of Computer Science, Tokyo University of Technology

11 出力 (Output) 処理 入力 (Input)
Copyright© School of Computer Science, Tokyo University of Technology

12 本体内部が大切! Copyright© School of Computer Science, Tokyo University of Technology

13

14 Copyright© 2015 School of Computer Science, Tokyo University of Technology

15 コンピュータの階層化モデル Examples Application Software Operating System
Instr. Set Architecture Micro Architecture Logic Module Digital Circuit Analog Circuit Devices (elements) Physics (Electron etc.) Program Device Driver Instruction set & Register Data Bus, Controller Adder, Register AND Gate, OR Gate Amplifier, Filter Diode, Transistor Electron, Photon Copyright© School of Computer Science, Tokyo University of Technology

16 Copyright© 2015 School of Computer Science, Tokyo University of Technology

17 Copyright© 2015 School of Computer Science, Tokyo University of Technology

18 Copyright© 2015 School of Computer Science, Tokyo University of Technology

19 ? 高水準言語 ー> 論理回路 main( ){ int a; a = 1; printf(“%d”,a); } 高 水 準 言 語
高水準言語 ー> 論理回路 main( ){ int a; a = 1; printf(“%d”,a); } ? 高 水 準 言 語 論 理 回 路 Copyright© School of Computer Science, Tokyo University of Technology

20 論理回路 Copyright© School of Computer Science, Tokyo University of Technology

21 言語プロセッサとは 高水準言語によるプログラム (処理手順の記述,命令群) -> 論理回路制御指令群 (注)・命令:command
  (処理手順の記述,命令群)   -> 論理回路制御指令群 (注)・命令:command    ・指令:instruction Copyright© School of Computer Science, Tokyo University of Technology

22 言語プロセッサとは 高水準言語によるプログラム (処理手順の記述,命令群) -> 論理回路制御指令群 (注)・命令:command
  (処理手順の記述,命令群)   -> 論理回路制御指令群 (注)・命令:command    ・指令:instruction Copyright© School of Computer Science, Tokyo University of Technology

23 C言語・Java言語 アセンブリ言語 Copyright© School of Computer Science, Tokyo University of Technology

24 main(){ } Copyright© School of Computer Science, Tokyo University of Technology

25 .def ___main; .scl 2; .type 32; .endef .text .globl _main
$ cat p01.s .file "p01.c" .def ___main; scl 2; type 32; .endef .text .globl _main .def _main; .scl 2; type 32; .endef _main: pushl %ebp movl %esp, %ebp subl $8, %esp andl $-16, %esp movl $0, %eax movl %eax, -4(%ebp) movl -4(%ebp), %eax call __alloca call ___main leave ret Copyright© School of Computer Science, Tokyo University of Technology

26 main(){ int a; a = 20; a = a + 30; a = 100 - a; a = a*7; }
Copyright© School of Computer Science, Tokyo University of Technology

27 .def ___main; .scl 2; .type 32; .endef .text .globl _main
$ cat p01.s .file "p01.c" .def ___main; scl 2; type 32; .endef .text .globl _main .def _main; .scl 2; type 32; .endef _main: pushl %ebp movl %esp, %ebp subl $8, %esp andl $-16, %esp movl $0, %eax movl %eax, -8(%ebp) movl -8(%ebp), %eax call __alloca call ___main movl $20, -4(%ebp) leal -4(%ebp), %eax addl $30, (%eax) movl $100, %eax subl -4(%ebp), %eax movl %eax, -4(%ebp) movl -4(%ebp), %edx movl %edx, %eax sall $3, %eax subl %edx, %eax leave ret Copyright© School of Computer Science, Tokyo University of Technology

28 $ gcc -S filename.c $ ls $ cat filename.s
Copyright© School of Computer Science, Tokyo University of Technology

29 コンパイラの処理工程概要 ソース言語 読み込み 字句解析 構文解析 中間語生成 コード生成 目的言語
Copyright© School of Computer Science, Tokyo University of Technology

30 言語プロセッサの種類 インタープリタ (interpreter) コンパイラ (compiler)
Copyright© School of Computer Science, Tokyo University of Technology

31 コンパイラとは Compilerとは、high level languageで記述されたプログラム(例えば、C言語のプログラム)を、機械向き言語(例えば、機械語)のプログラムに変換する(翻訳する)ためのプログラムのこと。 Copyright© School of Computer Science, Tokyo University of Technology

32 数式の例 A = B*3.14 + C/A Area = 2*3.14*R*R
Copyright© School of Computer Science, Tokyo University of Technology

33 数式の解析 kingaku = teika + teika * shouhizei
Copyright© School of Computer Science, Tokyo University of Technology

34 数式の解析 読み込み(文字列として) “kingaku = teika + teika * shouhizei”
要素(token)の切り出し “kingaku”, “=“, “teika”, “+”, “*”, “shouhizei” 要素の相互関係の分析 kingaku teika + shouhizei * Copyright© School of Computer Science, Tokyo University of Technology

35 分析 合成 ソース言語 読み込み 字句解析 構文解析 中間語生成 コード生成 目的言語
Copyright© School of Computer Science, Tokyo University of Technology

36 数式の解析 読み込み(文字列として) “kingaku = teika + teika * shouhizei”
要素(token)の切り出し “kingaku”, “=“, “teika”, “+”, “*”, “shouhizei” 要素の相互関係の分析 kingaku teika + shouhizei * Copyright© School of Computer Science, Tokyo University of Technology

37 数式の解析 読み込み(文字列として) “kingaku = teika + teika * shouhizei”
要素(token)の切り出し “kingaku”, “=“, “teika”, “+”, “*”, “shouhizei” 要素の相互関係の分析 kingaku teika + shouhizei * Copyright© School of Computer Science, Tokyo University of Technology

38 数式の解析 読み込み(文字列として) “kingaku = teika + teika * shouhizei”
要素(token)の切り出し “kingaku”, “=“, “teika”, “+”, “*”, “shouhizei” 要素の相互関係の分析 kingaku teika + shouhizei * Copyright© School of Computer Science, Tokyo University of Technology

39 数式の解析 読み込み(文字列として) 読み込み “kingaku = teika + teika * shouhizei”
要素(token)の切り出し  字句解析 “kingaku”, “=“, “teika”, “+”, “*”, “shouhizei” 要素の相互関係の分析 構文解析 kingaku teika + shouhizei * Copyright© School of Computer Science, Tokyo University of Technology

40 数式の解析 読み込み 字句解析 構文解析 ファイルからの入力技法 有限オートマトンの理論 正規文法 正規表現 スタックオートマトン理論
文脈自由文法 Copyright© School of Computer Science, Tokyo University of Technology

41 学んで得られるもの 言語理論とオートマトン プログラミング技法 抽象的・論理的な思考への慣れ ソフトウェア分野における基本的概念
正規表現 etc. プログラミング言語へのより深い理解 プログラミング技法 プログラミング力(知識)アップ 洗練されたアルゴリズムの理解  などなど Copyright© School of Computer Science, Tokyo University of Technology

42 言語プロセッサ関連は、コンピュータサイエンスの英知が集積されている!
この授業を取った人は先見の明がある! Copyright© School of Computer Science, Tokyo University of Technology

43 授業概要 人間はより複雑で高度な処理手順(プログラム)を記述するために、C言語やJava言語などの高級言語を考え出したが、それらの言語で記述されるプログラムは実際には、より低水準な機械語に翻訳し直さなければコンピュータは直接理解し実行することはできない。このような翻訳処理を行うプログラムは、一般に“言語プロセッサ”と呼ばれている。 本講義では言語プロセッサのうち特にコンパイラを取り上げ、これに関する原理と設計方法について講義する。また部分的ではあるが実際に簡易コンパイラを作成する。このことによって、コンパイラについて深い理解を得るとともに、自力でコンパイラを設計するための基礎的な設計・プログラミング技術をもあわせて修得することを目指す。 具体的な学習目標は、1) 言語プロセッサの処理の流れ、2)語彙解析の役割と仕組みそれぞれを自分の言葉で説明できること、3)正規表現を利用した語彙解析プログラムの動作を理解できること、4)構文解析の役割と仕組みを理解できること、5)Flex、Bison、Antlrを使った言語プロセッサ作成手順を説明できること、である。学生諸君が本授業を履修することにより、プログラミング言語に関する造詣を深めることを期待する。 Copyright© School of Computer Science, Tokyo University of Technology

44 到達目標 コンパイラやインタプリターの処理の流れを理解し、説明できる。 字句解析の原理、基本的処理を理解する。
構文解析の原理、基本的処理を理解する。 中間言語表現を理解する。 最適化処理の概要と処理内容を知り、説明できる。 Flex,Bisonを用いて簡単な言語処理プロセッサを自作できる。 AntlrWorksなど、他のコンパーラーコンパーラーの存在について知る。 Copyright© School of Computer Science, Tokyo University of Technology

45 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
コード生成の概要 原始プログラム 目的コード 字句解析 構文解析 意味解析 中間コード生成 コード生成 最適化 中間コード 中間コード 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

46 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
もう一度具体例で確認 program daikei(input,output); var abc,xyz,t:integer; begin write('abc xyz = '); read(abc,xyz); abc := xyz + abc * 123; writeln('result = ',abc) end. 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

47 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
abc := xyz + abc * 123; (読み込み) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

48 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
abc := xyz + abc *123; トークンへの分解(字句解析) ( 変数1, abc ) ( 代入記号, := ) ( 変数2, xyz ) ( 加算記号, + ) ( 変数1, abc ) ( 乗算記号, * ) ( 定数1, 123 ) ( 文区切り記号, ; ) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

49 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
abc := xyz + abc * 123 (構文解析) 代入記号 変数1 加算記号 変数2 乗算記号 変数1 定数1 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

50 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
コード生成の概要 原始プログラム 目的コード 字句解析 構文解析 意味解析 中間コード生成 コード生成 最適化 中間コード 中間コード 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

51 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
意味解析 名前の宣言と使用との対応付け 例: int x, y; float z; x = z * y; 整数型 = 浮動小数点型 * 整数型 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

52 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
意味解析 例: int x, y; float z; x = z * y; 整数型 = 浮動小数点型 * 整数型 整数型 = 浮動小数点型*浮動小数点型 整数型 = 浮動小数点型 整数型 = 整数型 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

53 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
変数等の宣言された情報を参照する必要がある。 => 記号表を用意しよう! ・名前 (spell) ・型 (int, float, …, struct char *, etc.) ・記憶域 (static, auto, …) ・その他 (const, etc.) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

54 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
変数の場合(例) 大きさ(バイト数) 有効範囲 通常変数/仮引数 宣言の有無(暗黙宣言が許されている言語) 実行時に割り当てられるアドレス など 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

55 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
関数名・手続き名(例) 仮引数の個数および仮引数の型 戻り値の型(関数の場合) 有効範囲 コードの先頭番地(entry point) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

56 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
定数名(例) 定数の内部表現 アドレス 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

57 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
型名(例) 型の種別(int, float, array, structure, etc.) 型の種別ごとの情報 (arrayならば、添字の範囲、要素の型など) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

58 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
記号表に対する操作 登録 参照 更新 削除 =>表探索問題(Table Search Problem) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

59 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
記号表の操作は 速くなければならない =>どうすればいいのか? => これ以降の議論は、   「データ構造とアルゴリズム」や   「計算可能性と計算量」など   の授業で学んでください。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

60 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
探索アルゴリズム 線形探索法(改良版には番兵法) 2分探索法 ハッシュ法(ハッシング法) 2分最適木法 B木法 etc. 自分で作るときには、まず「線形探索」でOK。 その後、例えばhashing法にしてみよう。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

61 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
中間言語 原始プログラムの構文解析結果は、 「解析木」である。 実際には、解析木とは異なる内部表現を 使うことも多い。 =>これを「中間言語」と呼ぶ。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

62 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
中間言語とは コンパイラは、原始プログラムを目的プログラムに変換する途中段階で、中間的なプログラムを作る場合がある。これを「中間コード」あるいは、「中間言語プログラム」といい、これを記述する言語を「中間言語」という。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

63 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
中間言語 構文木 後置記法(Polish notation) 三つ組 四つ組 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

64 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
1.構文木 (いままで幾つか例を見てきましたので省略) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

65 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
2.後置記法 前置記法(prefix notation) 中置記法(infix notation) 後置記法(postfix notation) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

66 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
2.後置記法 前置記法(prefix notation) + X Y 中置記法(infix notation) X + Y 後置記法(postfix notation) X Y + 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

67 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
練習問題 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

68 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
後置記法の長短 長所: 括弧が不要 コード生成がし易い スタックを利用すると、インタープリタが容易に 実現可能(教科書pp.15-19参照のこと) 短所: 四つ組(後述)と比べ表現に融通性欠如 そのため、最適化に不向き 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

69 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
3.三つ組 形式: 番号 (演算子,被演算子1,被演算子2) 例: 7.(+,X,15) (意味) ⑦ ← X+15 二番地命令/コードともいう 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

70 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
A = 10 * B ー C / D => (*,10,B) ( / ,C,D) (ー,①,②) (=,③,A) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

71 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
4.四つ組 形式: (演算子,被演算子1,被演算子2,結果の変数) 例: (+,X,15,t) (意味) t ← X+15 三番地命令/コードともいう 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

72 例 A = 10 * B ー C / D => 1.(*,10,B,t1) 2.( / ,C,D,t2) 3.(ー,t1,t2,A)
1と2の順序を入れ替えても、結果は変わらない! 最適な計算順序がある? 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

73 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
例2:X=(A+B-C)/(A+B) 練習問題 (まずは自分でやってみよう) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

74 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
例2:X=(A+B-C)/(A+B) (+,A,B,t1) (ー,t1,C,t2) (+,A,B,t3) ( / ,t2,t3,X) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

75 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
例2:X=(A+B-C)/(A+B) (+,A,B,t1) (ー,t1,C,t2) (+,A,B,t3) ( / ,t2,t3,X) t1とt3は実は同じもの! 最適化しよう! 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

76 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
例2:X=(A+B-C)/(A+B) (+,A,B,t1) (ー,t1,C,t2) ( / ,t2,t1,X) (最適化された!) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

77 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
練習問題 今日の 練習問題 式 x + y * ( z – w ) を 構文木 後置記法 三つ組 の列 四つ組 の列  として表せ。 出席用紙に答案を書いてください。最後に、提出してもらいます。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

78 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
コードの最適化 コンパイル過程において、生成するコードを改良することを「コード最適化」という。 では、「改良」とはどうすること? 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

79 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
最適化の内容(例) コードを小さくする 実行時の効率をよくする 実行時の使用メモリを小さくする 一般には、2が重要視される。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

80 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
コード最適化の手法 共通部分の削除 複写伝播 不要コードの削除 ループ不変量の抽出とコード移動 演算子の強さの軽減 などなど 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

81 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
1.共通部分の削除 A=B/(C+D)-(C+D); ( +, C, D, t1 ) ( /, B, t1, t2 ) ( +, C, D, t3) ( -, t2, t3, A) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

82 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
1.共通部分の削除 A=B/(C+D)-(C+D); ( +, C, D, t1 ) ( /, B, t1, t2 ) ( +, C, D, t3 ) ( -, t2, t3, A ) ( +, C, D, t1 ) ( /, B, t1, t2 ) ( -, t2, t1, A ) 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

83 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
2.複写伝播 X = Y; Z = X + 1; W = X; X = Y; Z = Y + 1; W = Y; Yだけ。Xなし。 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

84 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
3.不要コードの削除 X = Y; Z = Y + 1; W = Y; Z = Y + 1; W = Y; 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

85 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
4.ループ不変量の抽出とコード移動 for ( i=0; i<100; i++ ) x[ i ] = 10 * a[ j ] + y[ i ]; w = 10*a[ j ]; for( i = 0; i < 100; i++ ) x[ i ] = w + y[ i ] 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

86 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
5.演算子の強さの軽減 Y = A*2 Y = A + A 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)

87 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)
コード生成の概要(再) 原始プログラム 目的コード 字句解析 構文解析 意味解析 中間コード生成 コード生成 最適化 中間コード 中間コード 言語プロセッサ2015 東京工科大学CS学部 (担当 亀田弘之)


Download ppt "言語プロセッサ2015 Language Processors 2015"

Similar presentations


Ads by Google