コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―

コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―
38号館4階N-411 内線5459

コンパイラの構造字句解析系構文解析系制約検査系中間コード生成系最適化系目的コード生成系

処理の流れ情報システムプロジェクトIの場合
write (ab); 字句解析系マイクロ構文の文法に従い解析 write ( 変数名 ) ; 構文解析系マクロ構文の文法に従い解析 <write_statement> ::= “write” “(” <exp> “)” “;” コード生成系 VSMアセンブラの文法に従い生成 1. PUSH ab OUTPUT

字句解析系 (lexical analyzer, scanner)
空白、コメントを読み飛ばす単語(token)に区切るマイクロ構文エラーを検出予約語 “if” 左括弧 “(” 変数 “ans” 不等号 “>=” 整数　“123” 右括弧 “)” 予約語 “print” : if (ans >= 123 ) /* ansの値で分岐 */ (改行) (空白)print (‘1’) ;

単語への分割英語の場合 ⇒単語間に空白があるので区切るのは簡単日本語の場合区切り方を正しく決定するのは困難計算機言語の場合は？
School of Science and Engineering Kinki University ⇒単語間に空白があるので区切るのは簡単日本語の場合きんきだいがくりこうがくぶきんき : だいがく : りこうがくぶ近畿大学理工学部きんきだ : いがくり : こうが : くぶ近畿だイガ栗黄河九分区切り方を正しく決定するのは困難計算機言語の場合は？

区切り記号 ( が来たので “main” で区切ると判別
単語への分割計算機言語の場合区切り記号で単語を判別できる main () { int i, j, k; : m a i n ( 区切り記号 ( が来たので “main” で区切ると判別

マイクロ構文 (情報システムプロジェクトIの場合)
マイクロ構文 (EBNF記法で定義) K-Program ::= { Token | W-Space } ‘\0’(ファイル末) Token(単語) ::= NAME | INTEGER | CHARACTER | STRING | KEYWORD | OPERATOR | DELIMITER W-Space(空白) ::= ‘ ’(スペース) | ‘\t’ (タブ) | ‘\n’ (改行) | Comment または 0回以上の繰り返し変数名整数文字列文字予約語演算子区切り記号 (コメントは拡張課題) コメント

マイクロ構文(変数名, 整数, 文字) マイクロ構文 NAME(変数名) ::= Alpha { Alpha | Dec }
INTEGER(整数) ::= ‘0’ | Pdec { Dec } | ‘0’ ‘x’ Xdec { Xdec } CHARACER(文字) ::= ‘‘(シングルクォート)’ Character ‘’’ Alpha ∈ {a, b, …, z, A, B, …, Z, _(アンダーバー)} Pdec ∈ {1, 2, …, 9} Dec ∈ {0, 1, 2, …, 9} Xdec ∈ {0, 1, 2, …, 9, A, B, …, F} Character ::= (任意の文字)

マイクロ構文(演算子, 区切り記号) マイクロ構文 OPERATOR(演算子) ::=
‘=’ ‘=’ | ‘!’ ‘=’ | ‘<’ | ‘>’ | ‘&’ ‘&’ | ‘|’ ‘|’ | ‘!’ | ‘+’ | ‘-’ | ‘*’ | ‘/’ | ‘%’ | ‘=’ | ‘+’ ‘=’ | ‘-’ ‘=’ | ‘*’ ‘=’ | ‘/’ ‘=’ | ‘+’ ‘+’ | ‘-’ ‘-’ DELIMITER(区切り記号) ::= ‘;’ | ‘,’ | ‘(’ | ‘)’ | ‘{’ | ‘}’ | ‘[’ | ‘]’

トークンの種類 (情報システムプロジェクトIの場合)
記号区切り記号 ; , ( ) { } [ ] 演算子比較演算子 = = != < > (<=) (>=) 論理演算子 ! && || 算術演算子 + - * / % 代入演算子 = += -= *= /= 名前変数名定数整数文字文字列予約語 main int if while for inputint inputchar outputint outputchar break (else) (do) (continue) …

トークン名区切り記号比較演算子論理演算子 ; SEMICOLON , COMMA ( LPAREN ) RPAREM { LBRACE
} RBRACE [ LBRACKET ] RBRACKET 記号トークン名 = = EQUAL != NOTEQ < LESS > GREAT 記号トークン名 && AND || OR ! NOT

トークン名算術演算子代入演算子 + ADD - SUB * MUL / DIV % MOD = ASSIGN += ASSIGNADD
記号トークン名 + ADD - SUB * MUL / DIV % MOD 記号トークン名 = ASSIGN += ASSIGNADD -= ASSIGNSUB *= ASSIGNMUL /= ASSIGNDIV ++ INC -- DEC (※) (※) 単項演算子の - と二項演算子の - で共通して使用

トークン名定数, 変数名, 予約語 INTEGER ‘(任意の1文字)’ CHARACTER NAME main MAIN int INT
文字列種別トークン名数字の並び整数 INTEGER ‘(任意の1文字)’ 文字 CHARACTER 英字の並び変数名 NAME main 予約語 MAIN int INT if IF while WHILE inputint INPUTINT : INTEGER と INT の違いに注意

字句解析の手順字句解析決定性有限オートマトンで解析 ⇒(最小の)決定性有限オートマトンを導出する必要があるマイクロ構文
非決定性有限オートマトン決定性有限オートマトン状態最小化字句解析系

非決定性有限オートマトンへマイクロ構文 →非決定性有限オートマトン(NFA) 以下の手法で帰納的に ε(空記号列)に対するNFA
R1 | R2 に対するNFA R1R2 に対するNFA R* に対するNFA R+ に対するNFA (R1, R2, R : 正規表現)

非決定性有限オートマトンへ ε i f i f a i f ε(空記号列)に対するNFA 入力が無くても φ(空遷移関数集合)に対するNFA
状態遷移 ε i f i f 状態遷移無し a i f 入力 a で状態遷移

非決定性有限オートマトンへ ε ε R1 i f ε R2 ε ε ε ε i R1 R2 f R1 | R2 に対するNFA

非決定性有限オートマトンへ ε ε ε i R f ε ε ε i R f ε R* (0回以上の繰り返し) に対するNFA

非決定性オートマトンへ r ::= a (a|b)* a b a b a b a ε a|b b ε a b ε (a|b)*

非決定性オートマトンへ r ::= a (a|b)* a b b ε a a b

非決定性有限オートマトンの問題点非決定性有限オートマトン ⇒決定性有限オートマトンに変形する b a a b
同一入力に対する状態遷移が複数存在 ⇒複数の遷移を全て解析する必要がある ⇒決定性有限オートマトンに変形する b a a b

決定性有限オートマトンへ非決定性有限オートマトン(NFA) →決定性有限オートマトン(DFA) a a a b b
同一の入力で遷移できる状態を1つの状態にまとめる ε ε q8 a ε ε q3 ε q3 q5 a a b ε q2 ε ε q0 q1 q2 q7 q8 q9 b ε ε q4 ε q4 q6 ε q1 からε入力で q2 q3 q4 q8 へ遷移可能 ⇒ q1 q2 q3 q4 q8 をまとめる

決定性有限オートマトンへ NFA N = (QN, Σ, δN, qN0, FN)
⇒ DFA D = (QD, Σ δD, qD0, FD) ε-closure (q) ::= q ∈{QN∪QD} からε遷移できる状態集合 goto (q, a) ::= q ∈{QN∪QD} から a ∈Σで遷移できる状態集合

決定性有限オートマトンへ 1 q3 0, 1 q1 1 q0 q2 1 qF 1 NFA ε ε QN ε-closure (q)
q0 1 q2 1 qF NFA QN ε-closure (q) goto (q, 0) goto (q, 1) q0 q1 q2 q3 qF {q0, q1} q0 のε-遷移先 {q1} {qF} {q2, q3} {q2}

遷移は ε1 - 遷移 1ε - 遷移 ε1ε - 遷移を含む ε 1 q0 q2 1 qF 1 NFA QN ε-closure (q) goto (q, 0) goto (q, 1) q0 {q0, q1} q1 {q1} q2 {q2} q3 {q2, q3} qF {qF} {q0, q1} {q0, q1, q2, q3} {q0, q1}の 0入力遷移先 {q0, q1}の 1入力遷移先

1 q0 q2 1 qF 1 NFA QN ε-closure (q) goto (q, 0) goto (q, 1) q0 {q0, q1} {q0, q1, q2, q3} q1 {q1} q2 {q2} q3 {q2, q3} qF {qF} {q0, q1} {q2, q3} {qF} φ

決定性有限オートマトンへ NFA⇒DFAアルゴリズム QD := {ε-closure (qN0) }; /* QD の初期入力 */
for each q∈QD { /* QD内の未実行の要素に対して実行*/ for each a∈Σ { r := ε-closure (goto (q, a)); if (r ∉ QD) /* r はQDの中に無いか？ */ QD := QD ∪r; /* r をQDに加える */ δD(q, a) := r; }

決定性有限オートマトンへ NFA DFA QN ε-closure (q) goto (q, 0) goto (q, 1) q0
{q0, q1, q2, q3} q1 {q1} {q2, q3} q2 {q2} φ {qF} q3 qF DFA QD ε-closure (q) goto (q, 0) goto (q, 1) q0,1 {q0, q1} {q0, q1} {q0, q1, q2, q3} ε-closure ({q0∪q1}) goto ({q0∪q1}, 0) goto ({q0∪q1}, 1)

{q0, q1, q2, q3} q1 {q1} {q2, q3} q2 {q2} φ {qF} q3 qF DFA 𝑞 0,1 ∈ 𝑄 𝐷 𝑞 0,1,2,3 ∉ 𝑄 𝐷 QD ε-closure (q) goto (q, 0) goto (q, 1) q0,1 {q0, q1} {q0, q1, q2, q3} q0, 1, 2, 3 {q0, q1, q2, q3} {q0, q1} {q0, q1, q2, q3, qF}

{q0, q1, q2, q3} q1 {q1} {q2, q3} q2 {q2} φ {qF} q3 qF DFA 𝑞 0,1 ∈ 𝑄 𝐷 𝑞 0,1,2,3,𝐹 ∉ 𝑄 𝐷 QD ε-closure (q) goto (q, 0) goto (q, 1) q0,1 {q0, q1} {q0, q1, q2, q3} q0, 1, 2, 3 {q0, q1, q2, q3, qF} q0, 1, 2, 3,F {q0, q1, q2, q3 , qF} {q0, q1, qF} {q0, q1, q2, q3, qF}

{q0, q1, q2, q3} q1 {q1} {q2, q3} q2 {q2} φ {qF} q3 qF DFA 𝑞 0,1,𝐹 ∉ 𝑄 D 𝑞 0,1,2,3,𝐹 ∈𝑄 𝐷 QD ε-closure (q) goto (q, 0) goto (q, 1) q0,1 {q0, q1} {q0, q1, q2, q3} q0, 1, 2, 3 {q0, q1, q2, q3, qF} q0, 1, 2, 3,F {q0, q1, q2, q3 , qF} {q0, q1, qF} q0, 1 ,F {q0, q1, qF} {q0, q1, qF} {q0, q1, q2, q3 }

決定性有限オートマトンへ DFA 1 1 1 1 q0,1 q0,1,2,3 q0,1,F q0,1,2,3,F QD
ε-closure (q) goto (q, 0) goto (q, 1) q0,1 {q0, q1} {q0, q1, q2, q3} q0, 1, 2, 3 {q0, q1, q2, q3, qF} q0, 1, 2, 3, F q0, 1 ,F {q0, q1, qF} {q0, q1, q2, q3 } εは自分自身への遷移のみ q0,1 q0,1,2,3 q0,1,F q0,1,2,3,F qF を含めば受理状態 1 1 1 1

決定性有限オートマトンへ q0 0, 1 q1 q2 1 q3 qF NFA DFA 1 ε q0,1 q0,1,2,3
1 q3 qF NFA DFA q0,1 q0,1,2,3 q0,1,2,3,F 1 q0,1,F

決定性有限オートマトンの問題点導出で得られた有限オートマトン状態数が最小とは限らない ⇒状態数の最小化を行う a b a b

状態最小化状態最小化状態の等価性状態の等価性を用いてDFAを最適化
状態 p と状態 q に対して同一の入力列を与えたとき、その出力(受理, 不受理)が全て同じ ⇒状態 p と状態 q が等価である (p ≡q) (※) 等価性についての詳細は「論理回路」第13回講義を参照

状態数最小化の手順手法1 状態遷移表の分割手法2 状態併合表異なる出力を生成する状態対をグループに分割
以下を分割できなくなるまで繰り返す同一の入力に対し、遷移先の状態が異なるグループに属すればその状態対をグループに分割グループごとに1つの状態に併合手法2 状態併合表異なる出力を持つ状態対に×を付ける遷移先の状態対を記入以下を×が付かなくなくなるまで繰り返す遷移先に×が付いていればその状態対に×を付ける等価な状態対を決定

状態遷移表を用いた最小化 b q2 b b a q0 q1 a qF b a a q3 a {q0} {q1, q2, q3} {qF}
グループ状態遷移先受理 a b q0 q1 q3 q2 qF ○ a r2 r1 r0 遷移先, 受理でグループ分け {q0} {q1, q2, q3} {qF}

状態遷移表を用いた最小化 {q0} q1, q2 と q3 の {q1, q2} {q3} {qF}
グループ状態遷移先遷移先グループ受理 a b r0 q0 q1 r1 q3 q2 qF r2 ○ r1 r1 r1 r2 {q0} {q1, q2} {q3} {qF} q1, q2 と q3 の b入力遷移先グループが異なる ⇒ r1 を {q1, q2}{q3}に分割

状態遷移表を用いた最小化 {q0} q1, q2 の遷移先グループが全て同じ {q1, q2} {q3} {qF} a b r0 q0 q1
受理 a b r0 q0 q1 r1 q3 q2 r2 qF r3 ○ r2 r1 r3 {q0} {q1, q2} {q3} {qF} q1, q2 の遷移先グループが全て同じ ⇒ 分割終了

状態遷移表を用いた最小化 b r3 b a r0 r1 a b a r2 a a b r0 q0 r1 q1,2 r2 q3 r3 qF ○
グループ状態遷移先グループ受理 a b r0 q0 r1 q1,2 r2 q3 r3 qF ○ b r3 b a r0 r1 a b a r2 a

状態併合表を用いた最小化 Q 受理 a b q0 q1 q3 q2 qF ○ 遷移先 q0とq1が異なるグループなら ×を付ける
最後まで×が付かなければ等価

状態併合表を用いた最小化 Q 受理 a b q0 q1 q3 q2 qF ○ × × × 遷移先遷移先の有無、受理不受理が
異なる状態対に ×を付ける × × ×

状態併合表を用いた最小化 Q 受理 a b q0 q1 q3 q2 × qF ○ δ(q1, a)δ(q2, a)
遷移先受理 a b q0 q1 q3 q2 × qF ○ δ(q1, a)δ(q2, a) δ(q1, b)δ(q2, b) 3 3 2 2 3 3 2 F

状態併合表を用いた最小化 Q 遷移先受理 a b q0 q1 q3 q2 × 3 3 2 2 qF 2 F ○ 同一遷移先なら判定不要

状態併合表を用いた最小化 Q 受理 a b q0 q1 q3 q2 × qF ○ q2qF は×なので 2 F に×を付ける × 遷移先

状態併合表を用いた最小化 Q 受理 a b q0 q1 q3 q2 × qF ○ {q1,q2} が等価遷移先最後まで×が付かなかった

q0 q1 a q2 b q3 qF 最小化前最小化後 b r0 r1 r3 r2 b a a b a a

決定性有限オートマトンの作成情報システムプロジェクトIの場合
マイクロ構文 OPERATOR(一部) ::= ‘+’ | ‘-’ | ‘+’ ‘=’ | ‘-’ ‘=’ | ‘+’ ‘+’ | ‘-’ ‘-’ + ‘+’ - ‘-’ = ‘=’

非決定性オートマトンへ ‘+’ | ‘-’ | ‘+’ ‘=’ | ‘-’ ‘=’ | ‘+’ ‘+’ | ‘-’ ‘-’ + - + =
11 + 12 F ε 21 - 22 31 + 32 = 33 41 - 42 = 43 51 + 52 53 61 - 62 63

決定性オートマトンへ QN ε + - = 11 12 21 22 31 32 33 QN ε + - = 41 42 43 51 52
11 12 21 22 31 32 33 QN ε + - = 41 42 43 51 52 53 61 62 63 0,11,21,31, 41,51,61 33,F 32 31 22,F 21 41 63,F 62 61 53,F 52 51 43,F 42 22,F 42 63,F 62 33,F 43,F 11 12,F 32 52 53,F 12,F

決定性オートマトンへ QD ε + - = 0,11,21,31, 41,51,61 0,11,21,31, 41,51,61 22,42,62,F 12,32,52,F 12,32,52,F 33,F 53,F 12,32,52,F 22,42,62,F 63,F 43,F 22,42,62,F 33,F 43,F 63,F 53,F 33,F 43,F 63,F 53,F

決定性オートマトン += = + + ++ - -= = - -- 状態数最小化は不要

決定性有限オートマトン(一部) += = ; + ++ + == = = A…Z a…z _ 1…9 A…Z a…z _ 0…9 0…9
整数名前 A…Z a…z _ 整数 1…9 A…Z a…z _ 0…9 0…9

コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―

Similar presentations

Presentation on theme: "コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―"— Presentation transcript:

Similar presentations

About project

Feedback

Войти

Auth with social network:

コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―

Similar presentations

Presentation on theme: "コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―"— Presentation transcript:

Similar presentations

About project

Feedback

コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―

Presentation on theme: "コンパイラ第3回字句解析 ― 決定性有限オートマトンの導出 ―"— Presentation transcript: