НОУ ИНТУИТ | Математическая теория формальных языков. Лекция 14: Синтаксический разбор

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Московский государственный университет имени М.В.Ломоносова

Опубликован: 09.07.2007 | Доступ: свободный | Студентов: 2517 / 1036 | Оценка: 4.56 / 4.26 | Длительность: 20:40:00

ISBN: 978-5-9556-0062-8

Темы: Программирование, Алгоритмы и дискретные структуры, Математика

Специальности: Математик

Теги: beta, finite, grammar, xml, автоматы, анализ, булева формула, дерево вывода, контекстно-свободная грамматика, контекстно-свободный язык, метка перехода, моноид, нетерминальный символ, протоколы, регулярные выражения, теория, шаг индукции, элементы

|

Вам нравится? Нравится 34 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Определение 13.1.22. Сентенциальной формой (sentential form) грамматики $G = \lalg N , \Sigma , P , S \ralg$ называется любое слово в алфавите $N \cup \Sigma$ , выводимое из начального символа S.

Пример 13.1.23. Слова S, aSeaceSbb, aceaacecbecbb являются сентенциальными формами грамматики из примера 13.1.3.

Определение 13.1.24. Пусть дана контекстно-свободная грамматика $G = \lalg N , \Sigma , P , S \ralg$ . Определим три функции $\first_G$ , $\follow_G$ и $\director_G$ , связанные с грамматикой G. Для краткости будем писать просто FIRST, FOLLOW и DIRECTOR.

Функция FIRST ставит в соответствие каждому слову $\omega \pin \ns ^*$ множество тех терминальных символов, с которых начинаются слова, выводимые из $\omega$ , то есть

$\first( \omega ) \bydef \{ b \in \Sigma \mid ( \exists \theta \in \ns ^* ) \, \omega \overstar{\Rightarrow} b \theta \} .$

Функция FOLLOW ставит в соответствие каждому нетерминальному символу A множество тех терминальных символов, которые могут встречаться в сентенциальных формах непосредственно справа от A, то есть

$\follow( A ) \bydef \{ b \in \Sigma \mid ( \exists \eta \in \ns ^* ) \, ( \exists \theta \in \ns ^* ) \, S \overstar{\Rightarrow} \eta A b \theta \} .$

Функция DIRECTOR ставит в соответствие каждому правилу $( A \tto \alpha ) \in P$ множество терминальных символов, определяемое следующим образом: если $\alpha \overstar{\Rightarrow} \varepsilon$ , то

$\director( A \tto \alpha ) \bydef \first( \alpha ) \cup \follow( A ) ,$

иначе

$\director( A \tto \alpha ) \bydef \first( \alpha ) .$

Пример 13.1.25. Рассмотрим контекстно-свободную грамматику из примера 13.1.3. Очевидно, что

$\begin{align*} & \first( c ) = \{ c \} ,\\ & \first( dS ) = \{ d \} ,\\ & \first( aSeSb ) = \{ a \} ,\\ & \follow( S ) = \{ b , e \} ,\\ & \director( S \tto c ) = \{ c \} ,\\ & \director( S \tto dS ) = \{ d \} ,\\ & \director( S \tto aSeSb ) = \{ a \} . \end{align*}$

Пример 13.1.26. Рассмотрим контекстно-свободную грамматику $G_\eos$ из примера 13.1.17. Очевидно, что

$\begin{align*} & \director( B \tto C ) = \{ \trm{(} , \trm{m} , \trm{n} \} ,\\ & \director( B \tto B \trm{/} C ) = \{ \trm{(} , \trm{m} , \trm{n} \} ,\\ & \director( B \tto B \trm{*} C ) = \{ \trm{(} , \trm{m} , \trm{n} \} . \end{align*}$

Пример 13.1.27. Пусть контекстно-свободная грамматика $G \peq \lalg N , \Sigma , P , S \ralg$ не содержит бесполезных символов. Пусть даны правило $( A \tto \alpha ) \in P$ и символ $b \in \Sigma$ . Тогда утверждение

$b \in \director( A \tto \alpha )$

равносильно тому, что найдутся такие $x \in \Sigma^*$ , $y \in \Sigma^*$ и $\theta \in \ns ^*$ , что

$S \overstar{\Rightarrow} x A \theta \quad\text{и}\quad x \alpha \theta \overstar{\Rightarrow} x b y .$

Теорема 13.1.28. Пусть дана контекстно-свободная грамматика $G = \lalg N , \Sigma , P , S \ralg$ . Пусть $G_\eos = \lalg N_\eos , \Sigma_\eos , P_\eos , S_\eos \ralg$ - соответствующая контекстно-свободная грамматика с маркером конца строки, приведенная в определении 13.1.16. Обозначим через M МП-автомат $\lalg Q , \Sigma_\eos , \Gamma , \Delta , \{ \qinitial \} , \{ \varepsilon \} \ralg$ , где

$Q = \{ v \in \Sigma_\eos^* \mid | v | \leq 1 \} \cup \{ \qinitial \} ,$

$\qinitial \notin \Sigma_\eos^*$ , $\Gamma = N_\eos \cup \Sigma_\eos$ и

$\begin{align*} & \Delta = \{ \lp \lp \qinitial , \varepsilon , \varepsilon \rp , \lp \varepsilon , S_\eos \rp \rp \} \cup {} \\ &\myqquad \cup \{ \lp \lp \varepsilon , a , \varepsilon \rp , \lp a , \varepsilon \rp \rp \mid a \in \Sigma_\eos \} \cup {} \\ &\myqquad \cup \{ \lp \lp a , \varepsilon , a \rp , \lp \varepsilon , \varepsilon \rp \rp \mid a \in \Sigma_\eos \} \cup {} \\ &\myqquad \cup \{ \lp \lp b , \varepsilon , A \rp , \lp b , \alpha \rp \rp \mid ( A \tto \alpha ) \in P_\eos ,\ b \in \director_{ G_\eos }( A \tto \alpha ) \} . \end{align*}$

Тогда МП-автомат M является нисходящим магазинным анализатором для грамматики G.

Доказательство. Индукцией по количеству тактов можно доказать, что если $\lp v , w , \beta \rp \overstar{\vdash} \lp \varepsilon , \varepsilon , \varepsilon \rp$ , где $v \in \Sigma_\eos^*$ , то $\smash[b]{ \beta \overstar{\myunderset{ G_\eos }{\Rightarrow }} v w }$ . Следовательно, $L ( M ) \subseteq L ( G_\eos )$ .

С другой стороны, докажем, что если в грамматике $G_\eos$ выводится $S_\eos \overstar{\lmarrow} u \beta$ и $\beta \overstar{\lmarrow} b w$ , где $u \in \Sigma_\eos^*$ , $\beta \in \ns ^*$ , $b \in \Sigma_\eos$ , $w \in \Sigma_\eos^*$ , то $\lp b , w , \beta \rp \overstar{\vdash} \lp \varepsilon , \varepsilon , \varepsilon \rp$ .

Проведем доказательство индукцией по сумме длины слова bw и длины вывода $\beta \overstar{\lmarrow} b w$ . Случай |bw| = 1, $\beta = b w$ образует базис индукции (очевидно, что $\lp b , \varepsilon , b \rp \overstar{\vdash} \lp \varepsilon , \varepsilon , \varepsilon \rp$ ). Проверим теперь шаг индукции. Так как $\beta \overstar{\Rightarrow} b w$ и $b w \neq \varepsilon$ , то $\beta \neq \varepsilon$ . Если $\beta = A \theta$ , где $A \in N$ , то вывод $\beta \overstar{\lmarrow} b w$ имеет вид

$A \theta \lmarrow \alpha \theta \overstar{\lmarrow} b w ,$

где $( A \tto \alpha ) \in P_\eos$ и в силу леммы 13.1.27 $b \in \director_{ G_\eos }( A \tto \alpha )$ . Отсюда получаем, что $\lp b , w , A \theta \rp \vdash \lp b , w , \alpha \theta \rp$ , и остается применить предположение индукции для левосторонних выводов $S_\eos \overstar{\lmarrow} u \alpha \theta$ и $\alpha \theta \overstar{\lmarrow} b w$ . Если же $\beta = a \beta'$ , где $a \in \Sigma_\eos$ , то, очевидно, a = b и $\beta' \overstar{\lmarrow} w$ . Если $w = \varepsilon$ , то $b = \eos$ и в силу леммы 13.1.19 $\beta' = \varepsilon$ , но этот случай уже рассмотрен в базисе индукции. Пусть $w \neq \varepsilon$ . Тогда w = b'w' для некоторых $b' \in \Sigma_\eos$ и $w' \in \Sigma_\eos^*$ . Обозначим u' = ub. Применяя предположение индукции для левосторонних выводов $S_\eos \overstar{\lmarrow} u' \beta'$ и $\beta' \overstar{\lmarrow} b' w'$ , получаем $\lp b' , w' , \beta' \rp \overstar{\vdash} \lp \varepsilon , \varepsilon , \varepsilon \rp$ . Согласно построению МП-автомата M имеем

$\lp b , b' w' , b \beta' \rp \vdash \lp \varepsilon , b' w' , \beta ' \rp \vdash \lp b' , w' , \beta ' \rp .$

Шаг индукции доказан. Теперь легко проверить, что выполняется $L ( G_\eos ) \subseteq L ( M )$ .

Гомоморфизм $r \colon \Delta^* \to P_\eos^*$ задается соотношениями

$\begin{align*} & r ( \lp \lp b , \varepsilon , A \rp , \lp b , \alpha \rp \rp ) = ( A \tto \beta ) ,\\ & r ( \mathfrak{d} ) = \varepsilon \mathspace\text{для остальных}\mathspace \mathfrak{d} \in \Delta . \end{align*}$

Дальше >>

Авторизоваться

Математическая теория формальных языков

Синтаксический разбор

Вопросы и ответы