Опубликован: 27.09.2006 | Уровень: для всех | Доступ: свободно | ВУЗ: Московский государственный индустриальный университет
Лекция 3:

Высказывания и предикаты

< Лекция 2 || Лекция 3: 12345 || Лекция 4 >

Синтаксис языка предикатов

Так как нам предикаты нужны прежде всего для описания программ, введем следующее определение.

Определение 3.1. Высказывание или предикат — это функция, действующая из некоторого множества значений переменных программы (идентификаторов) в множество из двух значений { T, F } ( Да и Нет ).

В соответствии с ним предикатами будут следующие фразы:

  • значение переменной i равно двум;
  • переменная k положительна, а значение переменной m при этом не превосходит 100;
  • значения всех целочисленных переменных программы являются нулевыми;
  • неправда, что значение переменной i неположительно.

Чуть менее понятно, можно ли считать предикатами такие фразы:

  • если предположить, что значение переменной i равно двум, то значения всех остальных целочисленных переменных программы будут неотрицательными;
  • данная программа является правильной;
  • данное высказывание ложно.

Особенно показательным является последний пример. Если мы согласимся с тем, что он представляет из себя предикат, то возникает естественный вопрос о его истинности. Предположение о том, что он истинен, заставляет считать его ложным, и наоборот. Получаемое противоречие говорит о том, что определение 3.1 не является достаточно корректным.

Ситуация с предикатами напоминает уже обсуждавшуюся нами ситуацию с языками для записи алгоритмов — необходим какой-то четкий критерий, позволяющий однозначно определить, что является предикатом, а что нет.

В теории формальных языков, более детальное знакомство с которой состоится позже, принято задавать язык с помощью грамматики. Грамматику же достаточно часто определяют с помощью так называемой нормальной формы Бэкуса-Наура (НФБН). Вот все необходимые общие определения.

Определение 3.2. Алфавит \Sigmaпроизвольное непустое множество.

Мы будем иметь дело только с конечными алфавитами, примерами которых являются алфавит русского языка, английский алфавит, множество цифр, алфавит всех символов, имеющихся на клавиатуре компьютера.

Определение 3.3. Символом алфавита \Sigma называют любой его элемент, а цепочкой над алфавитом — произвольную последовательность символов \omega.

Цепочки часто называют также словами, фразами и предложениями. Пустая цепочка обозначается специальным символом \varepsilon, а множество всех цепочек над алфавитом \Sigma принято обозначать \Sigma^*. Если в качестве \Sigma взять множество букв русского алфавита, дополненное символом пробела и знаками пунктуации, то в \Sigma^* будут содержаться все фразы русского языка.

Определение 3.4. Длиной |\omega| цепочки \omega \in \Sigma^* называется количество входящих в нее символов.

Длина пустой цепочки равна нулю, а длины всех остальных цепочек над любым алфавитом положительны.

Определение 3.5. Операция \circ\colon  \Sigma^*\times \Sigma^* \rightarrow \Sigma^* конкатенации двух цепочек определена следующем образом. Пусть \omega_1 = a_1 a_2 \ldots a_n, \omega_2 = b_1 b_2
\ldots b_m, тогда \omega_1 \circ w_2 = a_1 a_2 \ldots  a_n b_1 b_2 \ldots b_m.

Операция конкатенации, называемая также операцией сцепления или дописывания, обладает следующими свойствами.

Предложение 3.1. Для любых цепочек \omega, \omega_1, \omega_2 и \omega_3 справедливы следующие равенства:

1) \varepsilon\circ \omega = \omega\circ \varepsilon = \omega,

2) (\omega_1\circ \omega_2) \circ \omega_3 = \omega_1 \circ (\omega_2
\circ \omega_3).

Имея все эти определения, уже можно дать формальное определения языка над алфавитом \Sigma.

Определение 3.6. Язык L — это произвольное подмножество множества цепочек \Sigma^*.

Если язык конечен, то есть состоит из конечного множества входящих в него цепочек, то его можно задать, просто перечислив все его элементы. Для бесконечных языков, которые чаще всего и представляют наибольший интерес, такой способ не годится. Достаточно часто для задания языка используют грамматику, несколько упрощенное определение которой мы сейчас рассмотрим.

Определение 3.7. Пусть \Sigma — некоторый алфавит, Nметаалфавит, т.е. какой-то другой алфавит, не пересекающийся с \Sigma ( \Sigma \cap N =
\varnothing ). Элементы метаалфавита N называются метасимволами. Грамматикой G называется набор ( \Sigma, N, P, S ), где \Sigma — множество символов, N — множество метасимволов, P — множество правил вывода вида: \alpha\rightarrow\beta, где \alpha\in N — какой-то метасимвол, \beta \in (\Sigma \cup N)^* — произвольная цепочка над объединением двух алфавитов, и для каждого \alpha\in N встречается хотя бы одно правило с \alpha в левой части (до стрелочки), а S \in N — так называемый стартовый метасимвол.

Содержательно каждое правило грамматики имеет смысл подстановки. Например, строка \alpha\rightarrow\alpha\gamma\alpha означает возможность замены метасимвола \alpha на цепочку \alpha\gamma\alpha. Начав со стартового символа и пользуясь различными правилами грамматики, мы можем получать различные цепочки из символов, которые называются выводимыми цепочками.

Заметим, что если в цепочке встречается метасимвол, то ее можно преобразовать дальше, применив одно из правил грамматики с этим метасимволом в левой части. Если же метасимволов в цепочке не осталось, то процесс ее преобразования закончен и больше с цепочкой ничего сделать нельзя. По этой причине обычные символы (из алфавита \Sigma ) часто называют терминалами, а метасимволы (из N ) — нетерминалами.

Определение 3.8. Языком L(G), порожденным грамматикой G, называется множество всех терминальных выводимых цепочек.

Для задания грамматики часто используют очень наглядную форму представления, называемую нормальной формой Бэкуса-Наура (НФБН). Набор правил P задают при этом в виде совокупности правил со стрелочками, перечисляющими все возможные цепочки, на которые может быть заменен каждый из метасимволов грамматики в процессе вывода, а стартовым метасимволом считается тот, который присутствует в левой части самого первого правила.

В качестве примера дадим строгое определение языка предикатов, или, как принято еще говорить, зададим синтаксис этого языка.

Определение 3.9. Множество предикатов — это язык, порожденный следующей грамматикой:

e \rightarrow T (1-е правило: истина)

\mid F (2-е правило: ложь)

\mid id (3-е правило: идентификатор)

\mid (! e) (4-е правило: отрицание)

\mid (e \lor e) (5-е правило: дизъюнкция)

\mid (e \lors e) (6-е правило: условное Или )

\mid (e \land e) (7-е правило: конъюнкция)

\mid (e \lands e) (8-е правило: условное И )

\mid (e \limp e) (9-е правило: импликация)

\mid (e = e) (10-е правило: эквивалентность)

Единственным метасимволом данной грамматики является e, а алфавит \Sigma =
\{T, F, !, \lor, \lors, \land, \lands, \limp, =, (, )\}
\cup M_{id}, где множество M_{id} состоит из всех возможных идентификаторов (имен) переменных программ логического типа.

Приведем пример цепочки вывода в данной грамматике: e \rightarrow (e \Rightarrow e ) \rightarrow ((e\lor e) \Rightarrow e )
\rightarrow ((a\lor e) \Rightarrow e )\rightarrow ((a\lor T) \Rightarrow e )
\rightarrow ((a\lor T) \Rightarrow a ). Этo показывает, что выражение ((a\lor T) \Rightarrow a ) является предикатом. Легко построить другой вывод этого же предиката: e \rightarrow (e \Rightarrow e )\rightarrow
((e\lor e) \Rightarrow e ) \rightarrow ((e\lor T) \Rightarrow e ) \rightarrow 
((a\lor T) \Rightarrow e ) \rightarrow ((a\lor T) \Rightarrow a ). Существует и еще несколько других цепочек вывода для предиката ((a\lor T) \Rightarrow a ), отличающихся порядком замены метасимвола e на идентификатор a и значение T. Ясно, что в определенном смысле, который мы не будем сейчас уточнять, все эти цепочки эквивалентны. Говорят, что множество эквивалентных цепочек задает дерево вывода данного предиката, изображенное на рисунке 3.1.


Рис. 3.1.

Рассмотрим следующую задачу.

Задача 3.2. Докажите, что выражение ((a\land b) = (b\lor a)) является предикатом.

Решение Для доказательства достаточно предъявить вывод в грамматике 3.9 предложенного выражения, что не слишком трудно: e \rightarrow (e=e) \rightarrow ((e\land e)=e) \rightarrow ((e\land e)=
(e\lor e)) \rightarrow ((a\land e)=(e\lor e)) \rightarrow((a\land b)=(e\lor e))
\rightarrow((a\land b)=(b\lor e))\rightarrow((a\land b)=(b\lor a)).

Покажем, как можно доказать, что выражение не является предикатом.

Задача 3.3. Докажите, что выражение a\lor a — не предикат.

Решение В самом деле, для того, чтобы в предикате появился символ \lor, необходимо применить правило e \rightarrow (e \lor e), а его применение вызывает появление пары скобок, которых нет в выражении a \lor a. Ни один из терминальных символов, появившись в процессе вывода, не может измениться в дальнейшем (или исчезнуть). Таким образом, если 5-е правило грамматики 3.9 не применять, то мы не сумеем получить в итоговой цепочке символ \lor, а если его применить хотя бы раз, то в цепочке будут присутствовать скобки. Полученное противоречие и показывает, что выражение a\lor a предикатом не является.

< Лекция 2 || Лекция 3: 12345 || Лекция 4 >
Анастасия Халудорова
Анастасия Халудорова
екатерина яковлева
екатерина яковлева