Опубликован: 16.03.2007 | Уровень: профессионал | Доступ: платный
Лекция 5:

Теорема о неподвижной точке

< Лекция 4 || Лекция 5: 123 || Лекция 6 >
Аннотация: Посвящена одной из центральных проблем – существованию неподвижной точки (теорема Клини), а также некоторым приложениям этой теоремы, в частности, вопросу существования программы, печатающей свой код.

Неподвижная точка и отношения эквивалентности

Теорема 25. Пусть U главная вычислимая универсальная функция для класса вычислимых функций одного аргумента, а h произвольная всюду определенная вычислимая функция одного аргумента. Тогда существует такое число n, что Un=Uh(n), то есть n и h(n) номера одной функции.

Другими словами, нельзя найти алгоритма, преобразующего программы, который бы по каждой программе давал другую (не эквивалентную ей). Эту теорему называют теоремой Клини о неподвижной точке или теоремой о рекурсии.

Мы будем действовать по аналогии с построением вычислимой функции, не имеющей всюду определенного вычислимого продолжения ( "лекция 2" ).

Рассмотрим произвольное отношение эквивалентности (которое мы будем обозначать x \equiv  y ) на множестве натуральных чисел. Мы покажем, что следующие два свойства этого отношения не могут выполняться одновременно:

  • Для всякой вычислимой функции f существует всюду определенная вычислимая функция g, являющаяся ее \equiv -продолжением (это означает, что если f(x) определено при некотором x, то g(x) \equiv  f(x) ).
  • Существует всюду определенная вычислимая функция h, не имеющая \equiv -неподвижной точки (то есть функция, для которой n {\not\equiv} h(n) для всех n ).

Если x \equiv  y отношение равенства ( x=y ), то второе свойство выполнено (положим, например, h(n)=n+1 ), поэтому не выполнено первое. Теорема о неподвижной точке получится, если x \equiv  y понимать как Ux=Uy ( x и y номера одной и той же функции). В этом случае выполнено первое свойство, как мы сейчас убедимся, и потому не выполнено второе.

Почему выполнено первое свойство? Пусть f произвольная вычислимая функция одного аргумента. Рассмотрим функцию V(n,x)=U(f(n),x). Поскольку U является главной универсальной функцией, найдется всюду определенная функция s, для которой V(n,x)=U(s(n),x) при всех n и x. Эта функция и будет искомым \equiv -продолжением. В самом деле, если f(n) определено, то s(n) будет другим номером той же функции, что и f(n). (Отметим, что если f(n) не определено, то s(n) будет одним из номеров нигде не определенной функции.)

Для завершения доказательства теоремы о неподвижной точке осталось проверить, что указанные два свойства отношения эквивалентности несовместны. Это делается так же, как в теореме 10, где отношением эквивалентности было равенство. Возьмем вычислимую функцию f, от которой никакая вычислимая функция не может отличаться всюду (например, диагональную функцию x -> U(x,x) для некоторой вычислимой универсальной функции U ). По предположению существует всюду определенное вычислимое \equiv -продолжение g функции f. Рассмотрим функцию t(x)=h(g(x)), где h вычислимая всюду определенная функция, не имеющая \equiv -неподвижной точки. Тогда t будет всюду отличаться от f. В самом деле, если f(x) определено, то f(x) \equiv  g(x) {\not\equiv} h(g(x))=t(x), и потому f(x) \ne  t(x). Если же f(x) не определено, то этот факт сам по себе уже отличает f(x) и t(x).

Теорему о неподвижной точке можно переформулировать и так:

Теорема 26. Пусть U(n,x) главная вычислимая универсальная функция для класса вычислимых функций одного аргумента. Пусть V(n,x) произвольная вычислимая функция. Тогда функции U и V совпадают на некотором сечении: найдется такое p, что Up=Vp, то есть U(p,n)=V(p,n) для любого n.

Так как функция U является главной, найдем такую всюду определенную вычислимую функцию h, что V(n,x)=U(h(n),x) при всех n и x. Осталось взять в качестве p неподвижную точку функции h.

(Пример следствия из этой теоремы: как бы ни старались разработчики, для любых двух версий компилятора существует программа, которая одинаково работает в обеих версиях например, зацикливается и там, и там. Впрочем, это все же не наверняка, а только если компилятор задает главную универсальную функцию но надо очень постараться, чтобы это было не так!)

Поучительно развернуть цепочку приведенных рассуждений и проследить, как строится неподвижная точка. Для наглядности вместо U(n,x) мы будем писать [n](x) и читать это " результат применения программы n к входу x ";

Рассуждение начинается с рассмотрения " диагональной " функции U(x,x), которую теперь можно записать как [x](x) (результат применения программы x к себе). Далее мы строим ее всюду определенное \equiv -продолжение. Это делается так. Выражение [[x](x)](y) вычислимо зависит от двух аргументов. Мы вспоминаем, что U есть главная универсальная функция, и находим такую программу g, что [[g](x)](y)=[[x](x)](y) при всех x и y. При этом [g](x) определено для всех x. Пусть мы хотим найти неподвижную точку программы h. Мы рассматриваем композицию [h]([g](x)). Это выражение вычислимо зависит от x, и потому существует программа t, для которой [t](x)=[h]([g](x)) при всех x. Эта программа применима ко всем x, поскольку таковы h и g. Теперь неподвижной точкой будет [g](t). Чтобы убедиться в этом, мы должны проверить, что [[g](t)](x)=[[h]([g](t))](x) для всех x. В самом деле, по свойству g имеем [[g](t)](x)=[[t](t)](x). Вспоминая определение t, это выражение можно переписать как [[h]([g](t))](x) что как раз и требовалось.

Программа, печатающая свой текст

Классическим примером применения теоремы о неподвижной точке является такое ее следствие: существует программа, печатающая (на любом входе) свой собственный текст. В самом деле, если бы такой программы не было, то преобразование

p \mapsto (программа, которая на любом входе печатает p )

не имело бы неподвижной точки.

Формально говоря, это следствие можно выразить так:

Теорема 27. Пусть U(n,x) главная вычислимая универсальная функция для класса всех вычислимых функций одного аргумента. Тогда существует такое число p, что U(p,x)=p для любого x.

В программистских терминах: пусть U(p,x) результат применения паскаль-программы p к стандартному входу x. (Уточнения: (1) мы отождествляем числа и последовательности байтов; (2) если программа не завершает работы, мы считаем, что результат не определен, даже если на стандартный выход что-то послано.) Ясно, что функция U будет главной универсальной функцией. Поэтому к ней можно применить сформулированное только что утверждение; получим программу p, которая при любом входе на выходе дает p.

Ясно, что это рассуждение применимо для любого языка программирования; то, что мы упомянули язык паскаль, роли не играет.

  34. Докажите, что существует паскаль-программа, которая печатает свой текст задом наперед.

  35. Покажите, что есть две различные паскаль-программы P и Q с такими свойствами: программа P печатает текст программы Q, а программа Q печатает текст программы P. (Если не требовать различия между P и Q, то в качестве P и Q можно взять одну и ту же программу, печатающую свой текст.)

Выпишем явно программу на паскале, печатающую свой текст. (Это хорошая задача для любителей программирования.) Для начала напишем неформальную инструкцию на русском языке:

напечатать два раза, второй раз в кавычках, такой текст:
"напечатать два раза, второй раз в кавычках, такой текст:"

Чтобы написать что-то похожее на паскале, понадобятся некоторые дополнительные хитрости, но идея ясна: строковая константа используется два раза. Вот один из возможных вариантов:

program selfprint;
 var a:array[1..100]of string;i:integer;
begin
a[1]:='program selfprint;';
a[2]:=' var a:array[1..100]of string;i:integer;';
a[3]:='begin';
a[4]:='for i:=1 to 3 do writeln(a[i]);';
a[5]:='for i:=1 to 11 do begin';
a[6]:='  write(chr(97),chr(91),i);';
a[7]:='  write(chr(93),chr(58),chr(61));';
a[8]:='  writeln(chr(39),a[i],chr(39),chr(59));';
a[9]:='end;';
a[10]:='for i:=4 to 11 do writeln(a[i]);';
a[11]:='end.';
for i:=1 to 3 do writeln(a[i]);
for i:=1 to 11 do begin
  write(chr(97),chr(91),i);
  write(chr(93),chr(58),chr(61));
  writeln(chr(39),a[i],chr(39),chr(59));
end;
for i:=4 to 11 do writeln(a[i]);
end.

Читая эту программу, полезно иметь в виду соответствие между символами и их кодами:

a   [   ]   :   =   '   ;
97  91  93  58  61  39  59

Видно, что эту программу легко модифицировать, чтобы она, скажем, печатала свой текст задом наперед вместо команд write и writeln, печатающих текст, надо написать команды, записывающие его в файл (или в массив байтов), а потом команды, печатающие этот файл или массив в обратном порядке.

Сделав еще один шаг, можно получить и доказательство теоремы о неподвижной точке. Пусть h некоторое преобразование паскаль-программ, у которого мы хотим найти неподвижную точку. Тогда напишем программу наподобие только что приведенной, которая будет записывать свой текст в строку p, затем применять h к p, получая некоторую другую строку q, а затем запускать интерпретатор Паскаля на строке q (используя в качестве входа программы q вход исходной программы). Конечно, эта программа уже не будет такой короткой, так как будет включать в себя (и даже два раза первый раз просто так, а второй раз в кавычках) интерпретатор паскаля, написанный на паскале.

Ясно, что такая программа будет неподвижной точкой преобразования h, так как ее выполнение начинается ровно с того, что вычисляется значение функции h на ее тексте, после чего это значение воспринимается как программа и применяется к входу.

На самом деле это доказательство в сущности повторяет предыдущее, только в более программистских терминах.

< Лекция 4 || Лекция 5: 123 || Лекция 6 >
Жансерик Амзеев
Жансерик Амзеев
Казахстан, Алматы
Виталий Федоров
Виталий Федоров
Россия, Ярославская область