Опубликован: 29.10.2019 | Доступ: свободный | Студентов: 844 / 117 | Длительность: 17:21:00
Лекция 6:

Десять задач искусственного интеллекта по Д.А. Поспелову и возможности логических нейронных сетей

< Лекция 5 || Лекция 6: 1234 || Лекция 7 >

Синтез текстов

С проблемами поиска релевантного знания и понимания текстов весьма тесно соприкасается ещё одна проблема, привлекающая внимание специалистов, работающих в ИИ. Она связана с разгадкой механизмов, лежащих в основе процедур порождения текстов на заданную тему. Без ответов на возникающие тут вопросы нельзя организовать полноценный обмен информацией между людьми и системами искусственного интеллекта. Ибо механизм генерации целенаправленного текста вместе с механизмом анализа и понимания текстов образует основу процесса коммуникации – главного процесса в организации человеческого поведения и реализации всех видов его деятельности.

Как и процесс понимания, процесс синтеза текстов имеет многоуровневую структуру. После зарождения мотивов его генерации и осознания целей, которые предполагается достигнуть в акте общения, наступает этап порождения когнитивной структуры текста. Этот этап реализуется на уровне внутренних представлений системы о мире, хранящихся в базе знаний. Знания, релевантные целям, которые направляют процесс "строительства" текста, отбираются некоторым планировщиком на знаниях и собираются во внутреннюю структуру текста. После этого на уровне лингвистической компоновки текста другой планировщик превращает эту структуру в линейный текст на естественном языке. Этот текст ещё лишён того, что в психолингвистике называют читабельностью. Он ещё слишком связан с машинными представлениями. Куски плохо пригнаны друг к другу, отсутствует гладкость переходов и ясность изложения целей. Эти недостатки "глубинного текста" исправляются на третьем уровне генерации, который реализуется стилистическим планировщиком.

Описанная процедура генерации ставит перед её создателями ряд проблем, не решённых к настоящему времени. Например, неясно, какие принципы лежат в основе построения когнитивных структур текстов. В пользу того, что такие принципы существуют, убедительно свидетельствуют, например, эксперименты по генерации текстов волшебных сказок или музыкальных произведений (также текстов, но использующих специальный язык для общения с пользователями). В первом случае когнитивная структура определяется набором глубинных функций В.Я. Проппа, задающих достаточно жёсткий сценарий будущего текста. Во втором случае имеется конечная система правил, делающих процедуру композиции в нужной мере формальной.

Но остаются, по крайней мере, две важные проблемы, решение которых пока не найдено: а) как цели связаны с когнитивной структурой и б) как описываются когнитивные структуры тех типов текстов, которые нужны, например, в процессе естественно-языкового диалога. Большое внимание к проблемам теории речевых актов (нового направления в лингвистике) со стороны специалистов по ИИ подогревается надеждами найти здесь ответы на поставленные вопросы.

Наименьшей проблемой является переход от нелинейной структуры текста к её линейному представлению. Этот переход тесно связан с исследованиями по гипертекстам. Определённый бум, возникший в этой области, как раз и связан с осознанием того факта, что линейный по форме текст, как правило, является внешним кодом нелинейной структуры, на которую он "натянут". Гипертекстовые технологии призваны не только обеспечить возможность работы с нелинейным представлением текстов, но и должны как-то решать задачи его линеаризации и перехода от линейного представления к гипертекстовому.

Продолжим рассмотрение приведённого выше примера, желая получить определённые обобщения, касающиеся формирования текстов умозаключений, и пытаясь подняться на более высокий уровень логического вывода. Это поможет при рассмотрении предлагаемой "горячей точки".

В результате проделанных мамой усилий оказались максимально возбуждёнными, даже с единичным значением, несколько нейронов, и мы вспоминаем школьный урок детства.

Учительница говорит: "Дети, придумайте рассказ со словами "шкода", "шкаф", "конфеты", "ай-яй-яй", "густо покраснел". Дети усиленно ищут, пробуют возможные связи, напрягая уже сложившиеся ассоциации и навыки .

Наконец, отличник Коля произносит рассказ – умозаключение, запомнившееся детьми на всю жизнь, как богатый источник творческого подражания: "Петя совершил шкоду. Он стал на стул и достал из шкафа конфеты. А когда мама сказала "Ай-яй-яй", он густо покраснел".

Согласимся, что это урок более высокого уровня мышления, хотя всего лишь дедуктивного. Однако в нём уже содержатся элементы индуктивного мышления, т.к. он предполагает анализ и обобщение не только сложившейся ситуации, но содержит и попытку абстрагирования - анализ причинно-следственных связей, присущих этой ситуации из жизни Коли.

Приведённая схема порождает схему логическую, определяя действия алгоритмиста-исследователя. Значит, логическая схема – прообраз логической нейронной сети – в решении этой "горячей точки" занимает главное место.

Есть ли здесь место обобщению логической схемы до уровня логической нейронной сети? Есть, в том случае, если цели и средства определены нечётко.

Например, "проектируемая" сказка, - насколько должна быть весёлой, грустной, назидательной, "страшной"? А на что должны быть похожи средства её выражения, - немножко баллада, немножко стихи? С неизбежностью возникают веса факторов, приводящие к столь же взвешенным решениям.

Приходится переходить в область вероятностей, нечётких множеств и других недетерминированных механизмов.

А это уж точно – логические нейронные сети.

Когнитивная графика

П. Пикассо. Купальщицы

П. Пикассо. Купальщицы

Когнитивная ("сходная") функция изображений использовалась в науке до появления компьютеров. Образные представления, связанные с понятиями граф, дерево, сеть и т.п. помогли доказать немало новых теорем. Круги Эйлера позволили визуализировать абстрактное отношение силлогистики Аристотеля. Диаграммы Венна сделали наглядными процедуры анализа функций алгебры логики.

С появлением компьютеров графическая информация стала всё более трактоваться с помощью знаний, содержащихся в ней. Если ранее её функция сводилась к иллюстрации тех или иных знаний и решений, то теперь она стала включаться равноправным образом в те когнитивные процессы, которые моделируются в базах знаний и на основе их содержимого.

Когнитивная графика – средство визуального, схематичного, уникального представления изучаемого объекта или процесса, позволяющее производить и иллюстрировать ассоциативные выводы на базе простейших наглядных аналогий.

Систематическое использование когнитивной графики в компьютерах в составе человеко-машинных систем сулит многое. Даже весьма робкие попытки в этом направлении, известные как мультимедиа-технологии, привлекающие пристальное внимание специалистов, занятых созданием интеллектуальных обучающих систем, показывает перспективность подобных исследований.

Действительно, образное мышление бывает определяющим в творческой деятельности человека. Не говоря о людях искусства, даже математики, чьё мышление, казалось бы, основано на формальных выкладках, на деле развивают свои выводы на основе внутренних визуальных представлений. Образно, похоже, аналогизированно представить себе исследуемую структуру с её внутренними отношениями, заставить её двигаться, следить за этим движением раз за разом и, наконец, уловить искомое свойство, догадаться о его причине и лишь после этого обобщить и формализовать новое причинно-следственное отношение – вот путь творческого мышления впечатлительного учёного – приверженца точных наук. (Какова здесь роль "третьего глаза" - эпифиза?) Образные, графические аналоги, как механизмы, способствующие логическому выводу, действительно неотъемлемая проблема ИИ. А точнее, это – проблема ассоциативного мышления, где роль логических нейронных сетей несомненна.

Имитацию образного мышления, способность создания видео-аналогий исследуемого процесса, не просто иллюстрирующих, но моделирующих, и следует считать воплощением когнитивного мышления.

Например, при поиске оптимального плана выполнения частично- упорядоченных работ, "в голове" исследователя возникает множество аналогов-брусочков, связанных верёвочками, относительное смещение которых ограничено по оси времени. Усилием воображения эти брусочки сдвигаются так, чтобы уложиться в оптимальное расписание для данного количества исполнителей за минимальное время. Повторяя эти попытки многократно, исследователь выявляет и формулирует то решающее правило, которое, будучи применённым бессознательно, привело к успеху. Сформулированное правило дополнило базу знаний.

Таким образом, переход к видео-абстракциям – основная задача когнитивной графики на пути индуктивного обретения новых знаний.

Стараясь приблизить ИИ к точной науке, мы должны следовать точным определениям.

Что мы понимаем под абстракцией, абстрактным мышлением, позволяющим операровать образами?

По-видимому, это выделение главных свойств объектов или их взаимодействия, которые можно изобразить (!) на основе известных аналогий из базы знаний.

Даже художник, изображающий натуру (см. эпиграф), наносит мазок, согласуясь со своим абстрактным представлением. Мы восхищаемся искусством Чурлёниса или великих французских импрессионистов, искренне понимая и то, что мы этого достойны, мы способны правильно реагировать, мы достаточно высоко организованы.

Почему в Ереванском музее абстрактного искусства, успешно функционировавшем в эпоху социалистического реализма, мы равнодушно проходим мимо массы картин, и вдруг!.. Какие наши душевные и абстрактно воспроизведённые струны сработали в унисон? И мы возвращаемся, чтобы постоять, пережить...

Можно ди без постоянного наполнения базы знаний перейти к чувственному восприятию аналогий? В детском садике ребёнок учится изображать солнышко, маму, небо, лошадку...

Конечно, здесь действуют ограничивающие каноны. Наблюдательный, восторгающийся лошадьми ребёнок радостно спешит домой, чтобы запечатлеть новую увиденную деталь. Но наталкивается на необъяснимое, ласковое замечание отца: "Не надо это рисовать". Так начинается его знакомство с этическими возможностями.

Много аналогий на пути абстрагирования можно привести относительно музыки. Это, как отдельный мир, отдельная тема, которую также вряд ли возможно поднять на этих страницах. Можно вспомнить в числе первых кибернетических опытов конца 50-х – начала 60-х годов музыкальную работу "Уральские напевы", где на ЭВМ "Урал" Р.Х. Зарипов успешно применил известные правила композиции. Случайно вырабатываемые мелодии получались вполне приемлемыми на не слишком притязательный вкус. Но мы понимаем, что на таком наивном уровне все чувственные секреты музыки не раскрыть.

Другой важной проблемой рассматриваемой "горячей точки" является "живое" моделирование. Продолжая логическую цепочку воспроизведения интеллекта, следует спросить, а что является вершиной его воплощения? Конечно же, живое существо или, научно, - реагирующий объект. Ведь идеалом робототехники является максимальная степень реализации механизмов жизни.

Находясь в сфере точной науки, следует руководствоваться точными определениями. Какой объект следует считать живым?

  1. Живое существо адекватно реагирует на внешние раздражители.
  2. Адекватность реакции живого существа подчиняется критерию "хорошо – плохо".

Считая достаточными положения 1 и 2, мы понимаем, что желательно достичь такого уровня обучения, когда система сама начинает осознавать, что хорошо, а что плохо на основе индуктивного и дедуктивного мышления.

Однако задача "живого" моделирования актуальна в более широкой постановке.

Управление сложными системами с возможным участием операторов и диспетчеров предъявляет высокие требования к динамическому отображению их состояния для оперативного анализа ситуации и принятия решений. Задача оператора значительно усложняется в случае территориальной разобщённости средств системы, превращаясь в задачу многоуровневого контроля и диагностики. Возникает необходимость интеллектуальной надстройки всей системы отображения, контроля и принятия решений, производящей оперативную первичную обработку многообразной регистрирующей, отображающей и управляющей информации для предварительного, грубого отображения происходящего процесса. Задачей такого предварительного, поверхностного отображения является выяснение того, протекает процесс в пределах нормы, грозит ли уход за эти пределы, установление факта и причин тревоги и т.д.

Отображение должно быть наглядным, не требовать постоянных кропотливых усилий операторов, доступным и понятным широкому кругу наблюдателей, бесспорным и образным. Важна и эстетическая составляющая. Это и приводит к целесообразности использования реагирующих объектов – моделей живых существ или других "оживляемых" образов, по поведению которых можно судить о состоянии сложной системы.

Информацией для реагирующего объекта является чрезвычайно большое количество данных разнообразной природы и типов. Задача осуществления реакции становится трудноформализуемой. Её решение возможно только с применением средств искусственного интеллекта. Множество зависимостей вида "если – то" в основе решения этой задачи приводит к выводу о целесообразности применения логических нейронных сетей.

Таким образом, на вход реагирующего объекта подаётся большое число разрозненных или связанных показателей состояния сложной системы, определяющих факторное пространство. Эти показатели разбиты по характеру влияния на значимые интервалы, отдельные объекты, дискретные значения или булевы переменные (вида "есть – нет"), позволяющие оценить достоверность значения каждого фактора, что может быть использовано для возбуждения рецепторного слоя нейросети. На основе накапливаемого опыта, экспертных оценок или теоретических исследований строится обученная, развиваемая в процессе эксплуатации, логическая нейронная сеть – основа поведения реагирующего объекта.

Модели реагирующих объектов могут быть трёх типов:

  • Натурная модель, выполненная, в частности, в соответствии с известными технологиями робототехники или театра кукол;
  • Компьютерная (электронная) модель, использующая графические технологии – двумерные и трёхмерные;
  • Компьютерная (электронная) модель на основе клип-технологий.

Все три типа моделей предполагают связь нейронов выходного слоя с соответствующими программами (процедурами) имитации реакции объектов на ситуацию по принципу ассоциативного мышления. При этом величина возбуждения нейрона выходного слоя служит основным параметром соответствующей программы, определяющим реакцию. Этим обеспечивается возможность совмещения различных реакций, дающих некоторую результирующую.

Помимо актуальной задачи интеллектуального отображения в сложных управляющих системах, применение реагирующих объектов может быть значительно более широким. Это – системы развлекательные, игровые, демонстрационные, рекламные, медицинской и технической диагностики, экологического прогнозирования и предупреждения, контроля несанкционированного доступа к данным и другие системы искусства, науки, техники, бизнеса.

< Лекция 5 || Лекция 6: 1234 || Лекция 7 >