Опубликован: 29.10.2019 | Уровень: для всех | Доступ: платный
Лекция 6:

Десять задач искусственного интеллекта по Д.А. Поспелову и возможности логических нейронных сетей

< Лекция 5 || Лекция 6: 1234 || Лекция 7 >

Порождение объяснений

Различие в механизмах поиска решений у человека, специалиста по решению определённого класса задач, и интеллектуальной системы приводит к появлению эффекта непонимания. Видя окончательный результат деятельности интеллектуальной системы, специалист не может оценить степень его достоверности (даже если система одновременно с решением выдаёт вычисленную ею оценку). Процесс "верить – не верить" не может привести к какому-либо разумному результату, если нет какой-то дополнительной информации. Эта информация, начиная с первого поколения экспертных систем, выдаётся специалисту по его требованию в виде объяснения.

Объяснение (термин "объяснение" прочно прижился в искусственном интеллекте, вместо слова "обоснование") может быть различным. Наиболее распространены как-объяснения и почему-объяснения. При как-объяснении система выдаёт пользователю информацию о процедуре получения решения, например, выдаёт ему всю трассу движения по дереву вывода. При почему-объяснении система включает в текст объяснения те основания, которые были использованы ею в процессе поиска решения. Другие типы объяснений (что-объяснения, зачем-объяснения и т.п.) пока в интеллектуальных системах практически не используются.

В начальный период развития экспертных систем объяснение порождалось жёсткими процедурами, связанными с наличием априорно заданного сценария объяснения, заполняемого конкретными сведениями в процессе поиска решения. Такой подход в какой-то мере годится для как-объяснений и несколько хуже подходит для почему-объяснений. Но он совершенно непригоден при необходимости порождения объяснений иных типов.

Ясно, что проблема генерации объяснений связана с наличием в памяти интеллектуальной системы концептуальных моделей предметных областей и энциклопедических знаний об особенностях этих областей. Для порождения объяснений нужны базы знаний энциклопедического типа.

Энциклопедические базы знаний отличны по своей структуре и назначению от проблемно-ориентированных баз знаний, применяемых в современных экспертных и других интеллектуальных системах. Организация знаний в энциклопедических базах, механизмы порождения текстов по запросам к ним требуют решения ряда проблем, относящихся к форме представления знаний в таких базах и принципам построения системы отношений на хранимых в них знаниях.

Далее будут рассмотрены возможности и примеры построения информационно-справочных систем на логических нейронных сетях, описывающих результаты моделирования или даже стратегии лечения. Выдаваемый по сложившейся ситуации (запросу) текст ответа может содержать все необходимые обоснования – и "как", и "почему". Таким образом, как энциклопедические, так и проблемно-ориентированные базы знаний могут быть успешно реализованы с помощью логических нейронных сетей.

При этом нейронная сеть должна быть открытой для модификации знаний, их уточнения и дополнения.

Однако такая модернизация нейронной сети должна производиться на основе оценки результатов её работы. Тогда, для обратной связи, должна существовать возможность параллельного получения правильных результатов для сравнения с теми, что даёт логическая нейронная сеть, или получения оценок возможного отклонения.

Выходит, что явное присутствие модели предметной области обязательно? Но следует спросить, а зачем она, нейронная сеть, тогда нужна?

Для ответа необходимо использовать исторический опыт. В конце 70-х, начале 80-х годов стало ясно, что создание суперЭВМ, удовлетворяющих требованиям к производительности со стороны сложных управляющих систем, на основе традиционных алгоритмов вычислений невозможно. Только средства ИИ, использующие "бесформульные" вычисления на основе табличной модели ассоциативного мышления, способны заменить громоздкие алгоритмические вычисления (вспомним "японский вызов") и, следовательно, решить проблему эквивалентной сверхвысокой производительности. (Человек – сложнейшая управляющая система выполняет самые разнообразные жизненные функции, много дней не считая даже сдачу в табачном ларьке.)

Следовательно, не говоря уже о трудноформализуемых задачах, логические нейронные сети универсально решают проблему достижения сверхвысокой производительности. Как же совместить "быструю" работу нейронной сети с трудоёмким контролем правильности?

Открываются две замечательные возможности, основанные на ситуационном управлении Д.А. Поспелова.

1. Модель ситуационного управления, основанного на табличном задании ситуаций и связанных с ними решений, органично сплетается с моделью логической нейронной сети на основе причинно-следственных связей вида "если – то". То есть, попросту реализуется логической нейронной сетью. Максимально упрощается процедура интерполяции промежуточных решений на основе усреднения высокого возбуждения нескольких нейронов выходного слоя. При этом для развития и коррекции нейросети применима вся теория ситуационного управления.

2. Однако более значительные перспективы связаны с возможностью построения самообучающихся систем управления. Здесь важным является традиционный характер функционирования сложных систем, когда в интервалах времени отсутствия запросов на обслуживание производится функциональный контроль. Пусть логическая нейронная сеть реализует таблицу, в смысле ситуационного управления содержащую ситуации (задаваемые достоверностью событий на рецепторном слое), по которым известны принимаемые решения (они закрепляются за нейронами выходного слоя). Таблица имеет некоторый текущий вид, сформированный в режиме обучения – предварительного или динамического. В рабочем режиме эта таблица используется для оперативного принятия решений. В случае отсутствия запросов на обслуживание система переходит в режим динамического обучения. А именно, случайным образом формируется запрос на обслуживание – случайная или подчиняющаяся некоторой стратегии ситуация. Логическая нейронная сеть на основе текущего вида указанной таблицы обрабатывает запрос и формирует решение. Эта же ситуация обрабатывается моделью предметной области, в результате чего находится точное решение, соответствующее данной ситуации. Если отклонение нейросетевого решения удовлетворяет требованиям точности, система приступает к анализу другой случайной (или стратегически обоснованной) ситуации. В противном случае нейросеть "доучивается": фиксируется входная ситуация (для этого производится закрепление или дополнение нейронов-рецепторов), выделяется нейрон выходного слоя для указания на точное решение и производится трассировка, связывающая причину со следствием. Лучше всего использовать для этого однослойные логические нейронные сети.

Таким образом, та условная таблица "ситуация – решение" развивается до насыщения, при котором возрастает уверенность в полном обучении системы.

Человеческая практика знает примеры таких самообучающихся систем. Одна из них обусловлена правилами стрельбы в артиллерии, где система "стреляющий + батарея" обучается на местности, трансформируясь в своей работе от трудоёмкой подготовки данных и пристрелки к переносу огня от поражённых целей или реперов (условных реальных целей, поражаемых не в боевых условиях). Замечательной командой по окончании каждой стрельбы является: "Стой! Записать…", по которой фиксируются пристрелянные установки по поражённой цели для дальнейшего использования при переносе огня.

Поиск релевантных знаний

Базы знаний в интеллектуальных системах используются в самых различных процедурах, связанных с вводом знаний, преобразованием и использованием их для поиска решений. Все эти процедуры требуют наличия механизмов, которые позволяли бы по тексту запроса к базе знаний найти в базе именно те знания, которые понадобятся для получения ответа.

В отличие от баз данных, для которых механизмы поиска ответов на запросы достаточно хорошо изучены, соответствующие проблемы для баз знаний пока ещё далеки от каких-либо эффективных решений. Известно, что основным механизмом реализации процедур поиска в базах знаний служит поиск по образцу, являющийся своеобразным видом ассоциативного поиска.

Но основной проблемой остаётся поиск ответа на вопрос: "Как сформировать образец по тексту поступившего запроса?".

Сложность этой проблемы можно проиллюстрировать на следующем простом примере. Пусть в систему введён текст: "Петя залез на стул, открыл дверцу заветного шкафа, достал конфеты и быстро, торопясь, съел несколько штук. Вечером мать, доставая конфеты для чая, посмотрела на Петю и сказала: "Странно. Конфет стало меньше". Петя густо покраснел".

Предположим, что интеллектуальная система должна ответить на вопрос: "Почему Петя покраснел?" На основании какой информации она сможет это сделать? Как мы сами отвечаем на подобные вопросы?

Проблема поиска релевантной некоторому тексту информации пока остаётся нерешённой. В этой области пока больше вопросов, чем ответов. Возможно, что появление энциклопедических баз знаний облегчит эту задачу.

Понимание текстов

Что значит понять текст? Ответ на этот вопрос, приемлемый в равной степени для лингвиста, психолога или философа, отсутствует. Феномен понимания во многом ещё остаётся загадочным. В интеллектуальных системах имеется способ уточнить интерпретацию этого термина. Можно, например, считать, что система понимает введённый в неё текст, если с точки зрения некоторого человека (или группы экспертов) она правильно отвечает на все вопросы, связанные с информацией, отражённой в тексте.

Логические нейронные сети отвечают на вопрос: "На что более всего похож предъявляемый образ, и какие ассоциации с этим связаны?" Но в этом и заключается задача понимания текста!

Исследуя процесс понимания абстрактного, формализованного изображения человеческой мысли, каким является текст, надо вскрыть исторические корни необходимости и развития средств такого изображения.

Первобытный человек поступал прямо, с присущей ему непосредственностью. Он изображал мамонта – объект своих вожделений – на стене пещеры. Глядя на это изображение, особенно перед охотой, он возбуждал в себе сложную гамму чувств: красоты, ярости, восторга силы, любовной жертвенности, борьбы, надежды и уверенности в победе и, наконец, - возбуждающего обострения голода. Если включить воображение, можно увидеть, что все человеческие чувства можно стимулировать, глядя на одно лишь наскальное изображение мамонта, сцены охоты, битвы (не говоря уже о благотворном, регулярном – не менее одного раза в год – посещении Третьяковской галереи). Изначально чувственный подход лежал в основе изображения и формализации мысли. Именно этот подход и развивался с появлением письменности.

Первые опыты письма основывались на образности и постепенном абстрагировании. С помощью изображения зверюшек, птичек, рыбок и человечков, с нехитрыми связками, формировалась и отображалась мысль – запись события, назидания, любовного послания и т.д. Целью, прежде всего, являлось ассоциативное возбуждение чувственности.

Дальнейшая формализация пошла по пути абстрагирования при изображении мысли: слова-символы, отображающие объекты, стали отображать комбинациями условных элементов из некоторого их набора, что характерно, например, для клинописи. Это уже подавляюще действовало на чувственность, отодвигало непосредственное воздействие на неё, требовало хладнокровных познаний, образования. Фонетическое разложение звукового языкового изображения (применение букв – звуков) всё далее уводило человека от чувственных основ мышления, превращая его в сложную информационно-логическую машину, использующую абстрактные представления.

Возможно, те народы, которые оказались в стороне от бурной языковой формализации, сохранившие образность мышления и языка, условность восприятия, ассоциативность, значительно более продвинулись в развитии чувственности, в утончённости интеллектуальной организации? Что в большей степени и непосредственно влияет на чувственное восприятие, на эмоциональное состояние: буква или иероглиф? Может быть здесь, на пути сохранения и развития образности мышления, кроются истоки высоких достижений в области тонкого, фантасмагорического, многообразного и чувственного искусства? Или – предрасположенность и достижения в области высоких технологий и микроминиатюризации? Может быть народы, пошедшие по пути фонетического разложения мысли на составляющие буквы и звуки, притупили своё чувственное восприятие, стали "толстокожими" и чёрствыми, с глупой уверенностью проповедуя своё превосходство?

Понимая, что ИИ является моделью "естественного" интеллекта, необходимо сформулировать целевую функцию. Что означает – понимание текста?

Возбуждение чувственности? Выполнение приказа? Запись новой логической цепочки "причина – следствие", "если – то"? В любом случае это адекватное реагирование, и участие в этом логических нейронных сетей (как и самого мозга) несомненно.

Известны исследования по смысловой обработке текстов. Простейшие из них касаются текущей (в данный исторический период) частоты появления некоторых значительных, определяющих, знаковых, символических слов и выражений, могущих быть положенными в основу определённых выводов на базе исторического опыта.

Несомненно, высокая частота появления имени важного должностного лица, в сочетании с некоторыми другими словами, определённо влияет на настроение общества, воскрешая воспоминания о культе личности. Слова "реформирование армии", "дедовщина", "контрактник", "антитеррористическая операция" и др. напрямую влияют на высокую привлекательность платного высшего образования, аспирантуры и т.д. Так создаётся значительная составляющая для автоматизированного содействия эксперту-политологу, а также политтехнологу, при прогнозировании общественного развития.

Несомненно также пособничество логической нейронной сети в лексико-графическом анализе текстов для повышения уровня осмысленного перевода на другие языки.

Такая интерпретация связана с классификацией типов вопросов, которые, в свою очередь, определяют уровни понимания текста. На первом уровне все вопросы прямо связаны с предложенным текстом и ответы на них в явном виде содержатся в этом тексте. Если использовать вышеприведённый текст про Петю, съевшего конфеты, то вопросами первого уровня могли бы быть, например, следующие: "Куда залез Петя?" или "Что сказала мать?" Вопросы второго уровня требуют специального логически получаемого расширения текста. Ибо ответы на них в явном виде в тексте отсутствуют. Пример такого вопроса: "Почему конфет стало меньше?". Ответ на такой вопрос опирается на некоторую схему рассуждения. Третий уровень понимания связан с расширением текста за счёт привлечения релевантных знаний. Пример такого вопроса был приведён при обсуждении соответствующей проблемы. Но возможны и более высокие уровни понимания. Например, уровни, связанные с тем, что текст понимается не буквально, а метафорически. Особым случаем понимания текста является вычленение из него прагматической составляющей, некоторого руководства к действию. Такая интерпретация процесса понимания тесно связана с задачей планирования поведения на основе текстового описания условий и целей.

Какие ассоциативные механизмы предлагает логическая нейронная сеть для поиска релевантных (адекватных, соответствующих смыслу вопроса) знаний и, в частности, для логического объяснения необходимости наказания Пети-сладкоешки?

Пусть любящая мама, руководствуясь высокими современными требованиями к естественному интеллекту, использует широко рекламируемую базу знаний МОЯ СЕМЬЯ, предварительно адаптировав и заполнив её актуальными данными, а также логическими причинно-следственными связями и даже скорректированными весами. Несомненно, мама "ведёт" свою базу знаний, отслеживая условия жизни и семейные обстоятельства. Рассмотрим фрагмент этой базы знаний (рис. 6.1).

Фрагмент базы знаний МОЯ СЕМЬЯ

увеличить изображение
Рис. 6.1. Фрагмент базы знаний МОЯ СЕМЬЯ

В логической нейронной сети на входном, рецепторном слое отображены все действующие лица, предметы и даже обстоятельства. Нейронная сеть использует обратные связи, что развивает представление о рецепторном слое, т.к. установившееся возбуждение нейронов в данном случае двух слоёв вносит свой вклад в решение.

Первоначально мама, обнаружив недостачу и не сомневаясь в совершении шкоды, сообщает значительное возбуждение нейрону "Шкода". Однако сообщённая величина возбуждения, соответствующая предполагаемой достоверности события всё же меньше единицы, т.к. мама самокритична, и по забывчивости могла сама съесть те конфеты.

Так как шкодливыми членами семьи являются Петя и Кот Вася, мама определяет их участие по принципу "фифти-фифти", полагая равными 0,5 величины возбуждения нейронов "Петя" и "Кот Вася". Но факт, что конфет стало меньше, и мама максимально, до единичного значения, возбуждает нейрон "Конфеты".

Целесообразно, во избежание коллизии, исследовать только одно происшествие. Другое происшествие, например, связанное с оборванной занавеской, скорее всего, Котом Васей, мама собирается исследовать потом.

Мама "топает" мышью, запуская нейросеть. В соответствии с потактовой работой модели нейронной сети, рассчитываются значения возбуждения нейронов 1 – 5. Максимально возбуждается нейрон 1, обуславливая необходимость произнесения фразы, соответствующей первому этапу дознания. С помощью отрицательной обратной связи \text{"нейрон} 1 \to \text{"Кот Вася"} уменьшается значение возбуждения нейрона "Кот Вася", принижая роль Кота Васи в данном происшествии. Так как укоризненное замечание высказано, наступает второй этап дознания. С помощью положительной обратной связи максимально возбуждается нейрон "Укор Пете". Чтобы не допустить зацикливание на этом этапе дознания, с помощью отрицательной связи \text{"Укор Пете"} \to \text{нейрон 1"}, исключается повторение высокого возбуждения нейрона 1. Теперь максимального возбуждения достигает нейрон 3, связанный с заявлением "Петя густо покраснел". Обратная связь \text{"нейрон 3} \to \text{"Петя"} призвана повысить достоверность участия Пети в исследуемом происшествии, т.е. достоверность его вины.

Теперь осталось выяснить, каким образом Петя достал конфеты. Мама максимально, до единичного значения, возбуждает нейрон "Шкаф", и с помощью высоких значений возбуждения нейронов "Петя" и "Конфеты" максимально возбуждается нейрон 5, выдающий текст соответствующего объяснения.

Нейросеть, несомненно, отражает текущий исторический период, ибо, когда Петя вырастет большой, ему не надо будет вставать на стул, чтобы воровать конфеты из шкафа. Так что мама должна постоянно отслеживать течение жизни и корректировать базу знаний.

Использование обратных связей повышает актуальность фактора времени и требует перехода от статического, аналитического описания СПР с помощью системы логических выражений, приведённой выше, к представлению алгоритмической, логической схемы имитационного моделирования. И хотя представленная здесь схема по-женски не слишком последовательна, но, - жить можно!

Необходимо отметить, что рассмотренная логическая нейронная сеть, являясь средством принятия решений, не производит статический анализ текста. Однако следует предположить эффективность подобного логического вывода на основе анализа текста, о котором говорит Д.А. Поспелов.

< Лекция 5 || Лекция 6: 1234 || Лекция 7 >
Ирина Шевченко
Ирина Шевченко
Россия
Таня Михайлова
Таня Михайлова
Россия