НОУ ИНТУИТ | Модели поведения, восприятия и мышления. Лекция 5: Физиологические интерпретации формальной модели поведения

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 14.12.2009 | Доступ: свободный | Студентов: 1903 / 385 | Оценка: 4.28 / 4.12 | Длительность: 17:36:00

ISBN: 978-5-9963-0249-9

Тема: Искусственный интеллект и робототехника

Специальности: Программист, Системный архитектор

|

Вам нравится? Нравится 23 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Аннотация: В данной лекции рассматриваются аспекты схемы формирования и использования эмоций в процессе поведения и восприятия.

Ключевые слова: формальная модель, функция, Приращение, знание, прямой, компонент, выражение, значение, аналогия, механизмы, связь, интеграция

Мотивации и потребности

Введенная упрощенная формальная модель поведения допускает следующие физиологические интерпретации. Уже отмечалось, что если функция F(X) = 0 определяет границу области допустимых значений регулируемых переменных как поверхность второго порядка, то приращение целевой функции для -го варианта поведения равно

$\Delta Z_j=\sum_i K_i X_i U_i-K_j X_j V_j$

и общее локальное правило выбора управляющего действия преобразуется в правило

$\max\limits_j{K_j X_j V_j}$

Физиологические интерпретации этого правила выбора управляющего действия основаны на очень интересных экспериментальных результатах, полученных Н.В. Асмаяном и Г.А. Голицыным. Общая схема и результаты экспериментов были следующими. У собаки вырабатывалось знание о том, что в ответ на световой сигнал она может нажать на рычаг А или рычаг Б и получить соответственно порцию воды или порцию корма. Вырабатывались также знания о размерах (небольших) этих фиксированных порций. Размеры порций определяют скорости удовлетворения потребностей голода и жажды, обозначаемые ниже как V_1 и V_2 . Экспериментаторы научились измерять потребности и мотивации у собаки и определили, что мотивации линейно связаны с потребностями, т. е. m=кх , где - мотивация, - потребность.

Поведение собаки в эксперименте иллюстрирует рисунок 5.1.

Начальное состояние - точка Т_n - определяется начальными значениями мотивации голода m_1 и жажды m_2 . Собака в зависимости от начального состояния несколько раз подряд в ответ на световой сигнал нажимает на один и тот же рычаг и только ест или только пьет (движение точки, отражающей на рисунке состояние, параллельно оси m_1 или оси m_2 до тех пор, пока точка (m_1,m_2) не попадет на прямую m_1V_1=m_2V_2 . После

Рис. 5.1. Поведение собаки в эксперименте

этого поведение собаки изменяется - она ест или пьет в такой последовательности, что движение точки, отображающей состояние, происходит в скользящем режиме вдоль прямой m_1V_1=m_2V_2

Полученный экспериментальный результат требует ответа на вопрос: почему животное в ситуации выбора принимает решение и действует в соответствии с приведенным правилом, или в чем состоит приспособительный смысл такого поведения? Ответ не очевиден. Г.А. Голицын пытался привлечь для объяснения результатов эксперимента универсальную теорию управления В.Ф. Кротова, но убедительного результата не получил.

По-видимому, отсутствие содержательной интерпретации результатов экспериментов стало одной из причин того, что Н.В. Асмаян и Г.А. Голицын свою интереснейшую экспериментальную работу по определению принципов принятия решения животным в ситуации выбора не продолжили. Голицын, занимаясь поиском принципа оптимальности в поведении животных, пришел к принципу максимума информации. Кстати, этот принцип описанных экспериментальных результатов не объясняет.

Эти результаты можно объяснить на основе принципа maxT и рассмотренной нами упрощенной формальной модели поведения. Эксперимент показал, что в случае двоичного выбора между возможностями удовлетворения мотиваций голода и жажды поведение собаки хорошо согласуется с формулой выбора:

$\max\limits_j{m_j v_j} = \max\limits_j{K_j X_j v_j},\:\:\:\:\:\:j=(1,\ldots n)$

Правило выбора, полученное при решении формальной задачи для случая, когда граница области регулируемых переменных является поверхностью второго порядка, и правило выбора, экспериментально полученное в физиологическом эксперименте, совпадают. С учетом этого приращение целевой функции Z(X) можно выразить через мотивации:

$\Delta Z_j=\sum_i m_i Ui-m_j V_j$

Как мы уже отмечали, полученное для упрощенной задачи локальное правило выбора варианта поведения должно работать и в полной многоэкстремальной задаче. Это обеспечивается наличием уровней укрупнения и обобщения в строящейся в мозге модели проблемной среды. Реализация локального правила сравнения вариантов поведения, направленного на выполнение принципа maxT без определения и анализа всех точных далеко прослеживаемых возможных траекторий поведения, основана на получении оценок по шкале хорошо-плохо, т. е. на эмоциональном выборе.

Формулы эмоций

Эмоции складываются из многих компонент. Мы рассмотрим качественный смысл и формальное выражение некоторых из них применительно к приведенной выше упрощенной модели поведения. Поведение в общем случае должно сводиться к этой упрощенной одноэкстремальной модели. Поэтому представляется, что эмоции и в общем случае должны иметь тот же смысл и ту же структуру.

Во-первых, на общий эмоциональный фон влияет совокупное значение текущих потребностей. В плане решенной выше формальной задачи эта оценка определяется положением вектора первичных и вторичных потребностей внутри области допустимых значений, т. е. формулой, определяющей целевую функцию:

Во-вторых, на эмоциональный фон влияет соотношение необходимого и возможного. При решении приведенной формальной задачи было получено, что возможности управления (поведения) характеризуются величиной

$R=\sum_i\frac{U_i}{V_i}-1$

При R>0 и любом управлении система с течением времени выходит за пределы области допустимых значений параметров. Аналогия - ситуация, имеющая отрицательную эмоциональную окраску, определяемую тем, что живой организм не справляется с задачей управления, т. е. не может минимизировать потребности путем доступного ему поведения.

При $R\le0$ возможно управление, сколь угодно долго удерживающее систему в пределах области допустимых значений. Аналогия - ситуация, имеющая положительную эмоциональную окраску, определяемую тем, что живой организм справляется с задачами поведения, определяемыми потребностями и средой. Таким образом, знак и величина определяемые формулой, задают еще одну составляющую эмоции, а именно вторую составляющую общего эмоционального фона.

Таким образом,

$E_2=k_2R=k_2(\sum_i\frac{U_i}{V_i}-1)$

Количественным критерием оценки возможных шагов поведения (управления) с точки зрения улучшения или ухудшения состояния системы является величина ожидаемого приращения значения целевой функции $\Delta Z_j$ . Эта оценка сходна с эмоциональной оценкой живыми организмами возможных вариантов поведения в ситуации альтернативного выбора. Таким образом, третью составляющую эмоции можно условно определить как

$E_j=\Delta Z_j=m_j V_j-\sum_i m_i U_i$

Третья составляющая эмоции, так же как и вторая, может быть и положительной, и отрицательной. В положительную сторону действует мотивация и соответствующая ей потребность, удовлетворяемая в рассматриваемом альтернативном варианте поведения; в отрицательную - все остальные.

Переменные $\{X\}$ входящие в правила выбора действия и в формулы, определяющие первую, вторую и третью составляющие эмоций, естественно назвать "эмоциональными переменными".

Говоря об эмоциях в контексте принятия поведенческого решения в ситуации выбора, нужно подчеркнуть, что в данном случае речь идет лишь об эмоциональной оценке альтернативных вариантов поведения, а также и об оценке ситуации в целом, определяемой возможностью удовлетворения первичных и вторичных потребностей.

Таким образом, для упрощенной формальной модели поведения можно определить поведенческую составляющую эмоций как

Роль эмоций не исчерпывается принятием решения в ситуации выбора и планированием поведения. Эмоции участвуют также и в непосредственном управлении восприятием и поведением. Как в восприятии, так и в поведении большую роль играет прогноз или предвидение ситуаций в среде и ситуаций взаимодействия со средой. Это предвидение выражается открытым П.К. Анохиным и Е. Стреж принципом акцептора действия и рассматриваемым ниже акцептором восприятия. Совпадение реальной ситуации с акцептором (предвидением) сопровождается слабой положительной эмоциональной оценкой. Несовпадение предвидения с реальной ситуацией сопровождается отрицательной эмоциональной оценкой, приостановкой поведения и ориентировочно-исследовательской реакцией. Нарушение предвидения (акцептора) может сопровождаться эмоциональной переоценкой ситуации по всем приведенным выше критериям. Переоценка возможна как в положительную, так и в отрицательную сторону. Результатом эмоциональной переоценки может быть изменение поведения.

Кроме того, эмоциональные оценки возникают при формировании в нейронной сети, поддержании и гашении стабильных и кратковременных очагов возбуждения в процессе постановки и решения поведенческих и формальных задач мышления. Эмоциональные оценки динамически возникающих и гасящихся очагов возбуждения сопровождают восприятие произведений искусства. Эти вопросы еще будут обсуждаться в дальнейшем.

Таким образом, эмоциональная оценка живым организмом своего состояния, своих возможностей, вариантов поведения и ситуаций взаимодействия со средой очень многопланова. Выразить все это условной единой невычислимой формулой эмоций, как это делается в некоторых работах, конечно, можно, но не представляется полезным. Общая формула, объединяющая отмеченные компоненты, будет слишком громоздкой. Кроме того, выделенные выше составляющие эмоций проблему не исчерпывают.

Рассматриваемые аспекты схемы формирования и использования эмоций в процессе поведения и восприятия коррелируют с некоторыми существующими "поведенческими" определениями эмоций, введенными, например, П.К. Анохиным, Г.А. Голицыным, П.В. Симоновым и др. Однако существуют и иные аспекты. Один из них - мощные эмоциональные состояния, например, страх, горе, восторг, отчаяние. Мы уже отмечали, что Чарльз Дарвин считал такие экстремальные эмоциональные реакции атавизмом. Однако можно предположить, что подобные эмоциональные реакции также имеют приспособительный смысл и играют главным образом роль прерываний или блокировок механизма эмоционального выбора среди альтернативных линий поведения в ситуации, когда все действия бесполезны, не нужны или вредны, либо полезны только рефлекторные действия, например, замереть, бежать, кричать и т. п.

Есть еще один аспект эмоций, который иногда противопоставляют поведенческому. Этот аспект можно выразить, немного перефразируя Гумилева: "Все это так, но как же быть с зарею, которую ни съесть, ни выпить, ни поцеловать?". Можно также вспомнить, что почему-то приятно смотреть на пламя костра, морской прибой, приятна или неприятна музыка, абстрактная живопись.

Эти эмоциональные ощущения как и любые другие эмоциональные реакции, также должны иметь приспособительный смысл. Предположения о механизме и приспособительном смысле подобных, не имеющих очевидного поведенческого аспекта эмоциональных реакций, по-видимому, можно сформулировать только с учетом представлений о некоторых нейронных механизмах. Более того, думается, что "продвинутые" модели нейронных механизмов мозга с необходимостью должны объяснять подобные эмоциональные реакции.

Этот вопрос еще будет затрагиваться в следующих лекциях, однако существование не связанных с удовлетворением потребностей эмоциональных реакций дает возможность заранее, т. е. еще до рассмотрения моделей нейронных механизмов мозга, предположить следующее. Во-первых, работа нейронных механизмов мозга в процессе восприятия может получать эмоциональную оценку вне зависимости от смысловой (поведенческой) нагрузки восприятия, и эта оценка дополняет общую эмоциональную оценку состояния организма.Во-вторых, нейронные механизмы мозга могут работать в специфических, эмоционально оцениваемых режимах, определяемых характеристиками поступающих из среды входных воздействий. В-третьих, для таких воздействий среды чаще всего характерна ритмическая составляющая - музыка, прибой - и/или случайная ("шумовая") составляющая - прибой, свет костра.

На основании сказанного можно утверждать, что одной из отправных точек в исследовании нейронных механизмов мозга, включая исследование структуры и режимов работы нейронных сетей, и в конечном счете в построении теории работы мозга может быть исследование особенностей характеристик внешних воздействий, получающих не связанные с внешним поведением положительные и отрицательные эмоциональные оценки, и отражение этих особенностей на нейрофизиологическом уровне.

В частности, было бы интересно установить формальную связь между параметрами нейронов и структуры нейронной сети и гармоническими характеристиками музыки, экспериментально определить, чем отличается работа нейронов и нейронной сети при восприятии гармонии, мелодии, какофонии, диссонансов и т. п.

Интеграция оценок, строящихся в зависимости от значений эмоциональных переменных, и выбор варианта поведения происходит в эмоциональном центре нервной системы. Поведение в конечном счете направлено на максимизацию положительных и минимизацию отрицательных эмоциональных оценок. В животном мире управление поведением, основанное на локальных эмоциональных оценках, обычно работает правильно, реализуя направленность поведения на максимизацию времени существования, то есть выживание, особи и вида (махТ).

У человека в современном цивилизованном обществе с его широкими возможностями формирования и удовлетворения многочисленных не вполне естественных, а часто и вполне неестественных вторичных потребностей, это, к сожалению, не всегда так. Формирование расширенной области управления с добавлением неестественных эмоциональных переменных может приводить к получению неправильного результата управления поведением, то есть принцип maxT, реализуемый в искусственно расширенной области управления, может приводить к результату, в значительной степени не отвечающему задаче максимизации времени существования особи и вида.

Еще значительно хуже и опасней возможность непосредственного химического или электрического воздействия на эмоциональный центр. Такое воздействие может сопровождаться прямым получением положительных эмоций и иногда почти полностью нарушать работу эмоционального центра по управлению поведением. Иллюстрацией этого являются наркомания, а также известные классические эксперименты Экклза и других авторов, посвященные исследованиям самораздражения. В этих экспериментах животное может постоянно нажимать на рычаг, посылая через вживленный в мозг электрод идущие в эмоциональный центр электрические импульсы, и делает это до полного истощения, забывая обо всех других потребностях.

Выводы

Рассмотрение задачи поведения позволяет сделать ряд выводов:

Для живых организмов характерна накапливающаяся неустойчивость. Поэтому поведение - непрерывная задача. Живой организм должен быть постоянно активен.
Поведение подчиняется принципу оптимальности - maxT.
Поведение управляется локальными правилами принятия решения на основе эмоциональных механизмов сравнения и выбора вариантов.
Для решения задачи поведения необходимы умозрительное моделирование и предвидение.
Мозг решает многоэкстремальные задачи поведения за счет построения многоуровневой иерархической модели проблемной среды. С использованием этой модели в процессе мышления ищутся, оцениваются и сравниваются обобщенные и укрупненные одношаговые переходы между текущей и целевой ситуациями. (Этот вопрос еще будет подробно рассматриваться.)

Дальше >>

Авторизоваться

Модели поведения, восприятия и мышления

Физиологические интерпретации формальной модели поведения

Мотивации и потребности

Выводы

Вопросы и ответы