Московский государственный университет путей сообщения
Опубликован: 12.09.2011 | Доступ: свободный | Студентов: 3880 / 394 | Оценка: 4.67 / 4.33 | Длительность: 18:55:00
Специальности: Программист
Лекция 3:

Система принятия решений на основе математической логики событий

< Лекция 2 || Лекция 3: 123 || Лекция 4 >

"Схемотехническое" представление системы принятия решений

Отобразим (c нарушением некоторых стандартов) схемотехнически бабушкину СПР, подобно электронной схеме (рис.3.4) с помощью конъюнкторов и дизъюнкторов. На вход будем подавать значения истинности переменных-высказываний (ситуации) так, чтобы на одном из выходов формировалась единицазначение истинности соответствующего решения. Задавать значение ситуаций следует корректно, чтобы соблюдать требования вхождения переменных в исчерпывающие множества событий .

"Электронная" схема системы принятия решений

Рис. 3.4. "Электронная" схема системы принятия решений

Реализовав эту схему на логических элементах, бабушка получит реальное средство подсказки: что она должна делать в данное время года и суток.

Например, бабушка хочет вспомнить, чем она должна заниматься летом после обеда. Она полагает x_2 = x_5 = 1 при нулевых значениях других переменных и запускает программу, моделирующую работу электронной схемы. На выходе R_3 формируется сигнал, соответствующий высказыванию "Верховая езда".

Электронная схема, имитирующая систему принятия решений, требует корректного задания исходной информации, т.е. корректной формулировки вопроса в соответствии со смыслом задачи. Одновременно должна существовать уверенность в получении единственного решения, в том числе предполагающего задание альтернативных вариантов, если это предусмотрено при построении СПР. В таком случае окончательный выбор альтернативы может быть предусмотрен при развитии системы, при анализе новых вводимых факторов. При некорректной формулировке вопроса возникнут коллизии, неоднозначные или неправильные выводы. Таким образом, СПР может отвечать только на те вопросы, на которые она настроена.

Достоверность высказываний о событиях

Говоря о высказываниях как о логических переменных, мы, несомненно, предполагаем наличие субъективного фактора: ведь это кто-то сказал. И мы говорим верному другу: "Я мало доверяю этому человеку, но он сказал …, а дыма без огня не бывает".

Очевидно, недостаточно резких, кардинальных, взаимоисключающих, крайних суждений о высказываниях, подразделяющих их на истинные и ложные. Жизненный опыт говорит, что стопроцентной правды не бывает.

Таким образом, необходимо ввести понятие достоверность высказывания, которая идеально представляет вероятность того, что данное высказывание о свершении события истинно, т.е. представляющая его логическая переменная равна 1.

В этой оценке достоверности вновь практически преобладает субъективный фактор. Поэтому при построении экспертных систем применяется двойная оценка: оценка, данная экспертом по запросу, и вес самого эксперта. Здесь эффективно используется аппарат нечетких множеств.

Говоря о сложных высказываниях, отображаемых деревьями логических возможностей , тем более трудно судить о достоверности высказывания о событиях , особенно тех, которые отображаются концевыми вершинами.

Рассмотрим пример. Информатор сообщает Агенту о том, что видел своими глазами, как Марина передала Васе пачку денег. Напрягая богатый опыт, Агент рассуждает логически:

  1. Насколько можно доверять Информатору, который три дня не брился и от которого дурно пахнет?
  2. Мог ли находиться Информатор в это время в нужном месте, чтобы "видеть своими глазами"?
  3. Насколько верно то, что в переданной пачке были деньги?
  4. Можно ли оперативно воспользоваться существующими математическими методами оценки (например, аппаратом нечетких множеств) заодно учитывающими другие факторы, как, например, личные финансовые затруднения, или необходимые оценки следует выполнить интуитивно, "с потолка"?
  5. Так какова же должна быть формулировка отчета в Центр, для получения максимального вознаграждения за поимку взяточника?

Таким образом, видно, что оценка достоверности высказываний неизбежна, но представляет значительные практические трудности, тем более, — при требуемой оперативности этих оценок, столь важной в реальных системах управления и принятия решений.

Итак, на основе алгебры высказываний можно создавать электронные системы принятия решений: на входе задавать ситуацию, на выходе получать указание на правильную реакцию. Все дело лишь в интерпретации предметной области – во вскрытии причинно-следственных связей, в исследовании личного или коллективного опыта, в изучении теории. Необходимы и схемотехнические навыки запоминания связей.

Однако смущают два обстоятельства:

  1. Неопределенность исходной информации о ситуациях, исключающая точный ответ на вопрос о наличии или отсутствии события и делающая неправомерным использование исключительно булевых переменных. Высказывания не бывают истинными и ложными, как это предполагается в классической математической логике. Высказывания оцениваются своей достоверностью, которая принимает действительные значения на отрезке [0, 1], и подчиняется известным положениям теории вероятности.
  2. Способность человека логично мыслить на неформальном уровне не реализуется с помощью конъюнкторов и дизъюнкторов в составе мозга. Именно вскрытие механизмов мышления, особенно того, которое мы называем рефлекторным, привлекает внимание исследователей. Необходимо искать механизмы мышления, оперирующие не с булевыми переменными, а с действительными, несущими смысл достоверности.

Пусть рассмотренные выше переменные-высказывания {x_i}, образующие факторное пространство, могут принимать значения достоверности {P_i}, 0 \le P_i  \le 1,\ i = 1, …, M.

Так как факторное пространство формируется на основе исчерпывающих множеств событий , то внутри каждого такого множества выполняется известное правило нормировки: сумма достоверностей событий каждого такого множества равна единице.

Перегруппируем события и дополним дерево логических возможностей , представленное на рис.3.1, указав на его ветвях (стрелках), в качестве весов этих ветвей, значения достоверности событий (рис.3.5). Получим вероятностное дерево логических возможностей.

При организации ветвления в этом дереве также предполагаются все возможные альтернативы, т.е. исчерпывающие множества событий . Поэтому сумма вероятностей всех событий, отображаемых вершинами, которые связаны входящими стрелками, исходящими из некоторой вершины, равна единице.

В отличие от дерева логических возможностей , вероятностное дерево явно отображает зависимость событий. События, зависимые от данного, отображаются более низкими уровнями ветвления. Такая зависимость определяется на уровне смыслового анализа факторного пространства.

Вероятностное дерево логических возможно

Рис. 3.5. Вероятностное дерево логических возможно

Например, логично предположить, что формы труда, отдыха и спортивных развлечений зависят от времени года, затем, — от распорядка приема пищи. Такая зависимость и отображается на рис.3.5.

Тогда достоверность событий формируется с помощью условных вероятностей, зависящих от путей, по которым достигаются эти события. Поэтому на вероятностном дереве логических возможностей целесообразно повторять вершины одного смыслового содержания, в результате чего размножаются варианты ветвления, а дерево существенно разрастается. От совмещения путей страдает наглядность, и не более того.

Чтобы найти вероятность некоторого события b при условии свершения события а (событию а может соответствовать корневая вершина, тогда речь идет о полной, а не условной вероятности), необходимо найти все пути, ведущие из a в b. По каждому пути необходимо перемножить все веса ветвей. Полученные по всем путям произведения необходимо сложить.

Пример 1. Найдем вероятность того, что отдыхающий весной и летом в произвольно выбранный момент времени совершает прогулку верхом:

0,25\times0,33\times0,5\times0,4 + 0,25\times0,33\times0,3 = 0, 04125.

Пример 2. Найдем вероятность того, что в произвольно выбранный момент времени в течение года отдыхающий совершает прогулку верхом:

0,25\times0,33\times0,5\times0,4 + 0,25\times0,33\times0,3 + 0,25\times0,33\times0,2 = 0,05775.

Система принятия решений на основе достоверности высказываний о событиях

Чтобы придать данному разделу самостоятельный характер, вновь повторим построения, рассмотренные в разделе 2.3.

Изменения, внесенные в дерево логических возможностей и представленные на рис.3.5, отобразим в электронной схеме системы принятия решений, представленной на рис.3.4. Теперь исходными данными (рис.3.6) для конъюнкторов и дизъюнкторов, принимающих эти данные, становятся не булевы, а действительные значения, для которых логические операции не определены. Так перейдем к понятию нечеткой логики.

Система принятия решений на основе достоверности событий

Рис. 3.6. Система принятия решений на основе достоверности событий

Следуя далее по пути приблизительных оценок (ибо практически достоверность, как категория теории вероятностей, принадлежит области весьма приблизительных оценок), разработаем некоторый суррогат операций конъюнкции N_1 и дизъюнкции N_2 на основе передаточной функции или функции активации некоторого порогового элемента. Этот элемент преобразует сумму входных величин в выходные значения, которые приближенно "напоминают" результаты упомянутых логических операций. Данный путьпуть ухода от точного выбора решения в сторону выбора решения на основе степени похожести ситуаций на уже известные, — путь ассоциативного мышления . Так мы перейдем к рассмотрению тех нейроподобных элементов, что реализованы в природе!

Существует множество вариантов подбора пороговой передаточной функции, или функции активации, лежащей в основе такого элемента.

Введем сквозную нумерацию всех узлов схемы, реализующих дизъюнкцию и конъюнкцию. Пусть i – номер такого узла, j – номер входа этого узла при количестве тi активных входов (в данном примере каждый узел имеет два входа), \omega_jвес входа. Тогда простейшая функция активация (обратите внимание: наши помыслы сосредоточены на нейроне!) f_i, реализуемая i-м узлом для замены логических операций конъюнкции и дизъюнкции, имеет вид

f_i = \begin{cases}
\sum \limits_{j=1}^m {V_j \omega_{i},\ &если \sum \limits_{j=1}^{m_i} {V_j \omega_{j} - h \ge 0\\
0,\ &в\ противном\ случае
\end{cases} ( 3.6)

Здесь f_j — величина сигнала, поступающая на j-й вход.

Тогда элемент N_1, подобный конъюнктору, может быть реализован при \omega_j = 1/m_i,  j =1, …, m_i, с помощью существенно высокого порога (рис.3.7), где значение \delta_i обусловлено некоторой поправкой, достаточной, чтобы для преодоления порога сигналы возбуждения с большой степенью уверенности поступали обязательно по всем входам.

Элемент N1

Рис. 3.7. Элемент N1

На этапе настройки и верификации СПР предполагается, что входные сигналы — булевы переменные, принимающие значения 0, 1. Тогда целесообразно выбрать значение \delta_i < 1/m_i. Очевидно, что для того, чтобы преодолеть порог, на всех входах должны быть "1"; недостаток хотя бы одной "1" приведет к тому, что сумма поступивших сигналов будет более чем на 1/m_i меньше указанной суммы весов.

При переходе к действительным переменным, когда вместо событий рассматриваются, например, лишь предполагаемые вероятности их наступления, экспериментальное уточнение значения \delta_i может обусловить ту границу, когда считаться с возможностью данной комбинации событий нецелесообразно.

Элемент N_2, подобный дизъюнктору, реализуется, наоборот, при низком значении порога и при \omega_j = 1, j = 1, …, m_i (рис.3.8). Порог выбирается так, чтобы уже при возбуждении на одном входе возникал сигнал возбуждения на выходе. При этом если дизъюнкция задана на исчерпывающем множестве событий , как это чаще всего бывает (рис.3.4), сигнал на выходе не превышает "1", а значение \delta_i выбирается экспериментально достаточно малым.

 Элемент N2

Рис. 3.8. Элемент N2

Задав на входе СПР значения достоверности переменных-высказываний и рассчитав значения на выходах пороговых элементов, на выходах схемы получим некоторые значения. Максимальное из этих значений "голосует" в пользу соответствующего решения.

Предложения, касающиеся создания пороговых элементов N_1 и N_2, носят лишь рекомендательный характер. Здесь неограниченный простор для творчества.

Напомним, что корректность задания исходной информации (соблюдение условия нормировки на исчерпывающих множествах событий , оценки достоверности с помощью вероятностного дерева логических возможностей ) гарантируют практически приемлемый результат. Если же на входах задавать что угодно, то СПР преобразует это в какую угодно рекомендацию по принципу: "каков вопрос — таков и ответ".

На рассмотренном жизненном примере проанализируем принимаемые бабушкой решения на основе двух вариантов СПР: с помощью электронной схемы (рис.3.4), использующей определенность знания о ситуации, и с помощью схемы, основанной на неопределенности, на предполагаемой достоверности этих знаний (рис.3.6). Положим (на основе интуиции) \delta_i= 0,3 для всех i.

Данные сведены в таблицу 3.1.

Таблица 3.1. Сравнительные оценки получаемых решений
Переменные Решение по электронной схеме Решение на основе достоверности событий
x_1 (P_1) x_2 (P_2) x_3 (P_3) x_4 (P_4) x_5 (P_5) x_6 (P_6) x_7 (P_7)
1 1 R_1 R_1
1 1 1 R_3 R_3
1 1 Нет решения Нет решения
0,8 0,2 0,4 0,5 Решение не определено R_2
0,2 0,4 0,6 1 0,5 Решение не определено R_2

Более точный выбор значения \delta_i производится на этапе верификации СПР по известным вариантам нахождения решения. В данном случае представляется, что этот выбор произведен успешно.

< Лекция 2 || Лекция 3: 123 || Лекция 4 >
Кирилл Артамонов
Кирилл Артамонов

"Тогда как задать возбуждение рецепторов, если инспектор точно установил, что скорость автомобиля при наезде на пешехода была равна 114 км/час?
По-видимому, он рассуждает на основе близости скорости к границам указанного интервала: "Достоверность того, что скорость автомобиля составляет 100 км/час, я найду как (114 – 100):(120 – 100), а достоверность того, что скорость автомобиля составляет 120 км/час, я найду как (120 – 114):(120 – 100). Следует обратить внимание на то, что сумма найденных достоверностей равна единице."

Вопрос по расчёту скорости и сумме достоверности: этот математический (приведенный выше в виде контекста из материала лекции 1, страницы 3) метод справедлив к скоростным показателям выходящим за рамки диапазона 100-120. 
То есть, практически применяв к расчёту, скорости из диапазона 114-155, к диапазону 100-120, получал в результате суммирования достоверностей единицу.
Это похоже на то, как я видимые разные скоростные показатели своим рецептором, буду воспринимать линейно с помощью одного диапазона, так как он универсален. 
Правильно ли это ? 
И как манипулировать данными показателями, если есть универсальный диапазон, по результату выводящий в сумме постоянно единицу на разных скоростных показателях стремящегося.

Владислав Гладышев
Владислав Гладышев

А как проходить курс ? я же могу прямо сейчас все лекции прочитать и здать экзамен, к чему там даты ?