Нижегородский государственный университет им. Н.И.Лобачевского
Опубликован: 26.04.2007 | Доступ: платный | Студентов: 0 / 0 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00
ISBN: 978-5-9556-0072-7
Специальности: Математик
Лекция 3:

Устойчивость и эффективность поведения сторон: принцип максимума гарантированного результата

< Лекция 2 || Лекция 3: 12 || Лекция 4 >
Аннотация: Сравнение стратегий. Принцип максимума гарантированного результата. Лексикографически упорядоченные критерии.

Проблема сравнения стратегий

Вернемся к рассмотрению описанного выше примера и рассмотрим вопрос о выборе стратегии, которую целесообразно использовать первой стороне для подготовки к участию в конкурсе. Очевидно, что формирование представления о лучшей стратегии x_{1}^{*} стороны P1 предполагает либо возможность определения лучшего варианта для любой пары стратегий x'_{1}, x''_{1} этой стороны, либо возможность установления равноценности стратегий, входящих в эту пару. Однако на множестве стратегий стороны P1 не существует отношения предпочтения, позволяющего ответить на эти вопросы для любой пары x'_{1}, x''_{1}.

Проиллюстрируем это важное обстоятельство путем сравнения уровней эффективности, обеспечиваемых соответственно стратегиями x1=0 и x1=1. Согласно (1.19) и (1.20),

\text{M}_1(x_1,x_2,t)=(x_1-x_2)(t-1), ( 2.1)
откуда вытекает, что
\Delta_1(x_2,t)=\text{M}_1(x_1=0,x_2,t)-\text{M}_1(x_1=1,x_2,t)=1-t ( 2.2)
и, следовательно, \Delta_1(x_2,t)>0,\, 0\le t < 1; \quad \Delta_1(x_2,t)<0,\, 1<t\le 2;

и, \Delta_1(x_2,1)=0 (см. рис. 1.2).

Таким образом, при неизвестном состоянии природы стратегии x1=0 и x1=1 оказываются несравнимыми.


Рис. 1.2.

Следовательно, введенная в модели упорядоченность всех исходов операции, с помощью которой мы описали интересы первой стороны, не порождает полного отношения предпочтений на множестве стратегий этой стороны. Причина состоит в том, что неопределенность значения параметра t вызывает неопределенность самого исхода. Поэтому возможность оценки эффективности конкретной стратегии, которая необходима для определения наилучшего выбора, оказывается фундаментально связанной с информированностью стороны о состоянии природы и (в общем случае) о действиях другой стороны.

Принцип максимума гарантированного результата

Как следует из предшествующего рассмотрения, для обеспечения сравнимости стратегий принципиально необходимо принять некоторую гипотезу о неизвестном состоянии природы. В рассматриваемом примере вся имеющаяся у стороны P1 информация о сроке t проведения конкурса сводится к знанию интервала [0, 2], заведомо содержащего этот неизвестный срок. В связи с указанной неопределенностью состояния природы, в качестве оценки эффективности любой стратегии можно принять тот уровень эффективности, который гарантируется использованием этой стратегии.

Замечание 1.7 (об ориентации на худший случай). Фактически, принятие гарантируемого стратегией уровня эффективности в качестве оценки, на которой будет основано сравнение этой стратегии с другими, означает ориентацию на худший случай.

Принятие такой оценки в качестве прогноза результатов планируемых действий является рекомендацией, основанной на обширном опыте принятия решений в практической деятельности. К этому "правилу худшего случая" приходят многочисленные исследователи опыта принятия решений, относящегося к самым различным областям человеческой деятельности. Приведем несколько примеров.

Известный американский специалист в области создания больших программных систем Ф.П. Брукс отмечает, что "наши методы оценки весьма несовершенны. Строго говоря, они отражают некоторое неявно высказываемое и в корне неверное допущение, что все будет идти хорошо, ... выполнение каждого задания займет ровно столько времени, сколько оно "должно" занять". И далее: "Планируйте неудачу: она вас, так или иначе, найдет1Брукс Ф.П. Как проектируются и создаются программные комплексы. М.: Наука, 1978. ".

Можно даже говорить о возникновении своего рода "фольклора", вызванного к жизни необходимостью ориентации на худший случай в практике принятия решений. К числу таких новых жанров относятся, например, так называемые "законы Мэрфи2См., например, Хьюз Дж., Мичтом Дж. Структурный подход к программированию. М.: Мир, 1980. ":

  • Все сложнее, чем кажется.
  • Все тянется дольше, чем можно ожидать.
  • Все оказывается дороже, чем планировалось.
  • Если что-то может испортиться, оно обязательно испортится.

По поводу этих законов некто Каллаген сделал следующее замечание3См. там же. "Мэрфи был оптимистом". Действительно, например, второй из "законов" неявно предполагает, что планируемая работа, в конце концов, все-таки завершится. Но этого успешного завершения может и не быть. В книге Дж.Фокса4Фокс Дж. Программное обеспечение и его разработка. М.: Мир, 1985. сообщается, что "военно-воздушные силы США затратили более 300 млн. долларов на тщетную попытку автоматизировать комплексную систему перевозок и снабжения".

Вернемся к рассматриваемому примеру и построим оценку эффективности, которую гарантирует стратегия x1 стороны P1 при неизвестном сроке t проведения конкурса. Эта оценка худшего случая, очевидно, определяется величиной

M_1(x_1,x_2)=\min\{\text{M}_1(x_1,x_2,t):0\le t\le 2\}. ( 2.3)
Подставляя в (2.3) правую часть выражения (2.1) для функции \text{M}_1(x_1,x_2,t), приводим оценку (2.3) к виду
$$\min_{0\le t\le 2}(x_1-x_2)(t-1)=\min_{0\le t \le 2}
\left\{\begin{aligned} |x_1-x_2|(t-1),\quad x_1\ge x_2\\ |x_1-x_2|(t-1),\quad
x_1\le x_2\\ \end{aligned} \right. $$ ( 2.4)
Теперь из (2.3), (2.4) следует, что
M_1(x_1,x_2)=-|x_1-x_2|, ( 2.5)
причем эта гарантированная величина реализуется либо в случае проведения конкурса в момент t*=0, либо в случае проведения этого конкурса в момент t*=2.

Первый случай соответствует ситуации, когда x_1\ge x_2, а второй - ситуации, когда x_1\le x_2, т.е.

M_1(x_1,x_2)=\left\{\begin{aligned} \text {M}_1(x_1,x_2,0),\quad x_1\ge x_2, \\ 
\text{M}_1(x_1,x_2,2),\quad x_1\le x_2.\\ \end{aligned} \right. ( 2.6)
Теперь проведем аналогичное рассмотрение, руководствуясь интересами второй стороны. Определим уровень эффективности, который может быть обеспечен стороне P2 выбором стратегии x2 при некоторой известной стратегии x1 первой стороны и неизвестном сроке проведения конкурса, т.е. вычислим величину
M_2(x_1,x_2)=\min \{\text{M}_2(x_1,x_2,t):0\le t \le 2\}. ( 2.7)
Из (1.20), (2.1) и (2.7) следует, что
M_2(x_1,x_2)=-|x_1-x_2|. ( 2.8)
При этом справедливо следующее соотношение, являющееся аналогом выражения (2.6)
M_2(x_1,x_2)=\left\{\begin{aligned} \text{M}_2(x_1,x_2,2),\quad x_1\ge x_2,\\ 
\text{M}_2(x_1,x_2,0),\quad x_1\le x_2.\\ \end{aligned} \right. ( 2.9)

Таким образом, согласно (2.5) и (2.8),

-1\le M_1(x_1,x_2)=M_2(x_1,x_2)\le 0. ( 2.10)

Следовательно, при ориентации обеих сторон на худший случай (т.е. при использовании ими оценок гарантированного уровня эффективности) противоположность интересов сторон, характеризуемая нулевой суммой критериев (1.21), сменяется ситуацией полного совпадения интересов.

< Лекция 2 || Лекция 3: 12 || Лекция 4 >
Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить?