НОУ ИНТУИТ | Исследование операций и модели экономического поведения. Лекция 3: Устойчивость и эффективность поведения сторон: принцип максимума гарантированного результата

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Нижегородский государственный университет им. Н.И.Лобачевского

Опубликован: 26.04.2007 | Доступ: платный | Студентов: 0 / 0 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00

ISBN: 978-5-9556-0072-7

Тема: Математика

Специальности: Математик

|

Вам нравится? Нравится 24 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Аннотация: Сравнение стратегий. Принцип максимума гарантированного результата. Лексикографически упорядоченные критерии.

Ключевые слова: отношение предпочтения, состояние природы, операции, информация, принятия решений, структурный подход, ПО, гарантированный результат, параметр, лексикографическая упорядоченность, неравенство, значение, показатели качества, максимум

Проблема сравнения стратегий

Вернемся к рассмотрению описанного выше примера и рассмотрим вопрос о выборе стратегии, которую целесообразно использовать первой стороне для подготовки к участию в конкурсе. Очевидно, что формирование представления о лучшей стратегии $x_{1}^{*}$ стороны P₁ предполагает либо возможность определения лучшего варианта для любой пары стратегий $x'_{1}$ , $x''_{1}$ этой стороны, либо возможность установления равноценности стратегий, входящих в эту пару. Однако на множестве стратегий стороны P₁ не существует отношения предпочтения, позволяющего ответить на эти вопросы для любой пары $x'_{1},$ $x''_{1}$ .

Проиллюстрируем это важное обстоятельство путем сравнения уровней эффективности, обеспечиваемых соответственно стратегиями x₁=0 и x₁=1. Согласно (1.19) и (1.20),

$\text{M}_1(x_1,x_2,t)=(x_1-x_2)(t-1),$

( 2.1)

откуда вытекает, что

$\Delta_1(x_2,t)=\text{M}_1(x_1=0,x_2,t)-\text{M}_1(x_1=1,x_2,t)=1-t$

( 2.2)

и, следовательно, $\Delta_1(x_2,t)>0,\, 0\le t < 1; \quad \Delta_1(x_2,t)<0,\, 1<t\le 2;$

и, $\Delta_1(x_2,1)=0$ (см. рис. 1.2).

Таким образом, при неизвестном состоянии природы стратегии x₁=0 и x₁=1 оказываются несравнимыми.

Рис. 1.2.

Следовательно, введенная в модели упорядоченность всех исходов операции, с помощью которой мы описали интересы первой стороны, не порождает полного отношения предпочтений на множестве стратегий этой стороны. Причина состоит в том, что неопределенность значения параметра t вызывает неопределенность самого исхода. Поэтому возможность оценки эффективности конкретной стратегии, которая необходима для определения наилучшего выбора, оказывается фундаментально связанной с информированностью стороны о состоянии природы и (в общем случае) о действиях другой стороны.

Принцип максимума гарантированного результата

Как следует из предшествующего рассмотрения, для обеспечения сравнимости стратегий принципиально необходимо принять некоторую гипотезу о неизвестном состоянии природы. В рассматриваемом примере вся имеющаяся у стороны P₁ информация о сроке t проведения конкурса сводится к знанию интервала [0, 2], заведомо содержащего этот неизвестный срок. В связи с указанной неопределенностью состояния природы, в качестве оценки эффективности любой стратегии можно принять тот уровень эффективности, который гарантируется использованием этой стратегии.

Замечание 1.7 (об ориентации на худший случай). Фактически, принятие гарантируемого стратегией уровня эффективности в качестве оценки, на которой будет основано сравнение этой стратегии с другими, означает ориентацию на худший случай.

Принятие такой оценки в качестве прогноза результатов планируемых действий является рекомендацией, основанной на обширном опыте принятия решений в практической деятельности. К этому "правилу худшего случая" приходят многочисленные исследователи опыта принятия решений, относящегося к самым различным областям человеческой деятельности. Приведем несколько примеров.

Известный американский специалист в области создания больших программных систем Ф.П. Брукс отмечает, что "наши методы оценки весьма несовершенны. Строго говоря, они отражают некоторое неявно высказываемое и в корне неверное допущение, что все будет идти хорошо, ... выполнение каждого задания займет ровно столько времени, сколько оно "должно" занять". И далее: "Планируйте неудачу: она вас, так или иначе, найдет^{1Брукс Ф.П. Как проектируются и создаются программные комплексы.
М.: Наука, 1978.} ".

Можно даже говорить о возникновении своего рода "фольклора", вызванного к жизни необходимостью ориентации на худший случай в практике принятия решений. К числу таких новых жанров относятся, например, так называемые "законы Мэрфи^{2См., например, Хьюз Дж., Мичтом Дж. Структурный подход к программированию. М.: Мир, 1980.} ":

Все сложнее, чем кажется.
Все тянется дольше, чем можно ожидать.
Все оказывается дороже, чем планировалось.
Если что-то может испортиться, оно обязательно испортится.

По поводу этих законов некто Каллаген сделал следующее замечание^{3См. там же.} "Мэрфи был оптимистом". Действительно, например, второй из "законов" неявно предполагает, что планируемая работа, в конце концов, все-таки завершится. Но этого успешного завершения может и не быть. В книге Дж.Фокса^{4Фокс Дж. Программное обеспечение и его разработка. М.: Мир, 1985.} сообщается, что "военно-воздушные силы США затратили более 300 млн. долларов на тщетную попытку автоматизировать комплексную систему перевозок и снабжения".

Вернемся к рассматриваемому примеру и построим оценку эффективности, которую гарантирует стратегия x₁ стороны P₁ при неизвестном сроке t проведения конкурса. Эта оценка худшего случая, очевидно, определяется величиной

$M_1(x_1,x_2)=\min\{\text{M}_1(x_1,x_2,t):0\le t\le 2\}.$

( 2.3)

Подставляя в (2.3) правую часть выражения (2.1) для функции $\text{M}_1(x_1,x_2,t)$ , приводим оценку (2.3) к виду

$\min_{0\le t\le 2}(x_1-x_2)(t-1)=\min_{0\le t \le 2} \left\{\begin{aligned} |x_1-x_2|(t-1),\quad x_1\ge x_2\\ |x_1-x_2|(t-1),\quad x_1\le x_2\\ \end{aligned} \right.$

( 2.4)

Теперь из (2.3), (2.4) следует, что

( 2.5)

причем эта гарантированная величина реализуется либо в случае проведения конкурса в момент t^*=0, либо в случае проведения этого конкурса в момент t^*=2.

Первый случай соответствует ситуации, когда $x_1\ge x_2$ , а второй - ситуации, когда $x_1\le x_2$ , т.е.

$M_1(x_1,x_2)=\left\{\begin{aligned} \text {M}_1(x_1,x_2,0),\quad x_1\ge x_2, \\ \text{M}_1(x_1,x_2,2),\quad x_1\le x_2.\\ \end{aligned} \right.$

( 2.6)

Теперь проведем аналогичное рассмотрение, руководствуясь интересами второй стороны. Определим уровень эффективности, который может быть обеспечен стороне P₂ выбором стратегии x₂ при некоторой известной стратегии x₁ первой стороны и неизвестном сроке проведения конкурса, т.е. вычислим величину

$M_2(x_1,x_2)=\min \{\text{M}_2(x_1,x_2,t):0\le t \le 2\}.$

( 2.7)

Из (1.20), (2.1) и (2.7) следует, что

( 2.8)

При этом справедливо следующее соотношение, являющееся аналогом выражения (2.6)

$M_2(x_1,x_2)=\left\{\begin{aligned} \text{M}_2(x_1,x_2,2),\quad x_1\ge x_2,\\ \text{M}_2(x_1,x_2,0),\quad x_1\le x_2.\\ \end{aligned} \right.$

( 2.9)

Таким образом, согласно (2.5) и (2.8),

$-1\le M_1(x_1,x_2)=M_2(x_1,x_2)\le 0.$

( 2.10)

Следовательно, при ориентации обеих сторон на худший случай (т.е. при использовании ими оценок гарантированного уровня эффективности) противоположность интересов сторон, характеризуемая нулевой суммой критериев (1.21), сменяется ситуацией полного совпадения интересов.

Дальше >>

Авторизоваться

Исследование операций и модели экономического поведения

Устойчивость и эффективность поведения сторон: принцип максимума гарантированного результата

Проблема сравнения стратегий

Принцип максимума гарантированного результата

Вопросы и ответы