Опубликован: 26.04.2007 | Уровень: специалист | Доступ: платный
Лекция 8:

Анализ антагонистической игры на основе принципа максимума гарантированного результата

< Лекция 7 || Лекция 8: 12 || Лекция 9 >

Замечание 1.18 (о бабочкообразных ядрах ). Рассмотрим частный случай, когда

p_1(x) = 1 - x,\quad p_2(y) = 1 - y,
и, следовательно,
M(x,y) = \left\{
\begin{aligned} & 1 - 2x, && 0 \le y < x \le 1,\\ & 0, && 0 \le x =
y \le 1,\\ & 2y -1, &&  0 \le x < y \le 1.
\end{aligned}
\right. ( 7.3)

Разрывная поверхность, которая соответствует функции M(x,y) из (7.3), определенной на единичном квадрате 0\le x, y\le 1, представлена на рис.1.15. Указанная поверхность составлена из трех частей, включающих два плоских треугольника и (изображенный жирной линией) отрезок, который лежит на прямой x=y в плоскости M(x,y)=0. Все части имеют общую точку (отмеченную темным кружком). Форма поверхности напоминает бабочку, и этим определяется использование термина " бабочкообразные ядра " применительно к функциям вида (7.2).


Рис. 1.15.

Оценим нижнюю цену игры и максиминную стратегию игрока P1. Воспользуемся представлением

\begin{gathered}
\underline{v} = \max_{0 \le x \le 1} \min_{0 \le y \le 1} M(x,y) =
\max_{0 \le x \le 1} \mu(x),\\
\mu(x) = \min\left\{\inf_{0 \le y < x} M(x,y), M(x,x), \inf_{x < y \le 1}
M(x,y)\right\}\!.
\end{gathered} ( 7.4)

При этом, согласно (7.2),

\begin{gathered}
\inf \{M(x,y) \colon 0 \le y < x\} = 2 p_1(x) -1,\\
M(x,x) = p_1(x) - p_2(x),\\
\inf \{M(x,y)\colon x < y \le 1\} = 1 - 2p_2(x)
\end{gathered}
и, следовательно,
\mu(x) = \min \{2p_1(x) - 1, p_1(x) - p_2(x),\ 1 - 2p_2(x)\}. ( 7.5)

Определим вещественное число t как решение уравнения (см. рис.1.14):

p_1(t) + p_2(t) = 1. ( 7.6)

Заметим, что в силу (7.1), условий

p_1(0) = 1,\quad p_2(0) = 1
и условия монотонности функций p1, p2, решение уравнения (7.6) существует и является единственным. Теперь, согласно (7.4), можно оценить нижнюю цену игры как
\underline{v} = \max \left\{\sup_{0 \le x < t} \mu(x), \mu(t), \sup_{t <
x \le 1}
\mu(x)\right\}\!. ( 7.7)

Из (7.6) и условия монотонности функций p1, p2 вытекает, что

p_1(t) + p_2(t) \ge 1,\ 0  \le x \le t. ( 7.8)
Прибавив к каждой части этого неравенства величину p1(x), получим левое неравенство из записи (7.9):
2p_1(x) - 1 \ge p_1(x) - p_2(x) \ge 1 - 2 p_2(x). ( 7.9)

Вычитая величину 2p2(x) из левой и правой частей неравенства (7.5), получим правое неравенство из (7.9). Теперь из (7.5) и (7.9) следует, что

\mu(x) = 1 - 2p_2(x),\ 0 \le x \le t,
причем
\sup\{\mu(x) \colon 0 \le x < t\} = 1 - 2p_2(t). ( 7.10)

Неравенство

p_1(t) + p_2(t) \le 1,\ t \le x \le 1, ( 7.11)
также является следствием (7.6) и условий монотонности функций p1 и p2. Сопоставляя (7.8) и (7.11), выводим, что следствием (7.11) являются неравенства, обратные отношениям в (7.9), т.е.
2p_1(x) - 1 \le p_1(x) - p_2(x) \le 1 - 2 p_2(x). ( 7.12)
Тогда из (7.5) и (7.12) вытекает, что
\mu(x) = 2 p_1(x)-1,\ t \le x \le 1,
причем
\sup\{\mu(x) \colon t < x \le 1\} = 2p_1(t) - 1. ( 7.13)

Пусть теперь x=t. Тогда из (7.9) и (7.12) следует равенство

2p_1(x) - 1 = p_1(x) - p_2(x) = 1 - 2 p_2(x), ( 7.14)
откуда, учитывая (7.7), (7.10) и (7.13), получаем, что
\underline{v} = \max \{\mu(x) \colon 0 \le x \le 1\} = p_1(t) - p_2(t). ( 7.15)

При этом максиминная стратегия x* игрока P1 определяется как решение уравнения (7.6), т.е. x*=t.

Аналогично определяется верхняя цена игры и минимаксная стратегия игрока P2. Запишем

\bar{v} = \min_{0 \le y \le 1} \max_{0 \le x \le 1} M(x,y) =
\min_{0\le y\le 1} \eta(y), ( 7.16)
\eta(y) = \max \left\{\sup_{0 \le x < y} M(x,y), M(y,y),
\sup_{y < x \le 1} M(x,y)\right\}\!.\notag
При этом, согласно (7.2),
\begin{gathered}
\sup\{M(x,y) \colon 0 \le x < y\} = 1 - 2 p_2(y),\\
M(y,y) = p_1(y) - p_2(y),\\
\sup\{M(x,y) \colon y < x \le 1\} = 2p_1(y) - 1,
\end{gathered}
и, следовательно,
\eta(y) = \max\{2p_1(y) - 1,\,p_1(y) - p_2(y),\,1-2p_2(y)\}. ( 7.17)

Теперь из (7.17), (7.9) и (7.12) выводим, что

\begin{gathered}
\eta(y) = 2 p_1(y) - 1,\ 0 \le y < t,\\
\eta(y) = 1 - 2 p_2(y),\ t < y \le 1,\\
\end{gathered}
откуда следует справедливость оценок
\begin{gathered}
\inf\{\eta(y) \colon 0 \le y < t\} = 2p_1(t) - 1,\\
\inf\{\eta(y) \colon t < y \le 1\} = 1 - 2p_2(t).
\end{gathered}

Полученные оценки в сочетании с равенством (7.14) приводят к выводу, что

\bar{v} = \min\{\eta(y) \colon 0 \le y \le 1\}  =p_1(t) - p_2(t). ( 7.18)
При этом минимаксная стратегия y* игрока P2 определяется тем же значением t, что и максиминная стратегия игрока P1, т.е.
x^\ast = y^\ast = t ( 7.19)
где t из (7.6); см. рис.1.14.

Совпадение верхней и нижней цен игры доказывает, что пара ( x*,y*) из (7.19) является седловой точкой ядра (7.2). Следовательно, эта пара стратегий определяет решение, обладающее свойствами равновесия по Нэшу. Полученному решению соответствует цена игры

v = p_1(t) - p_2(t). ( 7.19)

Еще раз отметим, что решение (7.19), (7.20) является также оптимальным по Парето. Следует также обратить внимание на то, что величина v из (7.20) есть гарантированное игроку P1 математическое ожидание полезности, а не выигрыш в конкретной реализации игры (который может иметь лишь значения из множества {-1,0,+1} ). В случае, когда цена игры v оказывается положительной (отрицательной), говорят, что игра поставлена в пользу первого (второго) игрока. При v=0 игру называют " безобидной ".

Выражение (7.20) для цены игры является важной рекомендацией. Согласно этому выражению, для постановки игры в свою пользу игрок Pi (i=1,2) должен стремиться увеличить вероятность pi(t), соответствующую упреждению t из (7.6). Как уже отмечалось, мы полагаем, что каждая из сторон знает обе функции p1, p2.

Замечание 1.19 (об играх типа дуэлей ). Модели рассмотренного выше типа первоначально использовались как средство описания боевых столкновений типа дуэлей (например, дуэли истребитель-бомбардировщик, штурмовик-наземный комплекс и т.п.). При этом функции p1(x) и p2(y) характеризуют вероятности поражения противника при выстреле, осуществленном игроком P1 или P2 соответственно с расстояния x или y (при естественном предположении, что стреляющая сторона не была уничтожена противником еще до своего выстрела). В теории рассмотрены случаи, когда стороны могут последовательно осуществить несколько выстрелов, обнаруживая факты промахов противника (в этом случае дуэль называется " шумной ") или не имея возможностей для такого обнаружения (в этом случае говорят о " бесшумной " дуэли). Исследования подобных моделей оказали определенное влияние на содержание наставлений для некоторых родов войск4Дрешер М. Стратегические игры. Теория и приложения. М.: Советское радио, 1964.} .

Тем самым, пример, рассмотренный выше, может классифицироваться как шумная дуэль, в которой каждая сторона имеет один выстрел. Заметим, что интерпретация дуэлей как конкурентных взаимодействий появилась значительно позднее5См., например, пособие: Крушевский А.В. Теория игр. Киев: Вища школа, 1977..

В заключение отметим, что успешное вычисление минимаксного и максиминного значений ядра в рассмотренном примере существенно опиралось на специфику конкретной функции (7.2). В общем случае такие вычисления могут оказаться гораздо более сложными. Эти трудности, однако, исчезают, если выбор стратегий (для каждой стороны) ограничен конечным числом вариантов, которые можно перебрать в процессе анализа. Этот случай рассматривается в следующей лекции.

< Лекция 7 || Лекция 8: 12 || Лекция 9 >
Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Гаральд Егоркин
Гаральд Егоркин
Россия
Михаил Алексеев
Михаил Алексеев
Россия, Уфа, УГАТУ, 2002