Нижегородский государственный университет им. Н.И.Лобачевского
Опубликован: 26.04.2007 | Доступ: свободный | Студентов: 1411 / 126 | Оценка: 3.69 / 3.54 | Длительность: 14:45:00
ISBN: 978-5-9556-0072-7
Специальности: Математик
Лекция 12:

Стратегическое равновесие в 2 x 2 играх

< Лекция 11 || Лекция 12: 123 || Лекция 13 >
Аннотация: Свойства оптимальных смешанных стратегий в 2 x 2 играх. Смешанные расширения m x n биматричных игр.

Случай единственного устойчивого решения, не реализуемого в чистых стратегиях

Первый и третий случаи, рассмотренные в заключительном пункте приведенного выше доказательства теоремы, необходимо включают в число устойчивых решений некоторую пару (x*,y*), образом которой является одна из вершин квадрата D. Это означает, что в таком решении каждая из сторон использует с единичной вероятностью одну из своих чистых стратегий. Для иллюстрации отметим, что паре (0,1) \in D, маркированной темной точкой на левом фрагменте рис. 2.10, соответствуют смешанная стратегия (x*,1-x*)=(0,1) первой стороны и смешанная стратегия (y*,1-y*)=(1,0) второй стороны. Устойчивые решения такого типа реализуемы и в чистых стратегиях.

Пример, рассмотренный в "Нормальная форма конечной игры. Задание конечной игры в позиционной форме" (соглашение об ограничении лова рыбы), иллюстрирует этот случай. Используя выражения (10.6) и (10.8), получаем (в соответствии со значениями элементов матриц, соответствующих примеру), что A=B=0 и a=b=1. Этим значениям соответствуют левые верхние фрагменты на рис. 2.8 и рис. 2.9. Следовательно, задача имеет единственное устойчивое решение

(x^\ast, 1 - x^\ast) = (y^\ast, 1 - y^\ast) = (0,1),
соответствующее уже рассмотренному ранее решению в чистых стратегиях.

Ситуация, когда 2\times 2 игра не имеет устойчивых решений в чистых стратегиях, но обретает такое решение в смешанных стратегиях, соответствует второму случаю из пункта, завершающего доказательство теоремы. Устойчивое решение в смешанных стратегиях окажется единственным, если решениями систем (10.10) и (10.11) являются лишь точки трехзвенных ломаных линий, соединяющих концы разных диагоналей квадрата. При этом единственная устойчивая пара стратегий

(x^\ast, 1 - x^\ast) = (\beta, 1 - \beta),\quad (y^\ast, 1 - y^\ast) =
(\alpha, 1 -\alpha), ( 11.1)
порождается единственной точкой (x^\ast, y^\ast) = (\beta,\alpha), в которой пересекаются указанные выше ломаные линии. В этом случае
0 < \alpha < 1,\quad 0 < \beta < 1 ( 11.2)
и, кроме того, знаки величин A и B должны быть различны, т.е.
AB < 0 ( 11.3)
(см. рис. 2.8 и рис. 2.9).

Неравенства (11.2) для величин \alpha и \beta из (10.19), (10.20), определяемых соответственно коэффициентами a, A из (10.6) и b, B из (10.8), имеют следствием отношения

a_{11} \ne a_{21},\quad a_{22} \ne a_{12},\quad b_{11} \ne b_{12},\quad b_{22} \ne
b_{21}. ( 11.4)
Т.е. условие единственности решения в смешанных стратегиях предполагает, что коэффициенты, находящиеся в одном и том же столбце матрицы первого игрока, должны быть различны. Аналогично, должны быть различны и коэффициенты из одной и той же строки матрицы второго игрока.

Оптимальные смешанные стратегии в 2 x 2 матричной игре

Как уже отмечалось, антагонистическому случаю соответствуют условия (8.2), согласно которым для величин из (10.6) и (10.8) справедливы отношения

a = a_{22} - a_{12},\quad b = -a_{22} + a_{21}. ( 11.5)

При этом

A = -B, ( 11.6)
что обеспечивает выполнение неравенства (11.3). В силу справедливости условий (8.2), справедливость неравенств (11.4) является необходимым следствием отсутствия седлового значения 2\times 2 матрицы игры (см. определение в "Нормальная форма конечной игры. Задание конечной игры в позиционной форме" ), поскольку совпадение значений коэффициентов в любой строке (или в столбце) 2\times 2 матрицы гарантирует существование такого значения. Таким образом, в 2\times 2 антагонистической игре отсутствие устойчивых решений в чистых стратегиях гарантирует существование единственного устойчивого решения в смешанных стратегиях, порождаемого парой (\beta, \alpha), где
\alpha = (a_{22} - a_{12})/A,\qquad \beta= (a_{22} - a_{21})/A.
При этом
x^\ast = (a_{22} - a_{21})/A,\qquad 1 - x^\ast = (a_{11} - a_{12})/A, ( 11.7)
y^\ast = (a_{22} - a_{12})/A,\qquad 1 - y^\ast = (a_{11} - a_{21})/A, ( 11.8)
и для ядра M(x,y)=M1(x,y) смешанного расширения исходной игры справедлива оценка
\begin{multiline}
(\forall y \in [0,1])\, M(x^\ast, y) = \{[a_{11}
(a_{22} - a_{21}) + a_{21}(a_{11} - a_{12})] \cdot y +\\
+ [a_{12} (a_{22} - a_{21}) +
a_{22}(a_{11} - a_{12})](1 -y)\}/A =\\
= (a_{11}a_{22} - a_{12}a_{21})/A = M(x^\ast, y^\ast).
\end{multiline} ( 11.9)
Таким образом, цена игры в смешанных стратегиях (т.е. математическое ожидание выигрыша первой стороны при реализации устойчивой пары смешанных стратегий из (11.7), (11.8)) есть
v = (a_{11}a_{22} - a_{12}a_{21})/A. ( 11.10)

Отметим одно важное обстоятельство. Из (11.9), (11.10) следует, что

(\forall y \in [0,1])\, M(x^\ast, y) = v.

Аналогично можно получить симметричное утверждение

(\forall x \in [0,1])\, M(x, y^\ast) = v.
Отсюда следует вывод о том, что замечание, сделанное в "Смешанные стратегии и проблема устойчивости решений" , не зависит от конкретных значений элементов 2\times 2 матрицы игры. Пусть одна из сторон (заведомо) использует рулетку, реализующую оптимальную смесь чистых стратегий. Тогда, независимо от того, какую стратегию выбирает другая сторона, ее ожидаемый выигрыш совпадает с ценой игры. Т.е. любая ее стратегия обеспечивает максимальный гарантированный уровень математического ожидания выигрыша (величину v для стороны P1 и величину ( -v для стороны P2 ).

Согласно выражениям (11.7), (11.8) и (11.10), рассмотренный ранее пример рекламной борьбы (см. "Смешанные стратегии и проблема устойчивости решений" ), не имеющий устойчивых решений в чистых стратегиях, имеет единственное устойчивое решение в смешанных стратегиях:

(x^\ast, 1 - x^\ast) = (y^\ast, 1 - y^\ast) =
(\frac{1}{2},\frac{1}{2}),\quad v =0.
Это же решение было получено ранее (некоторым частным способом); см. (10.3). Заметим, что игры, которым соответствует нулевая цена, часто называют безобидными.

Теперь вернемся к примеру погони за конкурентом, в котором при отсутствии полной информации (см. дерево игры на рис. 2.5) нет устойчивых решений в чистых стратегиях (см. также замечание 2.2 в "Приведение позиционной игры к игре в нормальной форме. Условия существования стратегического равновесия" ). Обратимся к соответствующей этому случаю матрице 4\times 2 матрице игры, приведенной в "Приведение позиционной игры к игре в нормальной форме. Условия существования стратегического равновесия" . Заметим, что первая и вторая стратегии стороны P1 дают одни и те же выигрыши против одной и той же стратегии стороны P2. При этом третья стратегия стороны P1 даже превосходит ее четвертую стратегию. Фактически, мы имеем ситуацию, когда каждый элемент матрицы, находящийся в строке с номером i, превышает соответствующий (т.е. находящийся в том же столбце) элемент из строки с номером k (или хотя бы не меньше, чем этот элемент):

a_{ij} \ge a_{kj},\quad 1 \le j \le 2.
В этом случае говорят, что строка i доминирует строку k. Ясно, что любое значение выигрыша, обеспечиваемое использованием доминируемой стратегии с номером k, может быть достигнуто использованием доминирующей стратегии с номером i. Поэтому в рассматриваемом примере сторона P1 может ограничиться использованием второй и третьей стратегий. В результате получаем (редуцированную) игру с 2\times 2 матрицей:

Таблица 2.6.
Редуцированная матрица игры Смешанная cтратегия P2
1/6 5/6
Смешанная стратегия P1 2/3 2 4
1/3 7 3

Согласно (11.7), (11.8) и (11.10), этой игре соответствует устойчивое (и эффективное) решение в смешанных стратегиях вида:

\left(x^\ast, 1 - x^\ast\right) = (\frac{2}{3}, \frac{1}{3}),\quad
\left(y^\ast, 1 - y^\ast\right) = (\frac{1}{6}, \frac{5}{6}),
и цена игры v = 3\frac{2}{3}. Примем, что первая и четвертая (чистые) стратегии в исходной 4\times 2 игре используются первым игроком с нулевыми вероятностями. Тогда случайный механизм, характеризуемый вектором вероятностей (0, \frac{2}{3}, \frac{1}{3}, 0), обеспечивает игроку P1 математическое ожидание выигрыша, равное указанной выше цене v = 3\frac{2}{3}. Фактически, обсуждая этот пример, мы обобщили смешанные стратегии на случай, когда число чистых стратегий превышает 2. Более последовательное рассмотрение такого обобщения будет проведено ниже.

Замечание 2.5 (о природе устойчивости решений в антагонистической игре) Если изменить знаки всех элементов матрицы игры на противоположные, то, согласно (11.10), знак цены игры также изменится. Например, если значение цены игры было положительным (в этом случае говорят, что игра поставлена в пользу первого игрока), то оно изменится на отрицательное значение (т.е. игра будет поставлена уже в пользу второго игрока). Однако пара устойчивых смешанных стратегий, определяемых выражениями (10.7) и (10.8), останется неизменной.

< Лекция 11 || Лекция 12: 123 || Лекция 13 >
Михаил Агапитов
Михаил Агапитов

Не могу найти  требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия"

Подобед Александр
Подобед Александр

Я нажал кнопку "начать курс" и почти его уже закончил, но для получения диплома на бумаге, нужно его же оплатить? Как оплатить?