Опубликован: 26.04.2007 | Уровень: специалист | Доступ: платный
Лекция 12:

Стратегическое равновесие в 2 x 2 играх

< Лекция 11 || Лекция 12: 123 || Лекция 13 >

Стратегическое равновесие при неантагонистических интересах сторон

Пусть интересы сторон, описываемые матрицами 2\times 2 биматричной игры, являются неантагонистическими. С этим предположением продолжим обсуждение поведения игроков, которое характеризуется стратегическими парами (x*,y*), обладающими свойствами равновесия по Нэшу (т.е. отвечающими условиям (10.10), (10.11)).

Начнем со случая, когда 2\times 2 биматричная игра имеет единственное устойчивое решение и оно достигается в смешанных стратегиях из (11.1). При этом:

\alpha= (a_{22} - a_{12})/(a_{11} - a_{12} - a_{21} + a_{22}), ( 11.11)
\beta= (b_{22} - b_{21})/(b_{11} - b_{12} - b_{21} + b_{22}). ( 11.12)

Пример 2.5 (неантагонистическая конкуренция). Пусть два конкурирующих фермера P1 и P2 специализируются на выращивании и продаже с автофургонов некоторой скоропортящейся продукции (например, свежей клубники). Продажа осуществляется (каждым фермером) ежедневно в одном из двух расположенных далеко друг от друга населенных пунктов П1 и П2, причем продукт, доставленный в один из этих пунктов, нецелесообразно перебрасывать в другой в силу значительной потери качества при длительной перевозке.

Если фермеры завезут товар в разные пункты, то он будет продан каждым из них. Полезность такого исхода для каждой из сторон примем за две единицы. В случае, когда автофургоны обоих фермеров одновременно окажутся в одном и том же пункте, спрос на товар, существующий в этом пункте, будет удовлетворен в основном за счет более качественного товара, доставленного первым фермером. Полезность такого исхода первый фермер оценивает как три единицы. Оценка включает как доход от продажи товара, так и получение рекламных преимуществ, открывающих перспективы полного захвата рынка в обоих пунктах (и соответствующего расширения производства).

Второй фермер оценивает полезность исхода, связанного с одновременной торговлей обеих сторон в одном и том же населенном пункте, как нулевую. Матрицы, соответствующие этой 2\times 2 неантагонистической игре, представлены в табл. 2.7. Стратегии сторон соответствуют выбору конкретного пункта (П1 или П2) для торговли в текущий день.

Очевидно, что первый фермер заинтересован торговать в том же месте, что и второй. Интересы второго фермера диктуют противоположный выбор (тем не менее, как уже было отмечено, рассматриваемая игра не является антагонистической).

Таблица 2.7.
Матрица первого фермера Стратегия второго фермера Матрица второго фермера Стратегия второго фермера
П1 П2 П1 П2
Стратегия первого фермера П1 3 2 Стратегия первого фермера П1 0 2
П2 2 3 П2 2 0

Как следует из табл. 2.7, все исходы игры в чистых стратегиях не улучшаемы для обеих сторон и, следовательно, оптимальны по Парето. При этом не существует пар чистых стратегий сторон, обладающих свойством равновесия по Нэшу.

Согласно (10.6) и (10.8)

A = 2,\ a = 1,\quad B = -4,\ b = -2.
Здесь выполняются условия (11.3), (11.4) и, следовательно, существует единственная устойчивая (по Нэшу) пара смешанных стратегий вида
(x^\ast, 1 - x^\ast) = (y^\ast, 1 - y^\ast) = (\frac{1}{2}, \frac{1}{2}); ( 11.13)
cм. (11.1) и (11.11), (11.12). Т.е. каждый фермер может выбирать пункт для торговли в текущий день, например, путем бросания симметричной монеты. Определяемые выражениями (10.5)-(10.8) математические ожидания полезностей сторон, соответствующие устойчивой паре стратегий (11.13), равны величинам
M_1 (x^\ast, y^\ast) = 2 \frac{1}{2}, \qquad M_2(x^\ast, y^\ast) = 1.

Замечание 2.6 (антагонизм поведения без антагонизма интересов). Как следует из (11.11), (10.12), смешанная стратегия каждой из сторон, входящих в устойчивую пару (11.1), зависит исключительно от матрицы другой стороны (т.е. зависит от интересов другой стороны и не зависит от собственных интересов). Рассмотрим эту зависимость более детально.

Согласно (11.1) и (11.11), стратегия (y*,1-y*) игрока P2 в 2\times 2 биматричной игре совпадает со смешанной минимаксной стратегией (11.8) второго игрока в антагонистической игре с левой матрицей из табл. 2.6. Т.е. действия P2, соответствующие устойчивой паре, направлены на уменьшение выигрыша первого игрока, а не на увеличение собственного выигрыша.

Аналогична направленность действий стороны P1. Инвертируя знаки всех элементов в правой таблице из табл. 2.6, получим матрицу

\begin{vmatrix}
-b_{11} \quad -b_{12}\\
-b_{21} \quad -b_{22}
\end{vmatrix}\!,
коэффициенты которой соответствуют проигрышам стороны P2.

Максиминная стратегия первого игрока в антагонистической игре с такой матрицей имеет вид:

(x^\ast, 1 - x^\ast) = \left((b_{22} - b_{21})/B,\ (b_{11} -
b_{12}/B)\right)\!; ( 11.14)
ср. с (11.7). Согласно (11.1) и (11.12), распределение (11.14) есть также смешанная стратегия игрока P1, входящая в единственное устойчивое решение для смешанного расширения биматричной игры. Т.е. поведение P1 в равновесном (по Нэшу) решении направлено на уменьшение выигрыша второго игрока, а не на максимизацию собственного выигрыша. Этот феномен обычно называют антагонизмом поведения без антагонизма интересов.

Продолжим обсуждение характера равновесных решений в биматричной игре, допустив, что, наряду с устойчивыми решениями в смешанных стратегиях, существуют также устойчивые (по Нэшу) стратегические решения в чистых стратегиях.

Пример 2.6 (выбор пункта для строительства с долевым участием). Две фирмы P1 и P2 планируют строительство (с долевым участием) гостиничного комплекса в одном из двух районов города (Р1 и Р2). Фирма P1 заинтересована строить комплекс в районе Р1, где у нее есть ряд предприятий обслуживания, которые могли бы принести (в этом случае) дополнительный доход. Фирма P1 не имеет таких предприятий в районе Р2. Но именно в этом втором районе расположены точки обслуживания, созданные фирмой P2, которая (по этой причине) заинтересована в том, чтобы комплекс строился в районе P2.

Таблица 2.8.
Матрица P1 Стратегия P2 Матрица P2 Стратегия P2
P1 P2 P1 P2
Стратегия P1 P1 2 0 Стратегия P1 P1 1 0
P2 0 1 P2 0 2

Ни одна из фирм не имеет достаточных свободных средств, чтобы построить комплекс в одиночку. Поэтому, если фирмы не смогут прийти к согласию относительно района строительства, то стройка окажется невозможной. Полезность такого исхода является нулевой для каждой фирмы. Матрицы описанной игры1Приведенный пример имеет и другие известные в литературе интерпретации: "семейный спор" (Льюс Р.Д., Райфа Х. Игры и решения. - М.: ИЛ, 1961), "вежливые водители" (Мулен Э. Теория игр с примерами из математической экономики. - М.: Мир, 1985) и др. представлены в табл. 2.8.

Из данных табл. 2.8 и выражений (10.6), (10.8), (10.9), (10.20) получаем, что

A = 3,\ a=1,\ \alpha = \frac{1}{3},\qquad B = 3,\ b = 2,\ \beta= \frac{2}{3}.
При этом из рис. 2.8 и рис. 2.9 следует (см. средний фрагмент на рис. 2.10), что существует три пары (x*, y*), удовлетворяющие условиям устойчивости (10.10), (10.11). Этот случай иллюстрируется рис. 2.11.


Рис. 2.11.

Смешанные стратегии, соответствующие этим парам, и отвечающие им математические ожидания M1(x*,y*), M2(x*, y*) выигрыша сторон представлены в табл. 2.9.

Отметим, что (неэффективная) равновесная пара смешанных стратегий из третьей строки табл. 2.9, соответствующая описанному выше антагонизму поведения без антагонизма интересов, может быть естественным образом интерпретирована, если выбор сторон является повторяющимся.

Таблица 2.9.
(x*,y*) (x*,1-x*) (y*,1-y*) M1(x*,y*) M2(x*,y*) Эффективность
(0,0) (0,1) (0,1) 1 2 Есть
(1,1) (1,0) (1,0) 2 1 Есть
(\frac{2}{3}, \frac{1}{3}) (\frac{2}{3}, \frac{1}{3}) (\frac{1}{3}, \frac{2}{3}) \frac{2}{3} \frac{2}{3} Нет

Такая ситуация возможна, например, если стороны последовательно (по мере накопления свободных средств) создают систему небольших гостиничных комплексов. В этом случае рассмотренная задача выбора одного из двух районов строительства будет повторяться, и математическое ожидание выигрыша можно интерпретировать как средний выигрыш (в расчете на одну партию игры) в серии последовательно решаемых задач. Однако рассмотрение такой повторяющейся игры допускает и другие подходы. Возможно планирование всей серии выборов, а не единичного акта принятия решения по строительству одного гостиничного комплекса.

Есть еще одно обстоятельство, которое следует отметить. Рассмотренный пример демонстрирует существование трех стратегических пар, обладающих свойствами равновесия по Нэшу, и при этом каждая оперирующая сторона имеет различные выигрыши во всех этих парах. Это существенно отличает рассматриваемый неантагонистический случай от антагонистических конфликтов (ср. с утверждениями следствия из теоремы о необходимых и достаточных условиях существования седловой точки ядра антагонистической игры см. "Принцип максимина и устойчивость решений в антагонистических конфликтах" ).

Кроме того, реализация любой из устойчивых пар стратегий требует согласования действий сторон. Действительно, например, если игрок P1 выберет чистую стратегию i*=2, являющуюся компонентой первой устойчивой пары из табл. 2.9, а игрок P2 выберет чистую стратегию {j*=1}, а иявляющуюся компонентой второй устойчивой пары, то такой совместный выбор не обладает свойствами поведения в равновесии. Таким образом, в конфликтах с неантагонистическими интересами сторон анализ устойчивости решений может оказаться недостаточным для выработки удовлетворительных схем поведения этих сторон. Мы вернемся к обсуждению этого вопроса в следующей лекции.

< Лекция 11 || Лекция 12: 123 || Лекция 13 >
Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Гаральд Егоркин
Гаральд Егоркин
Россия
Михаил Алексеев
Михаил Алексеев
Россия, Уфа, УГАТУ, 2002