Опубликован: 26.04.2007 | Уровень: специалист | Доступ: платный

Лекция 10: Приведение позиционной игры к игре в нормальной форме. Условия существования стратегического равновесия

< Лекция 9 || Лекция 10: 12 || Лекция 11 >

Условия существования стратегического равновесия в конечной игре двух лиц

Теорема 2.1 (достаточные условия существования устойчивых решений) Пусть \Gamma есть конечная игра двух лиц с полной информацией и пусть S и G есть множества стратегий, имеющихся у сторон P1 и P2 в этой игре. Тогда произведение S \times G содержит устойчивую стратегическую пару (s*,g*).

Доказательство

1. Поскольку \Gamma есть конечная игра с полной информацией, то (см. определение в "Нормальная форма конечной игры. Задание конечной игры в позиционной форме" ) каждое информационное множество, входящее в описание ее развернутой формы, содержит ровно один узел (точку ветвления) дерева игры. При этом любой узел дерева, помеченный (сверху) номером первого игрока, является точкой определения каждой стратегии s \in S, а любой узел, помеченный (сверху) номером второго игрока, - точкой определения стратегии g \in G.

Каждой конкретной паре стратегий (s,g) дерево игры сопоставляет определенную этими стратегиями последовательность переходов по ребрам дерева, начинающуюся в корневой точке и заканчивающуюся в одной из вершин. Тем самым определяются значения платежных функций сторон M1(s,g) и M2(s,g), соответствующие этой паре стратегий, поскольку вершинам дерева, представляющим исходы игры, сопоставлены значения полезностей для обоих игроков.

Напомним, что реализацию операции, соответствующую заданной последовательности переходов по ребрам дерева (т.е. пути в дереве игры ), мы назвали партией игры. В качестве иллюстрации, на рис. 2.2 широкими линиями отмечен путь, соединяющий точки q1, q3, q4, t5. Число позиций (узлов) в самой длинной партии игры условимся называть длиной игры. Нетрудно подсчитать, что длина игры, представленной деревом на рис. 2.2, равна 3 (причем указанный выше путь соответствует самой длинной партии игры). Проведем доказательство теоремы индукцией по длине игры.

Для игр нулевой длины будем считать теорему справедливой. Это допущение можно интерпретировать следующим образом. Поскольку в дереве такой игры нет ни одного узла (т.е. игра не предполагает совершение ходов игроками), то области определения функций s и g пусты. Примем, что в этом случае у каждой из сторон есть ровно одна стратегия и она не предполагает принятие каких-либо решений. При этом дерево игры необходимо представлено некоторой вершиной, которой сопоставлены выигрыши игроков. Следовательно, платежные функции M1 и M2 существуют и определены в единственной точке множества S\times G. Заметим, что какие-либо отклонения от этой единственной точки являются невозможными (в силу ее единственности). Будем считать ее точкой равновесия в игре нулевой длины.

Предположим, что теорема справедлива для всех конечных игр двух лиц с полной информацией длины меньшей, чем k. Пусть \Gamma есть игра с полной информацией длины k и ее первому ходу (т.е. позиции q1 ) соответствуют r возможных выборов, которые переводят игру из позиции q1 соответственно в точки p1...pr дерева игры (они могут быть узлами или вершинами дерева).

В результате дальнейшее развитие игры будет описываться переходами в поддереве, корнем которого является одна из точек pi, 1\le i\le r. Поддерево с корнем в точке pi является описанием некоторой конечной подыгры \Gamma_i с полной информацией, имеющей длину меньшую, чем k. Будем называть игру \Gamma_i усечением исходной игры. Заметим, что длина \Gamma_i окажется нулевой, если точка pi есть вершина исходного дерева. В качестве иллюстрации рис. 2.6 воспроизводит дерево игры, представленное на рис. 2.2, на котором (овальными пунктирными контурами) выделены поддеревья игр \Gamma_1 и \Gamma_2 с корнями соответственно в точках p1=q3 и p2=q2. При этом длины этих подыгр соответственно равны 2 (для \Gamma_1 ) и 1 (для \Gamma_2 ). Заметим, что пунктирные окружности, выделяющие информационные множества сторон на рис. 2.2, опущены на рис. 2.6 (поскольку известно, что в игре с полной информацией каждый узел дерева составляет отдельное информационное множество).


Рис. 2.6.

Сужение области определения функций s и g (определенных на соответствующих узлах дерева игры \Gamma ) до подмножеств узлов, входящих в поддерево игры \Gamma_i, определяет стратегии сторон P1 и P2 в этой подыгре. Будем называть их усечениями стратегий s, g и обозначать si, gi. Множества таких стратегий обозначим соответственно Si, Gi. В целях иллюстрации отметим, что усечения стратегий s1 и s3 первого игрока в игре \Gamma (см. (9.1), (9.3)), дают одну и ту же стратегию s_{1}'(q_{4})=\text{МП}2 этого игрока в подыгре \Gamma_1. Сужения двух других стратегий P1 ( s2 и s4 - см. (9.2), (9.4)) в исходной игре дают его стратегию s_{1}''(q_{4})=\text{МП}5 в подыгре \Gamma_1. Аналогично, сужения стратегий (9.5)-(9.8) второго игрока в игре \Gamma дают множество стратегий

G_1 = \{g_1'(q_3) = \text{МП}2,\ g_1''(q_3) = \text{МП}4\}
этого игрока в подыгре \Gamma_1.

Таким образом, исходной игре \Gamma сопоставляются r усеченных игр \Gamma_i с полной информацией, имеющих длину меньшую, чем k, и характеризуемых множествами стратегий Si, Gi, 1 \le i \le r. Любая пара стратегий сторон (s_i, g_i) \in S_i \times G_i задает некоторый исход в поддереве игры \Gamma_i и, тем самым, определяет значения платежей M_{1}^{i}(s_{i},g_{i}),\;
M_{2}^{i}(s_{i},g_{i}) как значения полезностей, сопоставленных соответствующей вершине дерева. При этом

M_j^i (s_i, g_i) = M_j(s,g),\qquad j = 1,2, ( 9.9)
если si и gi есть усечения стратегий s и g. Для иллюстрации, платежная функция M_{1}^{1}(s_{1},g_{1}), соответствующая игре \Gamma_1, поддерево которой изображено на рис. 2.6, представлена в табл. 2.4.

Таблица 2.4.
Матрица подигры \Gamma_1 Стратегия P2 в игре \Gamma_1
МП2 МП4
Стратегия P1 в игре \Gamma_1 МП2 7 3
МП5 6 3

По условию индукции, каждое произведение S_i \times G_i содержит устойчивую стратегическую точку (s_{i}^{\ast},g_{i}^{\ast}), для которой справедливы неравенства:

(\forall s_i \in S_i) M_1^i (s_i^\ast, g_i^\ast) \ge M_1^i (s_i, g_i^\ast), ( 9.10)
(\forall g_i \in G_i) M_2^i (s_i^\ast, g_i^\ast) \ge M_2^i (s_i^\ast, g_i), ( 9.11)
1 \le i \le r. Заметим, что эти условия остаются справедливыми и для подыгр нулевой длины. Соответствующие им множества Si и Gi содержат по одному элементу, а значения M_{1}^{i},\, M_{2}^{i} определяются, как и в общем случае, значениями полезностей в соответствующем исходе.

3. Пусть в исходной игре \Gamma первый ход (в позиции q1 ) делает игрок P1. Определим целое число l, 1\le l\le r, такое, что

M_1^l (s_l^\ast, g_l^\ast) = \max\{M_1^i(s_i^\ast, g_i^\ast)\colon 1 \le i \le r\}, ( 9.12)
и определим стратегию s* игрока P1 в исходной игре \Gamma, задав ее условиями
s^\ast (q_1) = l, ( 9.13)
s^\ast (q) = s_i^\ast(q), ( 9.14)
если узел q есть один из узлов в поддереве усеченной игры \Gamma_i, 1\le i\le r. Введенная стратегия допускает следующую интерпретацию.

На первом ходе игрок P1 решает, в какой подыгре \Gamma_l он будет участвовать на последующих ходах. При этом в соответствии с (9.12), он выбирает ту подыгру \Gamma_l, в которой его выигрыш, заданный устойчивой по Нэшу парой стратегий (s_{l}^\ast, g_{l}^\ast) этой подыгры, является максимальным. Все последующие ходы (в этой подыгре) он осуществляет в соответствии со стратегией s_{l}^{*}. Однако формальное определение стратегии предполагает, что выборы игрока P1 должны быть определены для всех его позиций в дереве игры \Gamma. Такое определение обеспечивается условиями (9.14).

Теперь определим стратегию g* игрока P2 в игре \Gamma. Примем, что его выбор в позиции q из поддерева \Gamma_i (помеченной номером этого игрока) совпадает с выбором, предписываемым стратегией g_{i}^{\ast}, входящей в устойчивую пару (s_{i}^{\ast}, g_{i}^{\ast}) из (9.10), (9.11). То есть

g^\ast(q) = g_i^\ast (q),\quad 1 \le i \le r. ( 9.15)

Покажем, что введенная пара (s^\ast, g^\ast) есть устойчивая стратегическая точка в S\times G. Из (9.9), (9.13)-(9.15) и из (9.10) следует, что

M_2(s^\ast, g^\ast) = M_2^l(s_l^\ast, g_l^\ast) \ge M_2^l (s_l^\ast, g_l) = M_2 (s^\ast, g),
где g\in G есть любая стратегия, усечение которой в подыгре \Gamma_l есть gl. Таким образом,
(\forall g \in G)\, M_2(s^\ast, g^\ast) \ge M_2(s^\ast, g). ( 9.16)

Аналогично, из (9.9), (9.13)-(9.15) и из (9.11), (9.12) выводим, что

M_1(s^\ast,g^\ast) = M_1^l(s_l^\ast, g_l^\ast) \ge 
M_1^i(s_i^\ast, g_i^\ast) \ge M_1^i(s_i, g_i^\ast)
= M(s,g^\ast),
где индекс i соответствует выбору i=s(q_1), предписанному стратегией s \in S игрока P1, переводящей продолжение игры в подыгру \Gamma_i. Таким образом,
(\forall s \in S)\, M_1(s^\ast, g^\ast) \ge M_1(s, g^\ast),
что в сочетании с (9.16) доказывает устойчивость стратегической пары (s*,g*).

4. Случай, когда первый ход делает игрок P2, рассматривается аналогично.

Следствие 2.1. Матрица, представляющая нормальную форму конечной антагонистической игры с полной информацией, всегда имеет седловое значение.

Замечание 2.3. Примером конечной антагонистической игры с полной информацией является игра в шахматы (при условии ведения протокола). Однако чрезмерно большое число возможных позиций в шахматной игре затрудняет как построение дерева игры, так и приведение ее к нормальной форме для определения седлового значения соответствующей матрицы. Тем не менее, именно для этой игры в 1913 году Э.Цермело1Цермело Эрнест (1871-1953) - немецкий математик, автор аксиомы выбора для произвольного семейства множеств. поставил и положительно решил вопрос о существовании наилучших возможных ходов в каждой позиции (заметим, что понятия нормальной и развернутой форм игры в то время еще не были введены2Цермело Э. О применении теории множеств к теории шахматной игры // Матричные игры. М.: Физматгиз, 1961. С.167-172 (перевод с немецкого). ).

< Лекция 9 || Лекция 10: 12 || Лекция 11 >
Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Гаральд Егоркин
Гаральд Егоркин
Россия
Михаил Алексеев
Михаил Алексеев
Россия, Уфа, УГАТУ, 2002