Lecture

Created: 05.11.2008 | Level: specialist | Access: free | University: Новосибирский Государственный Университет
Lecture 10:

Вычисление оптимальных стратегий в бесконечных играх

< Lecture 9 || Lecture 10: 1234 || Lecture 11 >
Annotation: Описание бесконечной игры. Вычисление оптимальных смешанных стратегий в играх на единичном квадрате. Свойства оптимальных стратегий. Вычисление оптимальных смешанных стратегий в играх на единичном квадрате. Игры на единичном квадрате с выбором момента времени. Задача.

Описание бесконечной игры

Общие методы вычисления оптимальных стратегий в бесконечных играх в настоящее время еще мало разработаны. Поэтому рассмотрим только некоторые частные игры, которые представляют практический интерес и допускают сравнительно простой подход при вычислении оптимальных стратегий (Абчук В.А., Емельянов Л.А., Матвейчук Ф.А., Суздаль В.Г. "Введение в теорию выработки решений" В. издательство, Москва, 1972.) .

К бесконечным играм относятся модели конфликтных ситуаций, в которых каждая из противоположных сторон выбирает некоторые значения непрерывно меняющегося параметра (процентное соотношение распределения поисковых сил по районам поиска или бюджета между компаниями). В этом случае чистые стратегии игроков представляют выборы тех или иных чисел из некоторого интервала. Без потери общности можно считать, что эти стратегии являются точками отрезка единичной длины \[ [0,1] \] . Тогда такую игру можно описать следующим образом.

Игрок I выбирает чистую стратегию \[ x \] , где \[ 0\le x\le 1 \] , а игрок II выбирает чистую стратегию \[ y \] , где \[ 0\le y\le 1 \] . Выбранные стратегии \[ x \] и \[ y \] определяют ситуацию \[ (x,y) \] , в которой игрок I получает выигрыш \[ K(x,y) \] . Множество ситуаций заполняет единичный квадрат (рис. 10.1).


Рис. 10.1.

По этому иногда такие игры называют играми на единичном квадрате. Функция, ставящая в соответствие каждой ситуации выигрыш, который получает игрок I, называется функцией выигрыша.

Предположим, что функция \[ K(x,y) \] имеет минимум по \[ y \] для \[ 0\le y \le 1 \] и максимум \[ x \] для \[ 0\le y \le 1 \] . Тогда, если игрок I выберет \[ x \] , то как бы ни действовал игрок II, первый может рассчитывать выиграть по меньшей мере

\[ \mathop{min}\limits_y K(x,y) \] .

Поскольку игрок I может выбрать любое \[ x \] из интервала \[ [0,1] \] , он может выбрать и такое \[ x \] , при котором его выигрыш будет максимальным, то есть игрок I при надлежащим выборе \[ x \] гарантирует себе выигрыш не меньше чем

\[ \mathop{max}\limits_x \mathop{min}\limits_y K(x,y) \] .

Аналогично игрок II может выбрать такое y, при котором игрок I не выиграет более чем

\[ \mathop{min}\limits_y \mathop{max}\limits_x K(x,y) \] .

Следовательно, существует неравенство

\[ \mathop{max}\limits_x \mathop{min}\limits_y K(x,y)\le \mathop{min}\limits_y \mathop{max}\limits_x K(x,y) \]

Если в (9.1.) имеет место равенство, то есть

\[ \mathop{max}\limits_x \mathop{min}\limits_y K(x,y)= \mathop{min}\limits_y \mathop{max}\limits_x K(x,y) \] ,

то функция выигрыша \[ K(x,y) \] имеет седловую точку, то есть существуют такие \[ x_0 \] и \[ y_0 \] , при которых \[ K(x_0,y_0) \] является одновременно минимальным по \[ y \] и максимальным по \[ x \] . Очевидно, что в этом случае

\[ и \left \begin{array}{ccc} K(x_0,y) \ge K(x_0,y_0)\text{ для }0\le y\le 1\\ K(x,y_0) \le K(x_0,y_0) \text{ для }0\le x\le 1 \end{array} \right\rangle \]

Если при любых \[ x \] и \[ y \] пара \[ (x_0,y_0) \] удовлетворяет неравенствам (2), то эта пара называется решением игры в чистых стратегиях. Соответственно этому игроки должны применять чистые стратегии \[ x_0 \] и \[ y_0 \] , которые называются оптимальными. При

\[ \mathop{max}\limits_x \mathop{min}\limits_y K(x,y) < \mathop{min}\limits_y \mathop{max}\limits_x K(x,y) \]

игроки должны применять смешанные стратегии.

Смешанная стратегия в бесконечной игре на единичном квадрате представляет собой случайный выбор числа из интервала \[ [0,1] \] , то есть если задана смешанная стратегия, то это определяет закон распределения, в соответствии с которым игрок выбирает число из интервала \[ [0,1] \] . Для математического описания такого закона распределения удобно пользоваться функцией распределения.

Предположим, что игрок I выбирает число \[ x \] из интервала \[ [0,1] \] согласно функции распределения \[ F(x) \] . Тогда для любой чистой стратегии \[ y \] игрока II математическое ожидание выигрыша \[ M(F,y) \] , если оно существует, будет равно

\[ \int\limits_{0}^{1}K(x,y)dF(x) \] .

Пусть игрок II выбирает число \[ y \] из интервала \[ [0,1] \] согласно функции распределения \[ G(y) \] . Тогда математическое ожидание выигрыша \[ M(F,G) \] , если оно существует, будет равно

\[ \int\limits_{0}^{1}\int\limits_{0}^{1} K(x,y)dF(x)dG(y) \] .

Предположим, что существует

\[ \mathop{max}\limits_F \mathop{min}\limits_G M(F,G) \] и \[ \mathop{max}\limits_G \mathop{min}\limits_F M(F,G) \]

Выражение \[ \mathop{min}\limits_G M(F,G) \] означает, что определяется такой вид функции распределения \[ G(y) \] , который минимизирует выражение \[ M(F,G) \] при заданной функции распределения \[ F(x) \] . Тогда выполняется следующее неравенство:

\[ \mathop{max}\limits_F \mathop{min}\limits_G M(F,G) \le \mathop{max}\limits_G \mathop{min}\limits_F M(F,G) \] .

В теории игр доказывается, что, если функция выигрыша непрерывна по \[ x \] и \[ y \] , то

\[ \mathop{max}\limits_F \mathop{min}\limits_G M(F,G) = \mathop{max}\limits_G \mathop{min}\limits_F M(F,G) \]

Общее значение обеих частей этого равенства называется значением игры и обозначается \[ \nu \] .

Если существуют такие \[ x_0 \] и \[ y_0 \] , что выполняются неравенства (10.2.), то значение игры равно \[ K(x_0,y_0) \] .

Если выполняется (10.4.), то у игрока I имеется такая стратегия (функция распределения) \[ F^*(x) \] , что математическое ожидание выигрыша будет

\[ M(F,G^*)\ge\nu \]

для любой стратегии игрока II \[ G(y) \] .

Аналогично, если выполняется (10.4.) , то существует функция распределения \[ G^*(y) \] игрока II, при использовании которой математическое ожидание выигрыша будет

\[ M(F,G^*)\le\nu \]

для любой стратегии игрока I \[ F(x) \] .

Стратегии \[ F^*(x) \] и \[ G^*(y) \] называются оптимальными стратегиями игроков I и II, соответственно. Пара \[ (F^*,G^*) \] называется решением игры в смешанных стратегиях, а значение игры равно

\[ M(F^*,G^*) \] .

< Lecture 9 || Lecture 10: 1234 || Lecture 11 >