мне задали дистанционное задание на сертификат,но я не могу его найти |
Вычисление оптимальных стратегий в бесконечных играх
Описание бесконечной игры
Общие методы вычисления оптимальных стратегий в бесконечных играх в настоящее время еще мало разработаны. Поэтому рассмотрим только некоторые частные игры, которые представляют практический интерес и допускают сравнительно простой подход при вычислении оптимальных стратегий (Абчук В.А., Емельянов Л.А., Матвейчук Ф.А., Суздаль В.Г. "Введение в теорию выработки решений" В. издательство, Москва, 1972.) .
К бесконечным играм относятся модели конфликтных ситуаций, в которых каждая из противоположных сторон выбирает некоторые значения непрерывно меняющегося параметра (процентное соотношение распределения поисковых сил по районам поиска или бюджета между компаниями). В этом случае чистые стратегии игроков представляют выборы тех или иных чисел из некоторого интервала. Без потери общности можно считать, что эти стратегии являются точками отрезка единичной длины . Тогда такую игру можно описать следующим образом.
Игрок I выбирает чистую стратегию , где , а игрок II выбирает чистую стратегию , где . Выбранные стратегии и определяют ситуацию , в которой игрок I получает выигрыш . Множество ситуаций заполняет единичный квадрат (рис. 10.1).
По этому иногда такие игры называют играми на единичном квадрате. Функция, ставящая в соответствие каждой ситуации выигрыш, который получает игрок I, называется функцией выигрыша.
Предположим, что функция имеет минимум по для и максимум для . Тогда, если игрок I выберет , то как бы ни действовал игрок II, первый может рассчитывать выиграть по меньшей мере
.
Поскольку игрок I может выбрать любое из интервала , он может выбрать и такое , при котором его выигрыш будет максимальным, то есть игрок I при надлежащим выборе гарантирует себе выигрыш не меньше чем
.
Аналогично игрок II может выбрать такое y, при котором игрок I не выиграет более чем
.
Следовательно, существует неравенство
( 10.1) |
Если в (9.1.) имеет место равенство, то есть
,
то функция выигрыша имеет седловую точку, то есть существуют такие и , при которых является одновременно минимальным по и максимальным по . Очевидно, что в этом случае
( 10.2) |
Если при любых и пара удовлетворяет неравенствам (2), то эта пара называется решением игры в чистых стратегиях. Соответственно этому игроки должны применять чистые стратегии и , которые называются оптимальными. При
игроки должны применять смешанные стратегии.
Смешанная стратегия в бесконечной игре на единичном квадрате представляет собой случайный выбор числа из интервала , то есть если задана смешанная стратегия, то это определяет закон распределения, в соответствии с которым игрок выбирает число из интервала . Для математического описания такого закона распределения удобно пользоваться функцией распределения.
Предположим, что игрок I выбирает число из интервала согласно функции распределения . Тогда для любой чистой стратегии игрока II математическое ожидание выигрыша , если оно существует, будет равно
.
Пусть игрок II выбирает число из интервала согласно функции распределения . Тогда математическое ожидание выигрыша , если оно существует, будет равно
.
Предположим, что существует
и
Выражение означает, что определяется такой вид функции распределения , который минимизирует выражение при заданной функции распределения . Тогда выполняется следующее неравенство:
( 10.3) |
В теории игр доказывается, что, если функция выигрыша непрерывна по и , то
( 10.4) |
Общее значение обеих частей этого равенства называется значением игры и обозначается .
Если существуют такие и , что выполняются неравенства (10.2.), то значение игры равно .
Если выполняется (10.4.), то у игрока I имеется такая стратегия (функция распределения) , что математическое ожидание выигрыша будет
для любой стратегии игрока II .
Аналогично, если выполняется (10.4.) , то существует функция распределения игрока II, при использовании которой математическое ожидание выигрыша будет
для любой стратегии игрока I .
Стратегии и называются оптимальными стратегиями игроков I и II, соответственно. Пара называется решением игры в смешанных стратегиях, а значение игры равно
.