Новосибирский Государственный Университет
Опубликован: 06.11.2008 | Доступ: свободный | Студентов: 3330 / 1205 | Оценка: 4.24 / 3.67 | Длительность: 14:37:00
Специальности: Математик
Лекция 12:

Основные понятия последовательного анализа

< Лекция 11 || Лекция 12: 12 || Лекция 13 >
Аннотация: Критерий Вальда. Критерий минимаксного риска. Критерий Гурвица. Критерий Лапласа. Последовательный анализ. Статистическая гипотеза. Получение случайных выборок. Последовательные проверки статистических гипотез.

Критерий Вальда

Для каждого из описанных ниже критериев будем предполагать, что необходимо выбрать одно из действий a_1,a_2,...,a_m при выборе "природой" одного из состояний \theta_1,\theta_2,...,\theta_n, в результате чего достигается выигрыш u_{ij} (i=1,2,...,m; j=1,2,...,n).

Критерий Вальда или максиминный критерий. В соответствии с этим критерием каждое действие оценивается по наихудшему для него состоянию, и оптимальным является действие, приводящее к наилучшему из наихудших состояний, то есть действие i, для которого достигается

\mathop{max}\limits_i \mathop{min}\limits_j u_{ij},

Можно установить, что согласно максиминному критерию складывающаяся ситуация рассматривается как матричная игра и максиминная стратегия представляет собой наилучший выбор против минимаксной стратегии "природы", то есть против наименее благоприятного априорного распределения вероятностей состояний "природы". С этой точки зрения максиминный критерий является чрезвычайно консервативным, так как "природа" не представляет собой сколько-нибудь разумного игрока. Однако применение этого критерия может быть целесообразным, если по условиям обстановки подобный консерватизм имеет смысл.

Критерий минимаксного риска

Минимаксный критерий ( критерий потерь или минимаксного риска ). В соответствии с этим критерием оптимальным считается действие, для которого величина потерь (риска) принимает наименьшее значение при самой неблагоприятной обстановке, то есть действие i, для которого достигается

\mathop{min}\limits_i \mathop{max}\limits_j r_{ij},

где r_{ij} определяется как величина, которую нужно прибавить к u_{ij}, чтобы получить максимальный выигрыш, состоящий в j -м столбце.

Для определения оптимального действия согласно минимаксному критерию на основании первоначальной матрицы выигрышей составляется вторая матрица, показывающая потери от ошибок (матрица потерь). Покажем составление матрицы потерь на конкретном примере.

Пусть матрица выигрышей задана таблицей на рисунке 12.a. Из рисунка 12.a видно, что если применяется действие a_2, а состояние "природы" \theta_2, то по отношению к действию a_1 достигается наибольший выигрыш, равный 98 единицам, и, следовательно, игрок не несет никаких потерь. Поэтому показатель потерь на пересечении строки a_2 и столбца \theta_2 равен нулю. Этот показатель и записывается как элемент матрицы потерь. (См. рисунок 12.b) Если же игрок применяет действие a_1 против стратегии \theta_2, то он получает только две единицы, тогда как максимально возможный выигрыш равен 98. Следовательно, показатель потерь в этом случае будет равен 98-2=96 ; он записывается в таблицу на рисунке 12.b на пересечении строки a_1 и столбца \theta_2. Остальные элементы матрицы потерь находятся аналогичным образом.

Матрица выигрышей

Рис. 12.a. Матрица выигрышей
Матрица потерь

Рис. 12.b. Матрица потерь

Критерий Гурвица

Критерий пессимизма-оптимизма. В соответствии с этим критерием оптимальным считается действие i, для которого достигается

\mathop{max}\limits_i \{\alpha \mathop{min}\limits_j u_{ij} + (1-\alpha) \mathop{max}\limits_j u_{ij}\},

где 0\le\alpha\le 1.

Из приведенного условия видно, что критерий Гурвица является взвешенной средней из наименьших и наибольших выигрышей для принятого коэффициента \alpha. В частности, при \alpha=1 критерий Гурвица соответствует критерию Вальда. Заметим, что минимальный критерий учитывает только наибольший выигрыш, получаемый в результате применения любой стратегии, и безразличен к любым другим вариантам.

Критерий Лапласа

В соответствии с этим критерием оптимальным считается действие, которому соответствует

\mathop{max}\limits \frac{1}{n}\sum\limits_{j=1}^{n} u_{ij}.

Следовательно, критерий Байеса (Лапласа) исходит из того, что раз совершенно неизвестно, какое из состояний \theta_1,\theta_2,...,\theta_n имеет место, то нужно поступить так, как будто они равновероятны.

Последовательный анализ

Для построения математических (описательных и нормативных) моделей , как правило, бывает необходимо предварительно определить характеристики тех или иных случайных величин или вероятностей элементарных событий. Обычным путем определения подобных величин является обработка результатов наблюдений и измерений. Обработка таких результатов осуществляется методами математической статистики.

Особое значение для применения методов математической статистики имеет вопрос о числе наблюдений, полученных для оценки того или иного параметра. Классические методы статистики исходят из наличия, в крайнем случае, достаточного числа наблюдений. Однако в силу целого ряда причин не всегда возможно набрать необходимое число наблюдений. Достаточно указать, что увеличение числа наблюдений, как правило, ведет к увеличению затрат материальных средств и времени на проведение соответствующих испытаний. В подобных случаях число наблюдений целесообразно заранее не определять, а решение об окончании эксперимента принимать последовательно на каждом его этапе в зависимости от результатов предыдущих наблюдений, — иными словами, каждый последующий опыт производить лишь после того, как анализ полученных до него результатов покажет необходимость продолжения опытов. Такое направление в математической статистике, создателем которой является А. Вальд, получило название последовательного анализа . (А. Вальд. Последовательный анализ. М., Физматгиз, 1960.)

В последовательном анализе объем выборки не устанавливается заранее, а определяется в процессе анализа статистических данных, получаемых последовательно в порядке их поступления. Основное достоинство этого метода по сравнению с методами классической статистики в том, что он требует в среднем значительно меньшее число наблюдений.

Статистическая гипотеза

Статистической гипотезой называется предположение относительно величины параметров, входящих в распределение случайной величины. Решение о принятии или отклонении статистической гипотезы (далее будем говорить просто гипотезы) всегда принимается на основе конечного числа наблюдений. Совокупность конечного числа наблюдений называется выборкой . Количество наблюдений, составляющих выборку, называется объемом выборки .

Последовательные наблюдения x_1,x_2,...,x_n величины x называются статистически независимыми, если условное распределение вероятностей i -го наблюдения x_i(i=1,2,...,n) не зависит от величин предыдущих наблюдений. Будем рассматривать только случай, когда последовательные наблюдения x независимы в вероятностном смысле.

< Лекция 11 || Лекция 12: 12 || Лекция 13 >
Данил Комардин
Данил Комардин

мне задали дистанционное задание на сертификат,но я не могу его найти