Опубликован: 26.04.2007 | Уровень: специалист | Доступ: платный
Лекция 19:

Проверка простой гипотезы относительно простой альтернативы

< Лекция 18 || Лекция 19: 1234 || Лекция 20 >

Функция байесовского риска

Введем обозначение ci для возможных в модели испытаний (17.7), (17.8) значений отношения правдоподобия:

c_i = \frac{p_2(z_i)}{p_1(z_i)},\quad 1 \le i \le N. ( 18.10)

Дополним эти значения величинами

c_0 = 0,\qq c_{N+1} = \infty ( 18.11)
и условимся, что нумерация чисел (18.10), (18.11) выполнена в порядке возрастания их значений, т.е.
c_i \le c_{i+1},\quad 0 \le i \le N. ( 18.12)

Поскольку при такой нумерации из включения c \in [c_i, c_{i+1}) вытекает выполнение неравенств

c_i \le c < c_{i+1},
то проверке по отношению правдоподобия с константой сравнения c соответствует критическая область Q1(i), содержащая первые i исходов из множества (17.7). Т.е.
(\forall\, 0 \le i \le N)\quad c \in [c_i, c_{i+1}) \to Q_1(i) = \{z_1\dots z_i\}. ( 18.13)
Таким образом, класс всех проверок по отношению правдоподобия (и, следовательно, класс всех байесовских решающих функций) определяется набором, содержащим N+1 критическую область:
Q_1(0) = \varnothing \dots Q_1(i) = \{z_1\dots z_i\} \dots Q_1(N) = Z. ( 18.14)

Теперь для конкретного значения w, определяющего функцию потерь из (18.1), вычислим вероятности \zeta_i из (18.2), при которых величина c(\zeta_i,w) из (18.3) совпадает с числом ci из (18.10), т.е.

c_i = c(\zeta_i,w) = \frac{\zeta_i}{w(1 - \zeta_i)}.
Отсюда
\zeta_i = \frac{wc_i}{(1 + wc_i)},\quad 0 \le i \le N+1, ( 18.15)
причем, в силу (18.11), (18.12),
\zeta_i \le \zeta_{i+1},\quad 0 \le i \le N,\quad \zeta_0 = 0,\ \zeta_{N+1} = 1. ( 18.16)

Таким образом, интервал [0,1) возможных значений априорной вероятности \zeta = \xi(1) появления первого состояния природы разбивается значениями из набора (18.15), (18.16) на N+1 подынтервал [\zeta_i, \zeta_{i+1}), 0\le i\le N. При этом из включения \zeta \in [\zeta_i, \zeta_{i+1}) вытекает справедливость неравенств

c_i \le c(\zeta,w) < c_{i+1},
и, следовательно, критическая область Q_\zeta байесовского критерия d_\xi совпадает с критической областью Q1(i) из (18.13), т.е.
(\forall \zeta \in [\zeta_i, \zeta_{i+1})) \quad Q_\zeta = Q_1(i) = \{z_1 \dots z_i\}. ( 18.17)

Согласно (18.1), потери статистика происходят лишь в случае ошибочных решений. Следовательно, математическое ожидание потерь, соответствующих критерию d, характеризуемому критической областью Q1 и вероятностями ошибок (18.6), (18.7), определяется величиной

\rho(\xi, d) = L(1,2)\zeta \beta + L(2,1)(1 - \zeta) \alpha, ( 18.18)
где \zeta из (18.2).

Согласно (18.6) и (18.7), критической области (18.17) соответствуют вероятности ошибок первого и второго рода, представляющие собой следующие суммы:

\alpha_i = p_2(z_1) + \ldots + p_2(z_i), ( 18.19)
\beta_i = p_1(z_{i+1}) + \ldots + p_1(z_N). ( 18.20)
Теперь из (18.18)-(18.20) следует, что величина
\rho(\zeta) = \rho(\xi, d_\xi) = \zeta(\beta_i - w \alpha_i) + w \alpha_i,\quad
\zeta \in [\zeta_i,\zeta_{i+1}), ( 18.21)
соответствует ожидаемым потерям для байесовского критерия.

Согласно (18.21), байесовский риск \rho(\zeta) является кусочно-линейной функцией параметра \zeta, поскольку значения коэффициентов \alpha_i и \beta_i из (18.19) и (18.20) остаются неизменными при вариации \zeta в подынтервале \zeta \in [\zeta_i, \zeta_{i+1}). Непосредственной проверкой можно убедиться, что функция \rho(\zeta) является непрерывной, поскольку линейные дуги (18.21) пересекаются в точках \zeta_i, 1\le i \le N. Действительно, положим

\zeta_i(\beta_{i-1} - w \alpha_{i-1}) + w \alpha_{i-1} =
\zeta_i(\beta_i - w \alpha_i) + w \alpha_i
и подставим в это выражение значения вероятностей ошибок из (18.19), (18.20). В результате получим равенство
\zeta_i = \frac{w p_2(z_i)}{p_1(z_i) + w p_2(z_i)},
совпадающее, согласно (18.10), с определением (18.15)2Ниже мы установим, что функция \rho(\zeta) является вогнутой, из чего автоматически следует ее непрерывность. Тем не менее, небольшое упражнение по непосредственной проверке непрерывности риска \rho(\zeta) представляется уместным с методической точки зрения.. Отметим также, что из (18.14) и (18.19)-(18.21) можно получить оценки
\rho(0) = \rho(1) = 0. ( 18.22)
Продолжим изучение свойств байесовского риска.

< Лекция 18 || Лекция 19: 1234 || Лекция 20 >
Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Гаральд Егоркин
Гаральд Егоркин
Россия
Михаил Алексеев
Михаил Алексеев
Россия, Уфа, УГАТУ, 2002