НОУ ИНТУИТ | Прикладная статистика. Лекция 2: Основы вероятностно-статистических методов описания неопределенностей

Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4094 / 1041 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00

Специальности: Экономист

Понятие эффективности вводится для несмещенных оценок, для которых $M(\theta_n) = \theta$ для всех возможных значений параметра $\theta$ . Если не требовать несмещенности, то можно указать оценки, при некоторых $\theta$ имеющие меньшую дисперсию и средний квадрат ошибки, чем эффективные.

Пример 8. Рассмотрим "оценку" математического ожидания $m_1\equiv 0$ . Тогда D(m_1)=0 , т.е. всегда меньше дисперсии $D(\overline{x})$ эффективной оценки $\overline{x}$ . Математическое ожидание среднего квадрата ошибки d_n(m_1)=m_2 , т.е. при $|m|<\sigma/\sqrt{n}$ имеем $d_n(m_1)<d_n(\overline{x})$ . Ясно, однако, что статистику $m_1\equiv 0$ бессмысленно рассматривать в качестве оценки математического ожидания .

Пример 9. Более интересный пример рассмотрен американским математиком Дж. Ходжесом:

$T_n= \left\{ \begin{aligned} &\overline{x},|\overline{x}|> n^{-\frac14},\\ &0,5\overline{x},|\overline{x}|\le n^{-\frac14}. \end{aligned} \right.$

Ясно, что T_n - состоятельная, асимптотически несмещенная оценка математического ожидания , при этом, как нетрудно вычислить,

$\lim_{n\rightarrow\infty}nd_n(T_n)= \left\{ \begin{aligned} &\sigma^2,m\ne 0,\\ &\frac{\sigma^2}{4},m=0. \end{aligned} \right.$

Последняя формула показывает, что при $m\ne 0$ оценка T_n не хуже $\overline{x}$ (при сравнении по среднему квадрату ошибки d_n ), а при m = 0 - в четыре раза лучше.

Подавляющее большинство оценок $\theta_n$ , используемых в вероятностно-статистических методах принятия решений, являются асимптотически нормальными, т.е. для них справедливы предельные соотношения:

$\lim_{n\rightarrow\infty}P \left\{ \frac{\theta_n-M(\theta_n)}{\sqrt{D(\theta_n)}}<x \right\} =\Phi(x)$

для любого

, где $\Phi(x)$ - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Это означает, что для больших объемов выборок (практически - несколько десятков или сотен наблюдений) распределения оценок полностью описываются их математическими ожиданиями и дисперсиями, а качество оценок - значениями средних квадратов ошибок $d_n(\theta_n)$ .

Наилучшими асимптотически нормальными оценками, сокращенно НАН-оценками, называются те, для которых средний квадрат ошибки $d_n(\theta_n)$ принимает при больших объемах выборки наименьшее возможное значение, т.е. величина $с=с(\theta_n,\theta)$ в формуле (4) минимальна. Ряд видов оценок - так называемые одношаговые оценки и оценки максимального правдоподобия - являются НАН-оценками, именно они обычно используются в вероятностно-статистических методах принятия решений.

Какова точность оценки параметра? В каких границах он может лежать? В нормативно-технической и инструктивно-методической документации, в таблицах и программных продуктах наряду с алгоритмами расчетов точечных оценок даются правила нахождения доверительных границ. Они и указывают точность точечной оценки. При этом используются такие термины, как доверительная вероятность, доверительный интервал. Если речь идет об оценивании нескольких числовых параметров, или же функции, упорядочения и т.п., то говорят об оценивании с помощью доверительной области.

Доверительная область - это область в пространстве параметров, в которую с заданной вероятностью входит неизвестное значение оцениваемого параметра распределения. "Заданная вероятность" называется доверительной вероятностью и обычно обозначается $\gamma$ . Пусть $\Theta$ - пространство параметров. Рассмотрим статистику $\Theta_1 = \Theta_1(x_1, x_2,..., x_n)$ - функцию от результатов наблюдений , значениями которой являются подмножества пространства параметров $\Theta$ . Так как результаты наблюдений - случайные величины, то $\Theta_1$ - также случайная величина, значения которой - подмножества множества $\Theta$ , т.е. $\Theta_1$ - случайное множество. Напомним, что множество - один из видов объектов нечисловой природы, случайные множества изучают в теории вероятностей и статистике объектов нечисловой природы.

В ряде литературных источников, к настоящему времени во многом устаревших, под случайными величинами понимают только те из них, которые в качестве значений принимают действительные числа. Согласно справочнику академика РАН Ю.В.Прохорова и проф. Ю.А.Розанова [ [ 2.17 ] ] случайные величины могут принимать значения из любого множества. Так, случайные вектора, случайные функции, случайные множества, случайные ранжировки (упорядочения) - это отдельные виды случайных величин. Используется и иная терминология: термин "случайная величина" сохраняется только за числовыми функциями, определенными на пространстве элементарных событий, а в случае иных областей значений используется термин "случайный элемент". (Замечание для математиков: все рассматриваемые функции, определенные на пространстве элементарных событий, предполагаются измеримыми.)

Статистика $\Theta_1$ называется доверительной областью, соответствующей доверительной вероятности $\gamma$ , если

$P\{\theta\in\Theta_1(x_1,x_2,...,x_n)\}=\gamma.$

( 5)

Ясно, что этому условию удовлетворяет, как правило, не одна, а много доверительных областей. Из них выбирают для практического применения какую-либо одну, исходя из дополнительных соображений, например, из соображений симметрии или минимизируя объем доверительной области, т.е. меру множества $\Theta_1$ .

При оценке одного числового параметра в качестве доверительных областей обычно применяют доверительные интервалы (в том числе лучи), а не иные типа подмножеств прямой. Более того, для многих двухпараметрических и трехпараметрических распределений (нормальных, логарифмически нормальных, Вейбулла-Гнеденко, гамма-распределений и др.) обычно используют точечные оценки и построенные на их основе доверительные границы для каждого из двух или трех параметров отдельно. Это делают для удобства пользования результатами расчетов: доверительные интервалы легче применять, чем фигуры на плоскости или тела в трехмерном пространстве.

Как следует из сказанного выше, доверительный интервал - это интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения. Границы доверительного интервала называют доверительными границами. Доверительная вероятность $\gamma$ - вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным. Оцениванием с помощью доверительного интервала называют способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.

Для числового параметра $\theta$ рассматривают верхнюю доверительную границу $\theta_В$ , нижнюю доверительную границу $\theta_H$ и двусторонние доверительные границы - верхнюю $\theta_{1В}$ и нижнюю $\theta_{1H}$ . Все четыре доверительные границы - функции от результатов наблюдений x_1, x_2,..., x_n и доверительной вероятности $\gamma$ .

Верхняя доверительная граница $\theta_B$ - случайная величина $\theta_B = \theta_B(x_1, x_2,..., x_n; \gamma)$ , для которой $Р(\theta\le\theta_B)=\gamma$ , где $\theta$ - истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $(-\infty; \theta_B]$ .

Нижняя доверительная граница $\theta_H$ - случайная величина $\theta_H = \theta_H(x_1, x_2,..., x_n; \gamma)$ , для которой $P(\theta\ge\theta_H)=\gamma$ , где $\theta$ - истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $[\theta_H; +\infty)$ .

Двусторонние доверительные границы - верхняя $\theta_{1B}$ и нижняя $\theta_{1H}$ - это случайные величины $\theta_{1B} = \theta_{1B}(x_1, x_2,..., x_n; \gamma)$ и $\theta_{1H} = \theta_{1H}(x_1, x_2,..., x_n; \gamma)$ , такие, что $P(\theta_{1H}\le\theta\le\theta_{1B})=\gamma$ , где $\theta$ - истинное значение оцениваемого параметра. Доверительный интервал в этом случае имеет вид $[\theta_{1H}; \theta_{1B}]$ .

Вероятности, связанные с доверительными границами, можно записать в виде частных случаев формулы (5):

$P\{\theta\in(-\infty;\theta_B]\}=\gamma,P\{\theta\in[\theta_H;+\infty)\} =\gamma,P\{\theta\in[\theta_{1H};\theta_{1B}]\}=\gamma.$

В нормативно-технической и инструктивно-методической документации, научной и учебной литературе используют два типа правил определения доверительных границ - построенных на основе точного распределения и построенных на основе асимптотического распределения некоторой точечной оценки $\theta_n$ параметра $\theta$ . Рассмотрим примеры.

Пример 10 . Пусть x_1, x_2,..., x_n - выборка из нормального закона $N(m,\sigma)$ , параметры и $\sigma$ неизвестны. Укажем доверительные границы для .

Известно [ [ 2.10 ] ], что случайная величина

$Y=\sqrt{n}\frac{\overline{x}-m}{s_0}$

имеет распределение Стьюдента с (n-1)

степенью свободы, где $\overline{x}$ - выборочное среднее арифметическое и s_0

- выборочное среднее квадратическое отклонение. Пусть $t_{\gamma}(n-1)$ и $t_{1-\gamma}(n-1)$ - квантили указанного распределения порядка $\gamma$ и $1-\gamma$ соответственно. Тогда

$P\{Y\t_{\gamma}(n-1)\}=\gamma,P\{Y\ge t_{1-\gamma}(n-1)\}=\gamma.$

Следовательно,

$P\left\{m\ge\overline{x}-t_{\gamma}(n-1)\frac{s_0}{\sqrt{n}}\right\}=\gamma,$

т.е. в качестве нижней доверительной границы $\theta_H$ , соответствующей доверительной вероятности $\gamma$ , следует взять

$\theta_H(x_1,x_2,...,x_n;\gamma)=\overline{x}-t_{\gamma}(n-1)\frac{s_0}{\sqrt{n}}.$

( 6)

Аналогично получаем, что

$P\left\{m\le\overline{x}-t_{1-\gamma}(n-1)\frac{s_0}{\sqrt{n}}\right\}=\gamma,$

Поскольку распределение Стьюдента симметрично относительно 0, то $t_{1-\gamma}(n-1)=-t_{\gamma}(n-1)$ . Следовательно, в качестве верхней доверительной границы $\theta_B$ для , соответствующей доверительной вероятности $\gamma$ , следует взять

$\theta_B(x_1,x_2,...,x_n;\gamma)=\overline{x}+t_{\gamma}(n-1)\frac{s_0}{\sqrt{n}}.$

( 7)

Как построить двусторонние доверительные границы? Положим

$\theta_{1H}=\theta_H(x_1,x_2,...,x_n;\gamma),\theta_{1B}=\theta_B(x_1,x_2,...,x_n;\gamma_2),$

где $\theta_{1H}$ и $\theta_{1B}$ заданы формулами (6) и (7) соответственно. Поскольку неравенство $\theta_{1H}\le m\le \theta_{1B}$ выполнено тогда и только тогда, когда

$t_{\gamma_2}(n-1)\ge Y\ge t_{1-\gamma_1}(n-1),\;\text{то}\; P\{\theta_{1H}\le m\le\theta_{1B}\}=\gamma_1+\gamma_2 -1,$

(в предположении, что $\gamma_1 > 0,5; \gamma_2 > 0,5$ ). Следовательно, если $\gamma = \gamma_1 + \gamma_2 - 1$ , то $\theta_{1H}$ и $\theta_{1B}$ - двусторонние доверительные границы для

, соответствующие доверительной вероятности $\gamma$ . Обычно полагают $\gamma_1 = \gamma_2$ , т.е. в качестве двусторонних доверительных границ $\theta_{1H}$ и $\theta_{1B}$ , соответствующих доверительной вероятности $\gamma$ , используют односторонние доверительные границы $\theta_H$ и $\theta_B$ , соответствующие доверительной вероятности $(1+\gamma)/2$ .

Другой вид правил построения доверительных границ для параметра $\theta$ основан на асимптотической нормальности некоторой точечной оценки $\theta_n$ этого параметра. В вероятностно-статистических методах принятия решений используют, как уже отмечалось, несмещенные или асимптотически несмещенные оценки $\theta_n$ , для которых смещение либо равно 0, либо при больших объемах выборки пренебрежимо мало по сравнению со средним квадратическим отклонением оценки $\theta_n$ . Для таких оценок при всех

$\lim_{n\rightarrow\infty}P \left\{ \frac{\theta_n-\theta}{\sqrt{D(\theta_n)}}\le x \right\} \Phi(x),$

где $\Phi(x)$ - функция нормального распределения N(0;1)

. Пусть $u_{\gamma}$ - квантиль порядка $\gamma$ распределения N(0;1)

. Тогда

$\lim_{n\rightarrow\infty}P \left\{ \frac{\theta_n-\theta}{\sqrt{D(\theta_n)}}\le u_{\gamma} \right\}=\gamma$

( 8)

Поскольку неравенство

$\frac{\theta_n-\theta}{\sqrt{D(\theta_n)}}\le u_{\gamma}$

равносильно неравенству

$\theta_n-u_{\gamma}\sqrt{D(\theta_n)}\le\theta,$

то в качестве $\theta_H$ можно было бы взять левую часть последнего неравенства. Однако точное значение дисперсии $D(\theta_n)$ обычно неизвестно. Зато часто удается доказать, что дисперсия оценки имеет вид

$D(\theta_n)=\frac{h(\theta)}{n}$

(с точностью до пренебрежимо малых при росте

слагаемых), где $h(\theta)$ - некоторая функция от неизвестного параметра $\theta$ . Справедлива (см. 4.3) теорема о наследовании сходимости [

, $\S$ 2.4], согласно которой при подстановке в $h(\theta)$ оценки $\theta_n$ вместо $\theta$ соотношение (8) остается справедливым, т.е.

$\lim_{n\rightarrow\infty}P \left\{ \theta_n-u_{\gamma}\frac{\sqrt{h(\theta_n)}}{\sqrt{n}}\le\theta \right\} =\gamma.$

Следовательно, в качестве приближенной нижней доверительной границы следует взять

$\theta_H=\theta_n-u_{\gamma}\frac{\sqrt{h(\theta_n)}}{\sqrt{n}},$

а в качестве приближенной верхней доверительной границы -

$\theta_B=\theta_n+u_{\gamma}\frac{\sqrt{h(\theta_n)}}{\sqrt{n}}.$

С ростом объема выборки качество приближенных доверительных границ улучшается, так как вероятности событий $\{\theta\ge\theta_H\}$ и $\{\theta\le\theta_B\}$ стремятся к $\gamma$ . Для построения двусторонних доверительных границ поступают аналогично правилу, указанному выше в примере 10 для интервального оценивания параметра нормального распределения. А именно, используют односторонние доверительные границы, соответствующие доверительной вероятности $(1+\gamma)/2$ .

При обработке экономических, управленческих или технических статистических данных обычно используют значение доверительной вероятности $\gamma=0,95$ . Применяют также значения $\gamma=0,99$ или $\gamma=0,90$ . Иногда встречаются значения $\gamma=0,80, \gamma=0,975, \gamma=0,98$ и др.

Для дискретных распределений, таких, как биномиальное, гипергеометрическое или распределение Пуассона (а также распределения статистики Колмогорова

$D_n=\sqrt{n}\sup_x|F_n(x)-F_0(x)|$

и других непараметрических статистик), функции распределения имеют скачки. Поэтому для заданного заранее значения $\gamma$ , например, $\gamma=0,95$ , нельзя указать доверительные границы, поскольку уравнения, с помощью которых вводятся доверительные границы, не имеют ни одного решения. Так, рассмотрим биномиальное распределение

$P(Y=y|p,n)={n\choose y}p^y(1-p)^{n-y}, y=0,1,2,...,n,$

где

- число осуществлений события,

- объем выборки. Для него нельзя указать статистику K(Y,n)

такую, что

$P\{p\le K(Y,n)\}=\gamma,$

поскольку

- функция от

и может принимать не больше значений, чем принимает

, т.е.

, а для $\gamma$ имеется бесконечно много возможных значений - столько, сколько точек на отрезке. Сказанное означает, что верхней доверительной границы в случае биномиального распределения не существует.

Для дискретных распределений приходится изменить определения доверительных границ. Покажем изменения на примере биномиального распределения. Так, в качестве верхней доверительной границы $\theta_B$ используют наименьшее K(Y,n) такое, что

$P\{p\le K(Y,n)\}\ge\gamma.$

Аналогичным образом поступают для других доверительных границ и других распределений. Необходимо иметь в виду, что при небольших и истинная доверительная вероятность $P\{p\le K(Y,n)\}$ может существенно отличаться от номинальной $\gamma$ , как это подробно продемонстрировано в работе [ [ 2.4 ] ]. Поэтому наряду с величинами типа K(Y,n) (т.е. доверительных границ) при разработке таблиц и компьютерных программ необходимо предусматривать возможность получения и величин типа $P\{p\le K(Y,n)\}$ (т.е. достигаемых доверительных вероятностей).

Основные понятия, используемые при проверке гипотез. Статистическая гипотеза - любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведем формулировки нескольких статистических гипотез:

Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием.
Результаты наблюдений имеют функцию распределения .
Результаты наблюдений имеют нормальное распределение.
Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение.
Результаты наблюдений в двух независимых выборках имеют одно и то же распределение.

Различают нулевую и альтернативную гипотезы. Нулевая - гипотеза, подлежащая проверке. Альтернативная - каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают H_0 , альтернативную - H_1 (от англ. Hypothesis - "гипотеза").

Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры.

Пример 11. Пусть нулевая гипотеза - гипотеза 2 из приведенного выше списка, а альтернативная - гипотеза 1. Сказанное означает, что реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин с функцией распределения $N(0,\sigma)$ , где параметр $\sigma$ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так:

$H_0:\sigma=1,\;\text{а альтернативную: }H_1:\sigma\ne 1.$

Пример 12. Пусть нулевая гипотеза - по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная - гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения $N(m,\sigma)$ при некоторых значениях и $\sigma$ . Гипотезы записываются так:

$H_0:m=0,\sigma=1$

(оба параметра принимают фиксированные значения);

$H_1:m\ne 0\;\textit{и/или }\sigma\ne 1$ (т.е. либо $m\ne 0$ , либо $\sigma\ne 1$ , либо и $m\ne 0$ , и $\sigma\ne 1$ ).

Пример 13. Пусть H_0 - гипотеза 1 из приведенного выше списка, а H_1 - гипотеза 3 из того же списка. Тогда вероятностная модель - та же, что в примере 12,

$\begin{aligned} &H_0:m=0,\sigma\text{ произвольно};\\ &H_1:m\ne 0,\sigma\text{ произвольно}. \end{aligned}$

Пример 14. Пусть H_0 - гипотеза 2 из приведенного выше списка, а согласно H_1 результаты наблюдений имеют функцию распределения F(x) , не совпадающую с функцией стандартного нормального распределения $\Phi(x)$ . Тогда $H_0:F(x)=\Phi(x)$ при всех (записывается как $F(х)\equiv\Phi(x)$ ); $H_1:F(x_0)\ne \Phi(x_0)$ при некотором x_0 (т.е. неверно, что $F(x)\equiv\Phi(x)$ ).

Примечание. Здесь $\equiv$ - знак тождественного совпадения функций (т.е. совпадения при всех возможных значениях аргумента ).

Пример 15. Пусть H_0 - гипотеза 3 из приведенного выше списка, а согласно H_1 результаты наблюдений имеют функцию распределения F(x) , не являющуюся нормальной. Тогда

$H_0:F(x)\equiv\Phi\left(\frac{x-m}{\sigma}\right)\text{ при некоторых } m,\sigma;$

такова, что для любых $m,\sigma$ найдется $x_0=x_0(m,\sigma)$ такое, что $F(x_0)\ne\Phi\left(\frac{x_0-m}{\sigma}\right)$ .

Пример 16. Пусть H_0 - гипотеза 4 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F(x) и G(x) , являющихся нормальными с параметрами $m_1,\sigma_1$ и $m_2,\sigma_2$ соответственно, а H_1 - отрицание H_0 . Тогда $H_0:m_1=m_2,\sigma_1=\sigma_2$ , причем m_1 и $\sigma_1$ произвольны; $H_1:m_1\ne m_2$ и/или $\sigma_1\ne\sigma_2$ .

Пример 17. Пусть в условиях примера 16 дополнительно известно, что $\sigma_1=\sigma_2$ . Тогда $H_0:m_1=m_2, \sigma>0$ , причем m_1 и $\sigma$ произвольны; $H_1: m_1 \ne m_2, \sigma > 0$ .

Пример 18. Пусть H_0 - гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F(x) и G(x) соответственно, а H_1 - отрицание H_0 . Тогда $Н0:F(x)\equiv G(x)$ , где F(x) - произвольная функция распределения; H_1:F(x) и G(x) - произвольные функции распределения, причем $F(x)\ne G(x)$ при некоторых .

Пример 19. Пусть в условиях примера 17 дополнительно предполагается, что функции распределения F(x) и G(x) отличаются только сдвигом, т.е. G(x)=F(x-a) при некотором . Тогда $H_0:F(x)\equiv G(x)$ , где F(x) - произвольная функция распределения; $H_1:G(x)=F(x-a), a\ne 0$ , где F(x) - произвольная функция распределения.

Пример 20. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F(x) - функция нормального распределения с единичной дисперсией, т.е. имеет вид N(m,1) . Тогда H_0:m=0 (т.е. $F(x)=\Phi(x)$ при всех ; записывается как $F(x)\equiv\Phi(x)); H_1:m\ne 0$ (т.е. неверно, что $F(x)\equiv \Phi(x)$ ).

Пример 21. При статистическом регулировании технологических, экономических, управленческих или иных процессов [ [ 2.16 ] ] рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы

$H_0:m=m_0,\;H_1:m=m_1,$

где значение параметра m = m_0

соответствует налаженному ходу процесса, а переход к m = m_1

свидетельствует о разладке.

Пример 22. При статистическом приемочном контроле [ [ 2.16 ] ] число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является p = D/N - уровень дефектности, где - объем партии продукции, - общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и др.) планы контроля часто нацелены на проверку гипотезы

$H_0:p\le AQL\text{ против альтернативной гипотезы }H_1:p\ge LQ,$

где

- приемочный уровень дефектности,

- браковочный уровень дефектности (очевидно, что AQL<LQ

Пример 23. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации $\nu=\sigma/M(X)$ . Требуется проверить нулевую гипотезу

$H_0:\nu\le\nu_0\text{ при альтернативной гипотезе }H_1:\nu>\nu_0,$

где $\nu_0$ - некоторое заранее заданное граничное значение.

Пример 24. Пусть вероятностная модель двух выборок - та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим M(X) и M(Y) соответственно. В ряде ситуаций проверяют нулевую гипотезу

против альтернативной гипотезы

$H_1:M(X)\ne M(Y)$

Пример 25. Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0. При проверке симметричности H_0:F(-x)=1-F(x) при всех , в остальном произвольна; $H_1: F(-x+_0) \ne 1 - F(x0)$ при некотором x_0 , в остальном произвольна.

В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже.

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные - различны. Поэтому в условиях примера 14 следует применять методы проверки согласия с фиксированным распределением (например, критерии Колмогорова или омега-квадрат), а в условиях примера 20 - критерий Стьюдента. Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач (не сможет обнаружить все варианты альтернативных гипотез). Если в условиях примера 20 использовать критерий согласия Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента.

При обработке реальных данных большое значение имеет правильный выбор гипотез H_0 и H_1 . Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального [ [ 2.16 ] ].

Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных H_1 . В частности при проверке гипотезы 2 (из приведенного выше списка) как нулевой следует в качестве альтернативной гипотезы использовать H_1 из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе.

Статистические гипотезы бывают параметрические и непараметрические. Предположение, которое касается неизвестного значения параметра распределения, входящего в некоторое параметрическое семейство распределений, называется параметрической гипотезой (напомним, что параметр может быть и многомерным). Предположение, при котором вид распределения неизвестен (т.е. не предполагается, что оно входит в некоторое параметрическое семейство распределений), называется непараметрической гипотезой. Таким образом, если распределение F(x) результатов наблюдений в выборке согласно принятой вероятностной модели входит в некоторое параметрическое семейство $\{F(x;\theta), \theta\in\Theta\}$ , т.е. $F(x) = F(x;\theta_0)$ при некотором $\theta_0\in\Theta$ , то рассматриваемая гипотеза - параметрическая, в противном случае - непараметрическая.

Если и H_0 и H_1 - параметрические гипотезы, то задача проверки статистической гипотезы - параметрическая. Если хотя бы одна из гипотез H_0 и H_1 - непараметрическая, то задача проверки статистической гипотезы - непараметрическая. Другими словами, если вероятностная модель ситуации - параметрическая, т.е. полностью описывается в терминах того или иного параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы - параметрическая. Если же вероятностная модель ситуации - непараметрическая, т.е. ее нельзя полностью описать в терминах какого-либо параметрического семейства распределений вероятностей, то и задача проверки статистической гипотезы - непараметрическая. В примерах 11-13, 16, 17, 20-22 даны постановки параметрических задач проверки гипотез, а в примерах 14, 15, 18, 19, 23-25 - непараметрических. Непараметрические задачи делятся на два класса: в одном из них речь идет о проверке утверждений, касающихся функций распределения (примеры 14, 15, 18, 19, 25), во втором - о проверке утверждений, касающихся характеристик распределений (примеры 23, 24).

Статистическая гипотеза называется простой, если она однозначно задает распределение результатов наблюдений, вошедших в выборку. В противном случае статистическая гипотеза называется сложной. Гипотеза 2 из приведенного выше списка, нулевые гипотезы в примерах 11, 12, 14, 20, нулевая и альтернативная гипотезы в примере 21 - простые, все остальные упомянутые выше гипотезы - сложные.

Однозначно определенный способ проверки статистических гипотез называется статистическим критерием. Статистический критерий строится с помощью статистики U(x_1, x_2, ..., x_n) - функции от результатов наблюдений . В пространстве значений статистики выделяют критическую область $\Psi$ , т.е. область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют (иногда говорят - отвергают) нулевую гипотезу, в противном случае - не отвергают (т.е. принимают).

Статистику , используемую при построении определенного статистического критерия, называют статистикой этого критерия. Например, в задаче проверки статистической гипотезы, приведенной в примере 14, применяют критерий Колмогорова, основанный на статистике

$D_n=\sqrt{n}\sup_{x}|F_n(x)-F_0(x)|.$

При этом D_n называют статистикой критерия Колмогорова.

Частным случаем статистики является векторзначная функция результатов наблюдений U_0(x_1, x_2, ..., x_n) = (x_1, x_2, ..., x_n) , значения которой - набор результатов наблюдений. Если x_i - числа, то U_0 - набор чисел, т.е. точка -мерного пространства. Ясно, что статистика критерия является функцией от U_0 , т.е. U = f(U_0) . Поэтому можно считать, что $\Psi$ - область в том же -мерном пространстве, нулевая гипотеза отвергается, если $(x_1, x_2, ..., x_n)\in\Psi$ , и принимается в противном случае.

В вероятностно-статистических методах принятия решений, статистические критерии, как правило, основаны на статистиках , принимающих числовые значения, и критические области имеют вид

$\Psi=\{U(x_1,x_2,...,x_n)>C\},$

( 9)

где

- некоторые числа.

Статистические критерии делятся на параметрические и непараметрические. Параметрические критерии используются в параметрических задачах проверки статистических гипотез, а непараметрические - в непараметрических задачах.

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается $\alpha$ . Таким образом, $\alpha=P\{U\in\Psi|H_0\}$ , т.е. уровень значимости $\alpha$ - это вероятность события $\{U\in\Psi\}$ , вычисленная в предположении, что верна нулевая гипотеза H_0 .

Уровень значимости однозначно определен, если H_0 - простая гипотеза. Если же H_0 - сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей H_0 . Статистику критерия обычно строят так, чтобы вероятность события $\{U\in\Psi\}$ не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезе H_0 ) имеют результаты наблюдений. Для статистик критерия общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берется по всем возможным распределениям, удовлетворяющим нулевой гипотезе H_0 , т.е. $\alpha=\sup P\{U\in\Psi|H_0\}$ .

Если критическая область имеет вид, указанный в формуле (9), то

$P\{U>C|H_0\}=\alpha.$

Если задано, то из последнего соотношения определяют $\alpha$ . Часто поступают по иному - задавая $\alpha$ (обычно $\alpha = 0,05$ , иногда $\alpha = 0,01$ или $\alpha = 0,1$ , другие значения $\alpha$ используются гораздо реже), определяют из уравнения (10), обозначая его $C_{\alpha}$ , и используют критическую область $\Psi=\{U>C_{\alpha}\}$ с заданным уровнем значимости $\alpha$ .

Вероятность ошибки второго рода есть $P\{U\notin\Psi|H_1\}$ . Обычно используют не эту вероятность, а ее дополнение до 1, т.е. $P\{U\in\Psi|H_1}=1-P\{U\notin\Psi|H_1\}$ . Эта величина носит название мощности критерия. Итак, мощность критерия - это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия - функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области $\Psi$ и действительного распределения результатов наблюдений. В параметрической задаче проверки гипотез распределение результатов наблюдений задается параметром $\theta$ . В этом случае функция мощности обозначается $M(\Psi,\theta)$ и зависит от критической области $\Psi$ и действительного значения исследуемого параметра $\theta$ . Если

$H_0:\theta=\theta_0,H_1:\theta=\theta_1,$

то

$M(\Psi,\theta_0)=\alpha,M(\Psi,\theta_1)=1-\beta,$

где $\alpha$ - вероятность ошибки первого рода, $\beta$ - вероятность ошибки второго рода. В статистическом приемочном контроле $\alpha$ - риск изготовителя, $\beta$ - риск потребителя. При статистическом регулировании технологического процесса $\alpha$ - риск излишней наладки, $\beta$ - риск незамеченной разладки.

Функция мощности $M(\Psi,\theta)$ в случае одномерного параметра $\theta$ обычно достигает минимума, равного $\alpha$ , при $\theta = \theta_0$ , монотонно возрастает при удалении от $\theta_0$ и приближается к 1 при $|\theta-\theta_0|\rightarrow\infty$ .

В ряде вероятностно-статистических методов принятия решений используется оперативная характеристика $L(\Psi,\theta)$ - вероятность принятия нулевой гипотезы в зависимости от критической области $\Psi$ и действительного значения исследуемого параметра $\theta$ . Ясно, что

$L(\Psi,\theta)=1-M(\Psi,\theta).$

Основной характеристикой статистического критерия является функция мощности. Для многих задач проверки статистических гипотез разработан не один статистический критерий, а целый ряд. Чтобы выбрать из них определенный критерий для использования в конкретной практической ситуации, проводят сравнение критериев по различным показателям качества [ [ 2.16 ] , прил. 3], прежде всего с помощью их функций мощности. В качестве примера рассмотрим лишь два показателя качества критерия проверки статистической гипотезы - состоятельность и несмещенность.

Пусть объем выборки растет, а U_n и $\Psi_n$ - статистики критерия и критические области соответственно. Критерий называется состоятельным, если

$\lim_{n\rightarrow\infty}P\{U_n\in\Psi_n|H_1\}=1,$

т.е. вероятность отвергнуть нулевую гипотезу стремится к 1, если верна альтернативная гипотеза.

Статистический критерий называется несмещенным, если для любого $\theta_0$ , удовлетворяющего H_0 , и любого $\theta_1,$ удовлетворяющего H_1 , справедливо неравенство

$P\{U\in\Psi|\theta_0\}<P\{U\in\Psi|\theta_1\},$

т.е. при справедливости H_0

вероятность отвергнуть H_0

меньше, чем при справедливости H_1

При наличии нескольких статистических критериев в одной и той же задаче проверки статистических гипотез следует использовать состоятельные и несмещенные критерии.

Дальше >>

Авторизоваться

Прикладная статистика

Основы вероятностно-статистических методов описания неопределенностей

Вопросы и ответы