Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4085 / 1036 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 8:

Статистический анализ числовых величин

8.4. Состоятельные критерии проверки однородности независимых выборок

В соответствии с методологией прикладной статистики естественно потребовать, чтобы рекомендуемый для массового использования в технических, экономических, медицинских и иных исследованиях критерий однородности был состоятельным. Напомним: это значит, что для любых отличных друг от друга функций распределения F(x) и G(x) (другими словами, при справедливости альтернативной гипотезы H_1 ) вероятность отклонения гипотезы H_0 должна стремиться к 1 при увеличении объемов выборок т и п. Из перечисленных выше (в конце 8.2) критериев однородности состоятельными являются только критерии Смирнова и типа омега-квадрат.

Проведенное исследование мощности (методом статистических испытаний) первых четырех из перечисленных выше критериев (при различных вариантах функций распределения F(x) и G(x) ) подтвердило преимущество критериев Смирнова и омега-квадрат и при объемах выборок 6-12. Рассмотрим эти критерии подробнее.

Критерий Смирнова однородности двух независимых выборок. Он предложен членом-корреспондентом АН СССР Н.В. Смирновым в 1939 г. (см. справочник [ [ 2.1 ] ]). Единственное ограничение - функции распределения F(x) и G(x) должны быть непрерывными. Напомним, что согласно Л.Н. Большеву и Н.В. Смирнову [ [ 2.1 ] ] значение эмпирической функции распределения в точке x равно доле результатов наблюдений в выборке, меньших x. Критерий Смирнова основан на использовании эмпирических функций распределения F_m(x) и G_n(x), построенных по первой и второй выборкам соответственно. Значение статистики Смирнова

D_{m,n}=\sup_x|F_m(x)-G_m(x)|
сравнивают с соответствующим критическим значением (см., например, [ [ 2.1 ] ]) и по результатам сравнения принимают или отклоняют гипотезу Н_0 о совпадении (однородности) функций распределения. Практически значение статистики D_{m,n} рекомендуется, согласно [ [ 2.1 ] ], вычислять по формулам
\begin{gathered}
D_{m,n}^+=\max_{1\le r\le n}\left[\frac{r}{n}-F_m(y'_r)\right]
=\max_{1\le r\le m}\left[G_n(x'_s)-\frac{s-1}{m}\right], \\
D_{m,n}^-=\max_{1\le r\le n}\left[F_m(y'_r)-\frac{r-1}{n}\right]
=\max_{1\le r\le m}\left[\frac{s}{m}-G_n(x'_s)\right], \\
D_{m,n}=\max(D_{m,n}^+,D_{m,n}^-),
\end{gathered}

где x'_1<x'_2<...<x'_m - элементы первой выборки x_1,x_2,...,x_m, переставленные в порядке возрастания, а y'_1<y'_2<...<y'_n - элементы второй выборки y_1,y_2,...,y_n, также переставленные в порядке возрастания. Поскольку функции распределения F(x) и G(x) предполагаются непрерывными, то вероятность совпадения каких-либо выборочных значений равна 0.

Разработаны алгоритмы и программы для ЭВМ, позволяющие рассчитывать точные распределения, процентные точки и достигаемый уровень значимости для двухвыборочной статистики Смирнова D_{m,n}, а также подробные таблицы (см., например, методику [6], содержащую описание алгоритмов, тексты программ и подробные таблицы).

Однако у критерия Смирнова есть и недостатки. Его распределение сосредоточено в сравнительно небольшом числе точек, поэтому функция распределения растет большими скачками. В результате не удается выдержать заданный уровень значимости. Реальный уровень значимости может в несколько раз отличаться от номинального (подробному обсуждению неклассического феномена существенного отличия реального уровня значимости от номинального посвящена работа [ [ 2.4 ] ]).

Критерий типа омега-квадрат (Лемана-Розенблатта). Статистика критерия типа омега-квадрат для проверки однородности двух независимых выборок имеет вид:

A=\frac{mn}{m+n}\int\limits_{-\infty}^{+\infty}(F_m(x)-G_n(x))^2 dH_{m+n}(x),
где H_{m+n}(x) - эмпирическая функция распределения, построенная по объединенной выборке. Легко видеть, что
H_{m+n}(x)=\frac{m}{m+n}F_m(x)+\frac{n}{m+n}G_n(x).

Статистика A типа омега-квадрат была предложена Э. Леманом в 1951 г., изучена в 1952 г. М. Розенблаттом, а затем и другими исследователями. Она зависит лишь от рангов элементов двух выборок в объединенной выборке. Пусть x_1,x_2,...,x_m - первая выборка, x'_1<x'_2<...x'_m - соответствующий вариационный ряд, y_1,y_2,...,y_n - вторая выборка, y'_1<y'_2<...<y'_n - вариационный ряд, соответствующий второй выборке. Поскольку функции распределения независимых выборок непрерывны, то с вероятностью 1 все выборочные значения различны, совпадения отсутствуют. Статистика A представляется в виде (см., например, [ [ 2.1 ] ]):

A=\frac{1}{mn(m+n)}[m\sum_{i=1}^m(r_i-i)^2+n\sum_{j=1}^n(s_j-j^2)]-\frac{4mn-1}{6(m+n)},
где r_i - ранг x'_i и s_j - ранг y'j в общем вариационном ряду, построенном по объединенной выборке.

Правила принятия решений при проверке однородности двух выборок на основе статистик Смирнова и типа омега-квадрат, т.е. таблицы критических значений в зависимости от уровней значимости и объемов выборок, приведены, например, в [ [ 2.1 ] ].

Рекомендации по выбору критерия однородности. Для критерия типа омега-квадрат нет выраженного эффекта различия между номинальными и реальными уровнями значимости. Поэтому мы рекомендуем для проверки однородности функций распределения (гипотеза H_0 ) применять статистику A типа омега-квадрат. Если методическое, табличное или программное обеспечение для статистики Лемана - Розенблатта отсутствует, рекомендуем использовать критерий Смирнова. Для проверки однородности математических ожиданий (гипотеза H'_0 ) целесообразно применять критерий Крамера-Уэлча. По нашему мнению, статистики Стьюдента, Вилкоксона и др. допустимо использовать лишь в отдельных частных случаях, рассмотренных выше.

Некоторые соображения о внедрении современных методов прикладной статистики в практику технических, экономических, медицинских и иных исследований. Даже из проведенного выше разбора лишь одной из типичных статистических задач - задачи проверки однородности двух независимых выборок - можно сделать вывод о целесообразности широкого развертывания работ по критическому анализу сложившейся практики статистической обработки данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и подразделениями. Целесообразно создание службы статистических консультаций в системе научно-исследовательских учреждений и вузов технического, экономического, медицинского профиля.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?