Опубликован: 09.11.2009 | Уровень: для всех | Доступ: свободно
Лекция 8:

Статистический анализ числовых величин

8.5. Методы проверки однородности связанных выборок

Начнем с практического примера. Приведем письмо главного инженера подмосковного химического комбината (некоторые названия изменены).

"Директору Института высоких статистических технологий и эконометрики (Фамилия, имя, отчество)

Наш комбинат выпускает мастику по ГОСТ (следует номер) и является разработчиком указанного стандарта.

В результате исследовательских работ по подбору стандартного метода определения вязкости мастики на комбинате накоплен большой опыт сравнительных данных определения вязкости по двум методам:

  • неразбавленной мастики - на нестандартном приборе фабрики им. Петрова;
  • раствора мастики - на стандартном вискозиметре ВЗ-4.

Учитывая высокую компетентность сотрудников Вашего института, прошу Вас, в порядке оказания технической помощи нашему предприятию, поручить соответствующей лаборатории провести обработку представленных данных современными статистическими методами и выдать заключение о наличии (или отсутствии) зависимости между указанными выше методами определения вязкости мастики. Ваше заключение необходимо для решения спорного вопроса о целесообразности вновь ввести в ГОСТ (следует номер) метода определения вязкости мастики по вискозиметру ВЗ-4, который, по мнению некоторых потребителей, был необоснованно исключен из этого ГОСТ по изменению № 1.

Заранее благодарю Вас за оказанную помощь.

Приложение: статистика на 3 листах.

Главный инженер (Подпись) (Фамилия, имя, отчество)"

Комментарий. Вязкость - один из показателей качества мастики. Измерять его можно с помощью различных способов, которые, как оказалось, дают разные результаты. Ничего необычного в этом нет. Однако поставщику и потребителю следует согласовать способы измерения показателей качества. Иначе достаточно часто поставщик (производитель) будет утверждать, что он выполнил условия контракта, а потребитель заявлять, что нет. Такая конфликтная ситуация иногда называется арбитражной, поскольку для ее решения стороны могут обращаться в арбитражный суд. Простейший метод согласования способов измерения показателей состоит в том, чтобы выбрать один из них и внести в государственный стандарт, который тем самым будет содержать не только описание продукции, перечень ее показателей качества и требований к ним, но и способы измерения этих показателей.

Заключение по статистическим данным, представленным химическим комбинатом. Для каждой из 213 партий мастики представлены два числа - результат измерения вязкости на нестандартном приборе фабрики им. Петрова и результат измерения вязкости на стандартном вискозиметре ВЗ-4. Требуется установить, дают ли два указанных метода сходные результаты. Если они дают сходные результаты, то нет необходимости вводить в соответствующий ГОСТ указание о методе определения вязкости. Если же методы дают существенно различные результаты, то подобное указание ввести необходимо.

Для применения статистических методов в рассматриваемой задаче необходимо описать вероятностную модель. Считаем, что статистические данные имеют вид (x_i,y_i),i=1,2,...,213 где x_i - результат измерения на нестандартном приборе фабрики им. Петрова в i -ой партии, а y_i - результат измерения вязкости на стандартном вискозиметре ВЗ-4 в той же i -ой партии. Пусть a_i - истинное значение показателя качества в i -ой партии. Естественно считать, что указанные выше случайные векторы независимы в совокупности. При этом они не являются одинаково распределенными, поскольку отличаются истинными значениями показателей качества a_i. Принимаем, что при каждом i случайные величины x_i - a_i и y_i - a_i независимы и одинаково распределены. Это условие и означает однородность в связанных выборках. Параметры связи - величины a_i. Их наличие не позволяет объединить первые координаты в одну выборку, вторую - во вторую, как делалось в случае проверки однородности двух независимых выборок.

В предположении непрерывности функций распределения из условия однородности в связанных выборках вытекает, что

P(x_i<y_i)=P(x_i\ge y_i)=\frac12 .

Рассмотрим случайные величины Z_i=x_i-y_i, i=1,2,...,213. Из последнего соотношения вытекает, что при справедливости гипотезы однородности для связанных выборок эти случайные величины имеют нулевые медианы. Другими словами, проверка того, что методы измерения вязкости дают схожие результаты, эквивалентна проверке равенства 0 медиан величин Z_i.

Для проверки гипотезы о том, что медианы величин Z_i нулевые, применим широко известный критерий знаков (см., например, справочник [ [ 2.1 ] , с.89-91]). Согласно этому критерию необходимо подсчитать, в скольких партиях x_i<y_i и в скольких x_i\ge y_i. Для представленных химическим комбинатом данных x_i<y_i в 187 случаях из 213 и x_i\ge y_i в 26 случаях из 213.

Если рассматриваемая гипотеза верна, то число W осуществлений события \{x_i<y_i\} имеет биномиальное распределение с параметрами p = 1/2 и n = 213. Математическое ожидание М(W)=106,5, а среднее квадратическое отклонение \sigma=\sqrt{np(1-p)}=7,3. Следовательно, интервал M(W)\pm 3\sigma - это интервал 84\le W\le 129. Найденное по данным химического комбината значение W=187 лежит далеко вне этого интервала. Поэтому рассматриваемую гипотезу необходимо отвергнуть (на любом используемом в прикладных работах уровне значимости, в частности, на уровне значимости 1%).

Таким образом, статистический анализ показывает, что два метода дают существенно различные результаты - по прибору фабрики им. Петрова результаты измерений, как правило, меньше, чем по вискозиметру ВЗ-4. Это означает, что в соответствующий ГОСТ целесообразно ввести указание на метод определения вязкости.

Система вероятностных моделей при проверке гипотезы однородности для связанных выборок. Как и в случае проверки однородности для независимых выборок, система вероятностных моделей состоит из трех уровней. Наиболее простая модель - на уровне однородности альтернативного признака - уже рассмотрена. Она сводится к проверке гипотезы о значении параметра биномиального распределения:

H_0:p=\frac12 .

Речь идет о "критерии знаков". При справедливости гипотезы однородности число W осуществлений события \{x_i<y_i\} имеет биномиальное распределение с вероятностью успеха p = 1/2 и числом испытаний n. Альтернативная гипотеза состоит в том, что вероятность успеха отличается от 1/2:

H_1:p\ne\frac12 .

Гипотезу p = 1/2 можно проверять как непосредственно с помощью биномиального распределения (используя таблицы или программное обеспечение), так и опираясь на теорему Муавра-Лапласа. Согласно этой теореме

\lim_{n\rightarrow\infty}P\left\{\frac{2W-n}{\sqrt{n}}\le x\right\}=\Phi(x)
при всех x, где \Phi(x) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Из теоремы Муавра-Лапласа вытекает правило принятия решений на уровне значимости 5%: если
\left|\frac{2W-n}{\sqrt{n}}\right|\le 1,96 ,
то гипотезу однородности связанных выборок принимают, в противном случае - отклоняют. Как обычно, при желании использовать другой уровень значимости применяют в качестве критического значения иной квантиль нормального распределения. Использование предельных теорем допустимо при достаточно больших объемах выборки. По поводу придания точного смысла термину "достаточно большой" продолжаются дискуссии. Обычно считается, что несколько десятков (два-три десятка) - это уже "достаточно много". Более правильно сказать, что ответ зависит от задачи, от ее сложности и практической значимости.

Второй уровень моделей проверки однородности связанных выборок - это уровень проверки однородности характеристик, прежде всего однородности математических ожиданий. Исходные данные - количественные результаты измерений (наблюдений, испытаний, анализов, опытов) двух признаков x_j и y_j, j = 1,2,...,n, а непосредственно анализируются их разности Zj = x_j - y_j , j = 1,2,...,n. Предполагается, что эти разности независимы в совокупности и одинаково распределены, однако функция распределения неизвестна статистику. Необходимо проверить непараметрическую гипотезу

H_{01}:M(Z_j)=0.

Альтернативная гипотеза также является непараметрической и имеет вид:

H_{11}:M(Z_j)\ne 0.

Как и в случае проверки гипотезы однородности для независимых выборок с помощью критерия Крамера-Уэлча, в рассматриваемой ситуации естественно использовать статистику

Q=\sqrt{n}\frac{\overline{Z}}{s(Z)},
где
\overline{Z}=\frac{Z_1+Z_2+...+Z_n}{n}
среднее арифметическое разностей, а
s(Z)=\sqrt{\frac{1}{n-1}\sum_{j=1}^n(Z_j-\overline{Z})^2}
выборочное среднее квадратическое отклонение. Из Центральной предельной теоремы теории вероятностей и теорем о наследовании сходимости, полученных в монографии [ [ 1.15 ] ] и описанных в "Теоретическая база прикладной статистики" , вытекает, что при справедливости нулевой гипотезы
\lim_{n\rightarrow\infty} P\{Q\le x\}=\Phi(x)
при всех x, где \Phi(x) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Отсюда вытекает правило принятия решений на уровне значимости 5%: если
|Q|\le 1,96,
то гипотезу однородности математических ожиданий связанных выборок принимают, в противном случае - отклоняют. Как обычно, при желании использовать другой уровень значимости применяют в качестве критического значения иной квантиль нормального распределения. Повторим, что использование предельных теорем допустимо при достаточно больших объемах выборки.

Третий уровень моделей проверки однородности связанных выборок - это уровень проверки однородности (совпадения) функций распределения. Необходимо проверить непараметрическую гипотезу наиболее всеохватного вида:

H_{03}:F(x)=G(x),x\in R^1,
где
F(x)=P(x_i\le x), G(x)=P(y_i\le x).

При этом предполагается, что все участвующие в вероятностной модели случайные величины независимы (в совокупности) между собой.

Отметим одно важное свойство функции распределения случайной величины Z. Если случайные величины X и Y независимы и одинаково распределены, то для функции распределения H(x)=P(Z\le x) случайной величины Z = X - Y выполнено, как нетрудно видеть, соотношение

H(-x)=1-H(x)

Это соотношение означает симметрию функции распределения относительно 0. Плотность такой функции распределения является четной функцией, ее значения в точках x и (-x) совпадают.

Проверка гипотезы однородности связанных выборок в наиболее общем случае сводится к проверке симметрии функции распределения разности Z = X - Y относительно 0.

Анастасия Маркова
Анастасия Маркова
Почему сейчас я не зачислена на курс?
Михаил Яковлев
Михаил Яковлев
Россия, Санкт-Петербург
Dmitry Kalinnikov
Dmitry Kalinnikov
Россия, Москва