Не могу найти требования по оформлению выпускной контрольной работы по курсу профессиональной переподготовки "Менеджмент предприятия" |
Статистический анализ числовых величин (непараметрическая статистика)
Критерий Крамера-Уэлча равенства математических ожиданий. Вместо критерия Стьюдента предлагаем для проверки H'0 использовать критерий Крамера-Уэлча [12], основанный на статистике
![]() |
( 6) |
Критерий Крамера-Уэлча имеет прозрачный смысл - разность выборочных средних арифметических для двух выборок делится на естественную оценку среднего квадратического отклонения этой разности. Естественность указанной оценки состоит в том, что неизвестные статистику дисперсии заменены их выборочными оценками. Из многомерной центральной предельной теоремы и из теорем о наследовании сходимости [11] вытекает, что при росте объемов выборок распределение статистики Т Крамера-Уэлча сходится к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Итак, при справедливости и больших объемах выборок распределение статистики
приближается с помощью стандартного нормального распределения
, из таблиц которого следует брать критические значения.
При , как следует из формул (1) и (6),
. При
этого равенства нет. В частности, при
в (1) стоит множитель
, а в (6)- множитель
.
Если , то при больших объемах выборок
![]() |
( 7) |
где
![]() |
( 8) |
При или
, согласно формулам (3) и (8),
в остальных случаях равенства нет.
Из асимптотической нормальности статистики , формул (7) и (8) следует, что правило принятия решения для критерия Крамера-Уэлча выглядит так:
- если
то гипотеза однородности (равенства) математических ожиданий принимается на уровне значимости
- если же
то гипотеза однородности (равенства) математических ожиданий отклоняется на уровне значимости
.
В эконометрике наиболее часто применяется уровень значимости Тогда значение модуля статистики
Крамера-Уэлча надо сравнивать с граничным значением
.
Из сказанного выше следует, что применение критерия Крамера-Уэлча не менее обосновано, чем применение критерия Стьюдента. Дополнительное преимущество - не требуется равенства дисперсий . Распределение статистики Т не является распределением Стьюдента, однако и распределение статистики
, как показано выше, не является таковым в реальных ситуациях.
Распределение статистики при объемах выборок
и различных функциях распределений выборок
и
изучено нами совместно с Ю.Э. Камнем и Я.Э. Камнем методом статистических испытаний (Монте-Карло). Рассмотрены различные варианты функций распределения
и
. Результаты показывают, что даже при таких небольших объемах выборок точность аппроксимации предельным стандартным нормальным распределением вполне удовлетворительна. Поэтому представляется целесообразным во всех тех случаях, когда в настоящее время используется критерий Стьюдента, заменить его на критерий Крамера-Уэлча. Конечно, такая замена потребует переделки ряда нормативно-технических и методических документов, исправления учебников и учебных пособий для вузов.
Пример. Пусть объем первой выборки Для второй выборки
Вычислим величину статистики Крамера-Уэлча
![T=\frac{\sqrt{mn}(\bar x-\bar y)}{\sqrt{ns_x^2+ms_y^2}}=\frac{\sqrt{120*541}(13.7-14.1)}{\sqrt{541*5.3^2+120*8.4^2}}=\frac{\sqrt{64920}(-0.4)}{\sqrt{541*28.09+120*70.56}}=\frac{254.79*(-0.4)}{\sqrt{15196.69+8467.2}}=\frac{-101.916}{\sqrt{23633.89}}=\frac{-101.916}{153.83}=-0.66](/sites/default/files/tex_cache/226f3a2852d8781a8d59ffc4947c1706.png)
Поскольку полученное значение по абсолютной величине меньше 1,96, то гипотеза однородности математических ожиданий принимается на уровне значимости 0,05.
Непараметрические методы проверки однородности. В большинстве экономических и технико-экономических задач представляет интерес не проверка равенства математических ожиданий или иных характеристик распределения, а обнаружение различия генеральных совокупностей, из которых извлечены выборки, т.е. проверка гипотезы . Методы проверки гипотезы
позволяют обнаружить не только изменение математического ожидания, но и любые иные изменения функции распределения результатов наблюдений при переходе от одной выборки к другой (увеличение разброса, появление асимметрии и т. д.). Как установлено выше, методы, основанные на использовании статистик
Стьюдента и Т Крамера-Уэлча, не позволяют проверять гипотезу
Априорное предположение о принадлежности функций распределения
и
к какому-либо определенному параметрическому семейству (например, семействам нормальных, логарифмически нормальных, распределений Вейбулла-Гнеденко, гамма-распределений и др.), как показано выше, обычно нельзя достаточно надежно обосновать. Поэтому для проверки
следует использовать методы, пригодные при любом виде
и
, т.е. непараметрические методы. (Термин "непараметрический метод" означает, что при использовании этого метода нет необходимости предполагать, что функции распределения результатов наблюдений принадлежат какому-либо определенному параметрическому семейству.)
Для проверки гипотезы разработано много непараметрических методов - критерии Смирнова, типа омега-квадрат (Лемана-Розенблатта), Вилкоксона (Манна-Уитни), Ван-дер-Вардена, Сэвиджа, хи-квадрат и др.. Распределения статистик всех этих критериев при справедливости
не зависят от конкретного вида совпадающих функций распределения
. Следовательно, таблицами точных и предельных (при больших объемах выборок) распределений статистик этих критериев и их процентных точек можно пользоваться при любых непрерывных функциях распределения результатов наблюдений.
Каким из непараметрических критериев пользоваться? Как известно [10], для выбора одного из нескольких критериев необходимо сравнить их мощности, определяемые видом альтернативных гипотез. Сравнению мощностей критериев посвящена обширная литература.
Хорошо изучены свойства критериев при альтернативной гипотезе сдвига
![H_{1c} : G(x)=F(x-d), d \ne 0.](/sites/default/files/tex_cache/3592c50aad421e4be61620f1ed25d23c.png)
Критерии Вилкоксона, Ван-дер-Вардена и ряд других ориентированы для применения именно в этой ситуации. Если раз измеряют характеристику одного объекта и
раз - другого, а функция распределения погрешностей измерения произвольна, но не меняется при переходе от объекта к объекту (это более жесткое требование, чем условие равенства дисперсий), то рассмотрение гипотезы
оправдано. Однако в большинстве экономических и технико-экономических исследований нет оснований считать, что функции распределения, соответствующие выборкам, различаются только сдвигом.
Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?
Покажем (и это - основной результат настоящего пункта), что двухвыборочный критерий Вилкоксона (в литературе его называют также критерием Манна-Уитни) предназначен для проверки гипотезы
![H_0 : P(X < Y) = 1/2,](/sites/default/files/tex_cache/58cb017f5cdd20d18010619dadccbe81.png)
где - случайная величина, распределенная как элементы первой выборки, а
- второй.
В описанной выше вероятностной модели двух независимых выборок без ограничения общности можно считать, что объем первой из них не превосходит объема второй, , в противном случае выборки можно поменять местами. Обычно предполагается, что функции
и
непрерывны и строго возрастают. Из непрерывности этих функций следует, что с вероятностью 1 все
результатов наблюдений различны. В реальных эконометрических данных иногда встречаются совпадения, но сам факт их наличия - свидетельство нарушений предпосылок только что описанной базовой математической модели.
Статистика двухвыборочного критерия Вилкоксона определяется следующим образом. Все элементы объединенной выборки
упорядочиваются в порядке возрастания. Элементы первой выборки
занимают в общем вариационном ряду места с номерами
, другими словами, имеют ранги
Тогда статистика Вилкоксона - это сумма рангов элементов первой выборки
![S = R_1 + R_2 +\dots + R_m.](/sites/default/files/tex_cache/11ee1df0a5d4d1d294f2067b3ba64c2d.png)
Статистика Манна-Уитни определяется как число пар
таких, что
среди всех
пар, в которых первый элемент - из первой выборки, а второй - из второй. Как известно [13, с.160],
![U = mn + m(m+1)/2 - S.](/sites/default/files/tex_cache/d0366aec703fe701a56f46956116564d.png)
Поскольку и
линейно связаны, то часто говорят не о двух критериях - Вилкоксона и Манна-Уитни, а об одном - критерии Вилкоксона (Манна-Уитни).
Критерий Вилкоксона - один из самых известных инструментов непараметрической статистики (наряду со статистиками типа Колмогорова-Смирнова и коэффициентами ранговой корреляции). Свойствам этого критерия и таблицам его критических значений уделяется место во многих монографиях по математической и прикладной статистике.
Однако в литературе имеются и неточные утверждения относительно возможностей критерия Вилкоксона. Так, одни полагают, что с его помощью можно обнаружить любое различие между функциями распределения и
. По мнению других, этот критерий нацелен на проверку равенства медиан распределений, соответствующих выборкам. И то, и другое, строго говоря, неверно. Это будет ясно из дальнейшего изложения.
Введем некоторые обозначения. Пусть - функция, обратная к функции распределения
. Она определена на отрезке
. Положим
. Поскольку
непрерывна и строго возрастает, то
и
обладают теми же свойствами. Важную роль в дальнейшем изложении будет играть величина
Как нетрудно показать,
![a=P(X<Y)=\int_0^1 \td L(t)](/sites/default/files/tex_cache/943227ccf8f548dd01d1182df43751dc.png)
Введем также параметры
![b^2=\int_0^1 L^2(t)dt-(1-a)^2,\\
G^2=\int_0^1t^2dL(t)-a^2](/sites/default/files/tex_cache/21b414a6c3db6429ddae0b0740cd99a0.png)
Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [13, с.160] выражаются через введенные величины:
![]() |
( 1) |
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными (см., например, [13, гл.5 и 6]) с параметрами, задаваемыми формулами (1) .
Если выборки полностью однородны, т.е. их функции распределения совпадают, справедлива гипотеза
![]() |
( 2) |
![x](/sites/default/files/tex_cache/9dd4e461268c8034f5c8564e155c67a6.png)
то и
. Подставляя в формулы (1), получаем, что
![]() |
( 3) |
Следовательно, распределение нормированной и центрированной статистики Вилкоксона
![]() |
( 4) |
при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).
Из асимптотической нормальности статистики следует, что правило принятия решения для критерия Вилкоксона выглядит так:
- если
то гипотеза (2) однородности (тождества) функций распределений принимается на уровне значимости
- если же
то гипотеза (2) однородности (тождества) функций распределений отклоняется на уровне значимости
.
В эконометрике наиболее часто применяется уровень значимости Тогда значение модуля статистики Т Вилкоксона надо сравнивать с граничным значением
.
Пример 1. Пусть даны две выборки. Первая содержит элементов
. Вторая содержит
элементов
. Проведем проверку однородности функций распределения двух выборок с помощью только что сформулированного правила принятия решений на основе критерия Вилкоксона.
Первым шагом является построение общего вариационного ряда для элементов двух выборок (табл.4.1).