Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Проверка гипотез
7.3. Предельная теория непараметрических критериев
В прикладной статистике широко используются статистики типа омега-квадрат и типа Колмогорова-Смирнова. Они применяются для проверки согласия с фиксированным распределением или семейством распределений, для проверки однородности двух выборок, симметрии распределения относительно 0, при оценивании условной плотности и регрессии в пространствах произвольной природы и т.д.
Статистики интегрального типа и их асимптотика. Рассмотрим статистики интегрального типа
( 1) |
где - некоторое пространство, по которому происходит интегрирование (например, или ). Здесь - направленное множество, переход к пределу по которому обозначен как (см. "Теоретическая база прикладной статистики" ). Случайные функции обычно принимают значения, являющиеся числами. Но иногда рассматривают и постановки, в которых или - банахово пространство (т.е. полное нормированное пространство [ [ 1.9 ] ]). Наконец, - случайная функция распределения или случайная вероятностная мера; в последнем случае используют также обозначение .
Предполагаются выполненными необходимые для корректности внутриматематические предположения измеримости, например, сформулированные в [ [ 4.19 ] , [ 4.19 ] ].
Пример 1. Рассмотрим критерий Лемана-Розенблатта, т.е. критерий типа омега-квадрат для проверки однородности двух независимых выборок (см. "Статистический анализ числовых величин" ). Его статистика имеет вид:
где - эмпирическая функция распределения, построенная по первой выборке объема - эмпирическая функция распределения, построенная по второй выборке объема , а - эмпирическая функция распределения, построенная по объединенной выборке объема . Легко видеть, чтоЯсно, что статистика имеет вид (1). При этом - действительное число, , в роли выступает пара , и означает, что . Далее,
Наконец, .
Теперь обсудим асимптотическое поведение функций и , с помощью которых определяется статистика . Ограничимся случаем, когда справедлива гипотеза однородности, функции распределения, соответствующие генеральным совокупностям, из которых взяты выборки, совпадают. Их общую функцию распределения обозначим . Она предполагается непрерывной. Введем в рассмотрение выборочные процессы
Нетрудно проверить, что
Сделаем замену переменной . Тогда выборочные процессы переходят в соответствующие эмпирические (см. "Теоретическая база прикладной статистики" ):
Конечномерные распределения этого процесса, т.е. распределения случайных векторов
для всех возможных наборов , сходятся к конечномерным распределениям квадрата броуновского моста . В соответствии с 4.5 рассматриваемая сходимость по распределению обозначается так:( 2) |
Нетрудно видеть, что
при . С помощью замены переменной получаем, что( 3) |
т.е. предельным распределением этой статистики является классическое распределение Смирнова [ [ 2.1 ] ], найденное как предельное для одновыборочной статистики критерия согласия омега-квадрат Крамера-Мизеса-Смирнова.
Действительно, сформулированное утверждение справедливо. Однако доказательство нетривиально.
Так, может показаться очевидным следующее утверждение.
Утверждение 1. Пусть - ограниченная функция, и - функции распределения, , причем при всех . Тогда
( 4) |
Это утверждение неверно (ср. [ , с.42]). Действительно, пусть , если рационально, и , если иррационально, , а кусочно-постоянные функции имеют скачки величиной в точках при всех . Тогда при всех , однако
при всех . Следовательно, вопреки сформулированному выше утверждению 1, т.е. соотношение (4) неверно.Итак, сформулируем проблему. Пусть известно, что последовательность случайных функций сходится по распределению при к случайной функции . Пусть последовательность случайных мер сходится по распределению к вероятностной мере при . Если речь идет о конечномерном пространстве и меры задаются функциями распределения, то сходимость к должна иметь место во всех точках непрерывности . В каких случаях можно утверждать, что при справедлив предельный переход
Выше показано, что, например, ограниченности для этого недостаточно.
Метод аппроксимации ступенчатыми функциями. Пусть - разбиение пространства на непересекающиеся подмножества. Пусть в каждом элементе разбиения выделена точка . На множестве функций введем оператор : если , то
( 5) |
Тогда - аппроксимация функции ступенчатыми (кусочно-постоянными) функциями.
Пусть - последовательность случайных функций на , а - функционал на множестве всех возможных их траекторий как функций от . Для изучения распределения методом аппроксимации ступенчатыми функциями используют разложение
( 6) |
Согласно (5) распределение первого слагаемого в (6) определяется конечномерным распределением случайного элемента, а именно, распределением вектора
( 7) |
В обычных постановках предельной теории непараметрических критериев распределение вектора (7) сходится при к соответствующему конечномерному распределению предельной случайной функции , т.е. к распределению случайного вектора
( 8) |
В соответствии с теорией наследования сходимости ( "Теоретическая база прикладной статистики" ) при слабых условиях на функционал из сходимости по распределению вектора (7) к вектору (8) следует сходимость по распределению к .
Используя аналогичное (6) разложение
( 9) |
Рассмотрим простой пример применения метода аппроксимации ступенчатыми функциями.
Обобщение теоремы Хелли. Пусть - измеримая функция, - функции распределений, сосредоточенных на отрезке . Пусть сходятся в основном к функции распределения , т.е.
( 10) |
для всех , являющихся точками непрерывности .
Утверждение 2. Если - непрерывная функция, то
( 11) |
Утверждение 2 известно в литературе как первая теорема Хелли [ [ 1.9 ] , с.344-346], вторая теорема Хелли [ [ 2.3 ] , с.174-175], лемма Хелли-Брея [ [ 7.10 ] , с.193-194].
Естественно поставить вопрос: при каких из (10) следует (11)? Необходимо ввести условия и на : если , то соотношение (11) верно для любой измеримой функции , для которой интеграл в (11) существует. Поэтому рассмотрим следующую постановку.
Постановка 1. Пусть функция такова, что для любой последовательности , удовлетворяющей (10), справедливо (11). Что можно сказать о функции ?
В работах [ [ 4.19 ] , [ 4.19 ] ] найдены следующие необходимые и достаточные условия на функцию .
Теорема 1. Пусть ограниченная на [0; 1] функция интегрируема по Риману-Стилтьесу по функции распределения . Тогда для любой последовательности функций распределения , сходящейся в основном к , имеет место предельный переход (11).
Теорема 2. Пусть функция не интегрируема по Риману-Стилтьесу по функции распределения . Тогда существует последовательность функций распределения , сходящаяся в основном к , для которой соотношение (11) не выполнено.
Теоремы 1 и 2 в совокупности дают необходимые и достаточные условия для в постановке 1. А именно, необходимо и достаточно, чтобы ограниченная на [0; 1] функция была интегрируема по Риману-Стилтьесу по .
Напомним определение интегрируемости функции по Риману-Стилтьесу по функции распределения [ [ 1.9 ] , с.341]. Рассмотрим разбиение , где
( 12) |
Выберем в произвольную точку , и составим сумму
Если при эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления отрезка [0; 1], ни от выбора точек в каждом из элементов разбиения), то этот предел называется интегралом Римана-Стилтьеса от функции по функции по отрезку [0; 1] и обозначается символом, приведенным в правой части равенства (11).
Рассмотрим суммы Дарбу-Стилтьеса
гдеЯсно, что
Необходимым и достаточным условием интегрируемости по Риману-Стилтьесу является следующее: для любой последовательности разбиений . вида (12) такой, что при , имеем
( 13) |
Напомним, что согласно 4.3 колебанием функции на множестве называется . Поскольку
то условие (13) можно записать в виде( 14) |
Условие (14), допускающее обобщение с и на и более общего вида, и будем использовать при доказательстве теорем 1 и 2.
Доказательство теоремы 1. Согласно методу аппроксимации ступенчатыми функциями рассмотрим оператор . Как легко проверить, имеет место разложение
( 15) |
Поскольку
то первое слагаемое в правой части (15) не превосходит( 16) |
Согласно определению оператора третье слагаемое в (15) имеет вид
Очевидно, оно не превосходит по модулю
(здесь используется ограниченность на ).Согласно (16) первое слагаемое в правой части (15) не превосходит
Поскольку
то первое слагаемое в правой части (15) не превосходитИз оценок, относящихся к трем слагаемым в разложении (15), следует, что
( 17) |
Используя оценку (17), докажем, что при . Пусть дано . Согласно условию интегрируемости функции по Риману-Стилтьесу, т.е. условию (14), можно указать разбиение такое, что
( 18) |
Поскольку
то из (10) следует, что существует число такое, что при справедливо неравенство( 19) |
Из (17), (18) и (19) следует, что при справедливо неравенство
что и требовалось доказать.Обсудим условие ограниченности . Если оно не выполнено, то из (10) не всегда следует (11).