Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Проверка гипотез
7.3. Предельная теория непараметрических критериев
В прикладной статистике широко используются статистики типа омега-квадрат и типа Колмогорова-Смирнова. Они применяются для проверки согласия с фиксированным распределением или семейством распределений, для проверки однородности двух выборок, симметрии распределения относительно 0, при оценивании условной плотности и регрессии в пространствах произвольной природы и т.д.
Статистики интегрального типа и их асимптотика. Рассмотрим статистики интегрального типа
![]() |
( 1) |
где - некоторое пространство, по которому происходит интегрирование (например,
или
). Здесь
- направленное множество, переход к пределу по которому обозначен как
(см.
"Теоретическая база прикладной статистики"
). Случайные функции
обычно принимают значения, являющиеся числами. Но иногда рассматривают и постановки, в которых
или
- банахово пространство (т.е. полное нормированное пространство [
[
1.9
]
]). Наконец,
- случайная функция распределения или случайная вероятностная мера; в последнем случае используют также обозначение
.
Предполагаются выполненными необходимые для корректности внутриматематические предположения измеримости, например, сформулированные в [ [ 4.19 ] , [ 4.19 ] ].
Пример 1. Рассмотрим критерий Лемана-Розенблатта, т.е. критерий типа омега-квадрат для проверки однородности двух независимых выборок (см. "Статистический анализ числовых величин" ). Его статистика имеет вид:
![A=\frac{mn}{m+n}\int\limits_{-\infty}^{+\infty}(F_m(x)-G_n(x))^2dH_{m+n}(x),](/sites/default/files/tex_cache/380d8a9a48dbdfb538d6802da27b147f.png)
![F_m(x)](/sites/default/files/tex_cache/c5224d7ee3bf232eabb66fb81947ba2e.png)
![m, G_n(x))](/sites/default/files/tex_cache/723c03452eb6522ae0ab5eaab0a3c958.png)
![n](/sites/default/files/tex_cache/7b8b965ad4bca0e41ab51de7b31363a1.png)
![H_{m+n}(x)](/sites/default/files/tex_cache/ed7412ec56e408a8ee3116c7137f5a4a.png)
![m+n](/sites/default/files/tex_cache/cf1ade4c34301c43d30481ed5d6c52c1.png)
![H_{m+n}(x)=\frac{m}{m+n}F_m(x)+\frac{n}{m+n}G_n(x).](/sites/default/files/tex_cache/16fe835bd239756fc8a94fbaade90fca.png)
Ясно, что статистика имеет вид (1). При этом
- действительное число,
, в роли
выступает пара
, и
означает, что
. Далее,
![f_{\alpha}(x,\omega)=\frac{mn}{m+n}(F_m(x)-G_n(x))^2.](/sites/default/files/tex_cache/7bd929fecc5528bc4356b5858ea28aae.png)
Наконец, .
Теперь обсудим асимптотическое поведение функций и
, с помощью которых определяется статистика
. Ограничимся случаем, когда справедлива гипотеза однородности, функции распределения, соответствующие генеральным совокупностям, из которых взяты выборки, совпадают. Их общую функцию распределения обозначим
. Она предполагается непрерывной. Введем в рассмотрение выборочные процессы
![\xi_m(x)=\sqrt{m}(F_m(x)-F(x)),\eta_n(x)=\sqrt{n}(G_n(x)-F(x)).](/sites/default/files/tex_cache/b2fffaabea2e929e05fdc20281ad4735.png)
Нетрудно проверить, что
![f_{\alpha}(x,\omega)=\left(\sqrt{\frac{n}{m+n}}\xi_m(x)-\sqrt{\frac{m}{m+n}}\eta_n(x)\right)^2.](/sites/default/files/tex_cache/a9e690e179ddc121651be0d537bffd25.png)
Сделаем замену переменной . Тогда выборочные процессы переходят в соответствующие эмпирические (см.
"Теоретическая база прикладной статистики"
):
![f_{\alpha}(F^{-1}(t),\omega)=\left(\sqrt{\frac{n}{m+n}}\xi_m(t)-\sqrt{\frac{m}{m+n}}\eta_n(t)\right)^2, 0\le t\le 1.](/sites/default/files/tex_cache/d7de29d4bdc3541864ba732c70a7a3db.png)
Конечномерные распределения этого процесса, т.е. распределения случайных векторов
![(f_{\alpha}(F^{-1}(t_1),\omega),f_{\alpha}(F^{-1}(t_2),\omega),...,f_{\alpha}(F^{-1}(t_k),\omega))](/sites/default/files/tex_cache/67b5f6cf1924e000dd7048c84abd5fe2.png)
![(t_1, t_2, ..., t_k)](/sites/default/files/tex_cache/73ac7a21455b8da8c94255965e0cb502.png)
![\eta^2(t)](/sites/default/files/tex_cache/8a2c2966430977f333166e3257c2e52a.png)
![\S](/sites/default/files/tex_cache/09700b05417a749d1d44aca99c89f6e1.png)
![]() |
( 2) |
Нетрудно видеть, что
![F_{\alpha}(x,\omega)=H_{m+n}(x)\rightarrow F(x)](/sites/default/files/tex_cache/88404d85da1cebeb74e719c93aaeb6b0.png)
![\alpha\rightarrow\infty](/sites/default/files/tex_cache/7c44c4fd9ee64f79d37dc97e3ceb3c17.png)
![t=F(x)](/sites/default/files/tex_cache/ed426f0c4e46b0f261c1eb4c4bce2487.png)
![]() |
( 3) |
![\alpha\rightarrow\infty](/sites/default/files/tex_cache/7c44c4fd9ee64f79d37dc97e3ceb3c17.png)
![\int\limits_X f_{\alpha}(x,\omega)dF_{\alpha}(x,\omega)=A\Rightarrow\int\limits_0^1\xi^2(t)dt,](/sites/default/files/tex_cache/da0e3c8f6e0fd3a327a7d3f05e55a0ea.png)
т.е. предельным распределением этой статистики является классическое распределение Смирнова [ [ 2.1 ] ], найденное как предельное для одновыборочной статистики критерия согласия омега-квадрат Крамера-Мизеса-Смирнова.
Действительно, сформулированное утверждение справедливо. Однако доказательство нетривиально.
Так, может показаться очевидным следующее утверждение.
Утверждение 1. Пусть - ограниченная функция,
и
- функции распределения,
, причем
при всех
. Тогда
![]() |
( 4) |
Это утверждение неверно (ср. [ , с.42]). Действительно, пусть
, если
рационально, и
, если
иррационально,
, а кусочно-постоянные функции
имеют скачки величиной
в точках
при всех
. Тогда
при всех
, однако
![\int\limits_0^1 f(x)dG_n(x)=1,\;
\int\limits_0^1 f(x)dG(x)=0](/sites/default/files/tex_cache/f12936e0ba50357455f7da2e636b851a.png)
![n=1,2,..](/sites/default/files/tex_cache/f4575b68fa4701807b64064d2777d51f.png)
![\int\limits_0^1 f(x)d(G_n(x)-G(x))=1,](/sites/default/files/tex_cache/4bda672368b68cd377d4fa16133f27bf.png)
Итак, сформулируем проблему. Пусть известно, что последовательность случайных функций сходится по распределению при
к случайной функции
. Пусть последовательность случайных мер
сходится по распределению к вероятностной мере
при
. Если речь идет о конечномерном пространстве и меры задаются функциями распределения, то сходимость
к
должна иметь место во всех точках непрерывности
. В каких случаях можно утверждать, что при
справедлив предельный переход
![\xi_{\alpha}=\xi(f_{\alpha},F_{\alpha})=
\int\limits_X f_{\alpha}(x,\omega)dF_{\alpha}(x,\omega)\Rightarrow
\xi=\xi(f,F)=\int\limits_X f(x,\omega)dF(x,\omega)?](/sites/default/files/tex_cache/b4a34dcf215701672285d1063b73a336.png)
Выше показано, что, например, ограниченности для этого недостаточно.
Метод аппроксимации ступенчатыми функциями. Пусть - разбиение пространства
на непересекающиеся подмножества. Пусть в каждом элементе
разбиения
выделена точка
. На множестве функций
введем оператор
: если
, то
![]() |
( 5) |
Тогда - аппроксимация функции
ступенчатыми (кусочно-постоянными) функциями.
Пусть - последовательность случайных функций на
, а
- функционал на множестве всех возможных их траекторий как функций от
. Для изучения распределения
методом аппроксимации ступенчатыми функциями используют разложение
![]() |
( 6) |
Согласно (5) распределение первого слагаемого в (6) определяется конечномерным распределением случайного элемента, а именно, распределением вектора
![]() |
( 7) |
В обычных постановках предельной теории непараметрических критериев распределение вектора (7) сходится при к соответствующему конечномерному распределению предельной случайной функции
, т.е. к распределению случайного вектора
![]() |
( 8) |
В соответствии с теорией наследования сходимости (
"Теоретическая база прикладной статистики"
) при слабых условиях на функционал из сходимости по распределению вектора (7) к вектору (8) следует сходимость по распределению
к
.
Используя аналогичное (6) разложение
![]() |
( 9) |
![К(f_{\alpha})](/sites/default/files/tex_cache/38a9523dce24de0ae82a18af08b8f48d.png)
![К(f)](/sites/default/files/tex_cache/89365dc84c232400844fb4461fdace97.png)
![\alpha\roghtarrow\infty](/sites/default/files/tex_cache/453de345b4a90115e88ad5781ab92bdb.png)
![T](/sites/default/files/tex_cache/b9ece18c950afbfa6b0fdbfa4ff731d3.png)
![A_T](/sites/default/files/tex_cache/548be04215436f4e60521769469e928b.png)
![K(A_Tf_{\alpha})](/sites/default/files/tex_cache/1893bf1102d957ba757df39cb1647378.png)
![K(A_Tf)](/sites/default/files/tex_cache/e6fe57710586922486da5ed39cd49fe8.png)
Рассмотрим простой пример применения метода аппроксимации ступенчатыми функциями.
Обобщение теоремы Хелли. Пусть - измеримая функция,
- функции распределений, сосредоточенных на отрезке
. Пусть
сходятся в основном к функции распределения
, т.е.
![]() |
( 10) |
для всех , являющихся точками непрерывности
.
Утверждение 2. Если - непрерывная функция, то
![]() |
( 11) |
Утверждение 2 известно в литературе как первая теорема Хелли [ [ 1.9 ] , с.344-346], вторая теорема Хелли [ [ 2.3 ] , с.174-175], лемма Хелли-Брея [ [ 7.10 ] , с.193-194].
Естественно поставить вопрос: при каких из (10) следует (11)? Необходимо ввести условия и на
: если
, то соотношение (11) верно для любой измеримой функции
, для которой интеграл в (11) существует. Поэтому рассмотрим следующую постановку.
Постановка 1. Пусть функция такова, что для любой последовательности
, удовлетворяющей (10), справедливо (11). Что можно сказать о функции
?
В работах [
[
4.19
]
,
[
4.19
]
] найдены следующие необходимые и достаточные условия на функцию .
Теорема 1. Пусть ограниченная на [0; 1] функция интегрируема по Риману-Стилтьесу по функции распределения
. Тогда для любой последовательности функций распределения
, сходящейся в основном к
, имеет место предельный переход (11).
Теорема 2. Пусть функция не интегрируема по Риману-Стилтьесу по функции распределения
. Тогда существует последовательность функций распределения
, сходящаяся в основном к
, для которой соотношение (11) не выполнено.
Теоремы 1 и 2 в совокупности дают необходимые и достаточные условия для в постановке 1. А именно, необходимо и достаточно, чтобы ограниченная на [0; 1] функция
была интегрируема по Риману-Стилтьесу по
.
Напомним определение интегрируемости функции по Риману-Стилтьесу по функции распределения
[
[
1.9
]
, с.341]. Рассмотрим разбиение
, где
![]() |
( 12) |
![0=y_0<y_1<y_2<...<y_m=1.](/sites/default/files/tex_cache/0d13eeaec39c95a2d721aa8d6cc30523.png)
Выберем в произвольную точку
, и составим сумму
![S(T)=\sum_{i=1}^m f(x_i)[F(y_i)-F(y_{i-1})].](/sites/default/files/tex_cache/47f30d50287400a7ba37af1e69bc122c.png)
Если при эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления отрезка [0; 1], ни от выбора точек
в каждом из элементов разбиения), то этот предел называется интегралом Римана-Стилтьеса от функции
по функции
по отрезку [0; 1] и обозначается символом, приведенным в правой части равенства (11).
Рассмотрим суммы Дарбу-Стилтьеса
![S_H(T)=\sum_{i=1}^m m_i[F(y_i)-F(y_{i-1})], \;
S_B(T)=\sum_{i=1}^m M_i[F(y_i)-F(y_{i-1})],](/sites/default/files/tex_cache/745158214da11cfcba3e0505ad53cd81.png)
![m_i=\inf\{f(x),x\in C_i\},\;M_i=\sup\{f(x),x\in C_i\}.](/sites/default/files/tex_cache/2466293fd4dd14a3903c52b63932dc69.png)
Ясно, что
![S_H(T)\le S(T)\le S_B(T).](/sites/default/files/tex_cache/f1f05b1f2eadd36bb250541eb2b6c495.png)
Необходимым и достаточным условием интегрируемости по Риману-Стилтьесу является следующее: для любой последовательности разбиений . вида (12) такой, что
при
, имеем
![]() |
( 13) |
Напомним, что согласно 4.3 колебанием
функции
на множестве
называется
. Поскольку
![\delta(f,C_i)=M_i-m_i,](/sites/default/files/tex_cache/8b919218d9875afbfc12aff10e3b1c74.png)
![]() |
( 14) |
Условие (14), допускающее обобщение с и
на
и
более общего вида, и будем использовать при доказательстве теорем 1 и 2.
Доказательство теоремы 1. Согласно методу аппроксимации ступенчатыми функциями рассмотрим оператор . Как легко проверить, имеет место разложение
![]() |
( 15) |
Поскольку
![|f(x)-A_T f(x)|\le\delta(f,X_i),\;x\in C_i,](/sites/default/files/tex_cache/cb8630d7ddbf647068db5277537537e6.png)
![]() |
( 16) |
![\sum_{C\in T}\delta(f,C)F(C).](/sites/default/files/tex_cache/c01752c7fccd9985387a7fd6ab08b0c8.png)
Согласно определению оператора третье слагаемое в (15) имеет вид
![\sum_{i=1}^m f(x_i)(F_n(C_i)-F(C_i)).](/sites/default/files/tex_cache/d2e95b9217dc7fe938decbe714e0db51.png)
Очевидно, оно не превосходит по модулю
![\sup_{x\in X}|f(x)|\sum_{C\in T}|F_n(C)-F(C)|](/sites/default/files/tex_cache/327e5e066f81920aba6f176be6bb9e5a.png)
![f](/sites/default/files/tex_cache/8fa14cdd754f91cc6554c9e71929cce7.png)
![X](/sites/default/files/tex_cache/02129bb861061d1a052c592e2dc6b383.png)
Согласно (16) первое слагаемое в правой части (15) не превосходит
![\sum_{C\in T}\delta(f,C)F(C)+\sum_{C\in T}\delta(f,C)|F_n(C)-F(C)|.](/sites/default/files/tex_cache/2e014abf6185208b42df0cc6de2f7444.png)
Поскольку
![\delta(f,C)\le 2\sup_{x\in X}|f(x)|,](/sites/default/files/tex_cache/c5c70736ffda5eb50dd1e50a196c9f39.png)
![\sum_{C\in T}\delta(f,C)F(C)+2\sup_{x\in X}|f(x)|\sum_{C\in T}|F_n(C)-F(C)|.](/sites/default/files/tex_cache/f4e87d67e2fbfa97173154e7f8753079.png)
Из оценок, относящихся к трем слагаемым в разложении (15), следует, что
![]() |
( 17) |
Используя оценку (17), докажем, что при
. Пусть дано
. Согласно условию интегрируемости функции
по Риману-Стилтьесу, т.е. условию (14), можно указать разбиение
такое, что
![]() |
( 18) |
![y_i, i=1,2,..., m - 1](/sites/default/files/tex_cache/1ba2dd2da9ec3c9457923017b120bed6.png)
![F](/sites/default/files/tex_cache/800618943025315f869e4e1f09471012.png)
Поскольку
![F_n(X_i)=F_n(y_i)-F_n(y_{i-1}),](/sites/default/files/tex_cache/0c9a63bb3f636cc8a88e078d09df1fb3.png)
![n = n(\varepsilon)](/sites/default/files/tex_cache/4a1c33d1d1d7a5d3a6d063279dd9752c.png)
![n > n(\varepsilon)](/sites/default/files/tex_cache/301f9d7332c6f687ba89c7ecb550bf1b.png)
![]() |
( 19) |
Из (17), (18) и (19) следует, что при справедливо неравенство
![\left|
\int\limits_0^1 f(x)dF_n(x)-\int\limits_0^1 f(x)dF(x)
\right|
>\varepsilon,](/sites/default/files/tex_cache/5cf48b1160647a8f2594cb6c4103b4ee.png)
Обсудим условие ограниченности . Если оно не выполнено, то из (10) не всегда следует (11).