Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4085 / 1036 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 4:

Теоретическая база прикладной статистики

4.3. Теоремы о наследовании сходимости

Суть проблемы наследования сходимости. Пусть распределения случайных величин X_n при n\rightarrow\infty стремятся к распределению случайной величины X. При каких функциях f можно утверждать, что распределения случайных величин f(X_n) сходятся к распределению f(X), т.е. наследуется сходимость?

Хорошо известно, что для непрерывных функций f сходимость наследуется [ [ 4.23 ] ]. Однако в прикладной статистике используются различные обобщения этого утверждения. Необходимость обобщений связана с тремя обстоятельствами:

  • статистические данные могут моделироваться не только случайными величинами, но и случайными векторами, случайными множествами, случайными элементами произвольной природы (т.е. функциями на вероятностном пространстве со значениями в произвольном множестве);
  • переход к пределу должен рассматриваться не только для случая безграничного возрастания объема выборки, но и в более общих случаях. Например, если в постановке статистической задачи участвуют несколько выборок объемов n(1), n(2), ... , n(k), то вполне обычным является предположение о безграничном росте всех этих объемов (что можно описать и как \min\{n(1),n(2),...,n(k)\}\rightarrow\infty) ;
  • функция f не обязательно является непрерывной. Она может иметь разрывы. Кроме того, она может зависеть от параметров, по которым происходит переход к пределу, например, может зависеть от объемов выборок. Так, в "Статистический анализ числовых величин" понадобится рассмотреть функцию f = f(n(1), n(2), ... , n(k)).

Расстояние Прохорова и сходимость по направленному множеству. Введем необходимые для дальнейшего изложения понятия.

Расстояние (метрика) Прохорова. Пусть C - некоторое пространство, A - его подмножество, d - метрика в C. Введем понятие \varepsilon -окрестности множества A в метрике d:

S(A,\varepsilon)=\{x\in C:d(A,x)<\varepsilon\}.

Таким образом, \varepsilon -окрестность множества A - это совокупность всех точек пространства C, отстоящих от A не более чем на положительное число \varepsilon. При этом расстояние от точки x до множества A - это точная нижняя грань расстояний от x до точек множества A, т.е.

d(A,x)=\inf\{d(x,y):y\in A\}.

Пусть P_1 и P_2 - две вероятностные меры на C (т.е. распределения двух случайных элементов со значениями в C ). Пусть D_{12} - множество чисел \varepsilon>0 таких, что

P_1(A)\le P_2(S(A,\varepsilon))+\varepsilon
для любого замкнутого подмножества A пространства C ). Пусть D_{21} - множество чисел \varepsilon>0 таких, что
P_2(A)\le P_1(S(A,\varepsilon))+\varepsilon
для любого замкнутого подмножества A пространства C. Расстояние Прохорова L(P_1,P_2) между вероятностными мерами (его можно рассматривать и как расстояние между случайными элементами с распределениями P_1 и P_2 соответственно) вводится формулой
L(P_1,P_2)=\max(\inf D_{12},\inf D_{21}).

С помощью метрики Прохорова формализуется понятие сходимости распределений случайных элементов в произвольном пространстве.

Расстояние L(P_1,P_2) введено академиком РАН Юрием Васильевичем Прохоровым в середине ХХ в. и широко используется в современной теории вероятностей.

Сходимость по направленному множеству [ [ 4.11 ] , с.95 - 96]. Бинарное отношение >\ge (упорядочение), заданное на множестве B, называется направлением на нем, если B не пусто и

(а) если m, n и p - такие элементы множества B, что m\ge n и n\ge p, то m\ge p ;

(б) m\ge m для любого m из B ;

(в) если m и n принадлежат B, то найдется элемент p из B такой, что p\ge m и p\ge n.

Направленное множество - это пара (В, \ge), где \ge > - направление на множестве B. Направленностью (или "последовательностью по направленному множеству") называется пара (f,\ge), где f - функция, \ge - направление на ее области определения. Пусть f:B\rightarrow Y, где Y - топологическое пространство. Направленность (f, \ge) сходится в топологическом пространстве Y к точке y_0, если для любой окрестности U точки y_0 найдется p из B такое, что f(q)\in U при любом q\ge p. В таком случае говорят также о сходимости по направленному множеству.

Пусть B = \{(n(1), n(2), ... , n(k))\} - совокупность векторов, каждый из которых составлен из объемов k выборок. Пусть

(n(1), n(2), ..., n(k)) \ge (n_1(1), n_1(2), ..., n_1(k))
тогда и только тогда, когда n(_i) \ge n_1(i) при всех i=1,2,...,k. Тогда (B,\ge) - направленное множество, сходимость по которому эквивалентна сходимости при \min\{n(1), n(2),...,n(k)\}\rightarrow\infty.

Чтобы охватить различные частные случаи, целесообразно предельные теоремы формулировать в терминах сходимости по направленному множеству. Будем писать B=\{\alpha\}. Пусть запись \alpha\rightarrow\infty обозначает переход к пределу по направленному множеству.

Формулировка проблемы наследования сходимости. Пусть случайные элементы X_{\alpha} со значениями в пространстве C сходятся при \alpha\rightarrow\infty к случайному элементу X, где через \alpha\rightarrow\infty обозначен переход к пределу по направленному множеству. Сходимость случайных элементов означает, что L(X_{\alpha},X)\rifhtarrow 0 при \alpha\rightarrow\infty, где L - метрика Прохорова в пространстве C.

Пусть f_{\alpha}:C\rightarrow Y - некоторые функции. Какие условия надо на них наложить, чтобы из L(X_{\alpha},X)\rightarrow 0 вытекало, что L_1(f_{\alpha}(X_{\alpha}), f_{\alpha}(X))\rightarrow 0 при \alpha\rightarrow\infty, где L_1 - метрика Прохорова в пространстве Y? Другими словами, какие условия на функции f_{\alpha}:C\rightarrow Y гарантируют наследование сходимости?

В работах [ [ 1.15 ] , [ 4.19 ] ] найдены необходимые и достаточные условия на функции f_{\alpha}:C\rightarrow Y, гарантирующие наследование сходимости. Описанию этих условий посвящена оставшаяся часть данного пункта.

Приведем для полноты изложения строгие формулировки математических предположений (в дальнейшем никому, кроме профессиональных математиков, не понадобятся).

Математические предположения. Пусть C и Y - полные сепарабельные метрические пространства. Пусть выполнены обычные предположения измеримости: X_{\alpha} и X - случайные элементы C, f_{\alpha}(X_{\alpha}) и f_{\alpha}(X) - случайные элементы в Y, рассматриваемые ниже подмножества пространств C и Y лежат в соответствующих \sigma -алгебрах измеримых подмножеств, и т.д.

Понадобятся некоторые определения. Разбиение Т_n = \{C_{1n}, C_{2n}, ..., C_{nn}\} пространства C - это такой набор подмножеств C_j, j = 1, 2, ..., n, этого пространства, что пересечение любых двух из них пусто, а объединение совпадает с C. Диаметром diam(A) подмножества A множества C называется точная верхняя грань расстояний между элементами A, т.е.

diam(A) = \sup \{d(x,y), x\in A, y\in A},

где d(x,y) - метрика в пространстве C. Обозначим \partial A границу множества A, т.е. совокупность точек х таких, что любая их окрестность U(x) имеет непустое пересечение как с A, так и с C\A. Колебанием \delta(f,B) функции f на подмножестве B множества C называется \delta(f,B)= \sup\{d(x,y)|x\in B, y\in B}.

Достаточное условие для наследования сходимости. Пусть L(X_{\alpha},X)\rightarrow 0 при \alpha\rightarrow\infty. Пусть существует последовательность T_n разбиений пространства C такая, что P(X\in\partial A) = 0 для любого A из T_n и, основное условие, для любого \varepsilon> 0

m_{\varepsilon}(\alpha,n)=\sum P(X\in A)\rightarrow 0 ( 1)
при n\rightarrow\infty и \alpha\rightarrow\infty, где сумма берется по всем тем A из T_n, для которых колебание функции f_{/alpha} на A больше \varepsilon, т.е. \delta(f_{\alpha},A)>\varepsilon. Тогда L_1(f_{alpha}(X_{\alpha}), f_{alpha}(X)) \rightarrow 0 при \alpha\rightarrow\infty.

Необходимое условие для наследования сходимости. Пусть Y - конечномерное линейное пространство, Y = R^k. Пусть случайные элементы f_{}\alpha(X) асимптотически ограничены по вероятности при \alpha\rightarrow\infty, т.е. для любого \varepsilon>0 существуют число S(\varepsilon) и элемент направленного множества \alpha(\varepsilon) такие, что P(||f_{\alpha}(X)||>S(\varepsilon))<\varepsilon при \alpha\ge\alpha(\epsilon), где ||f_{alpha}(X)|| - норма (длина) вектора f_alpha(X). Пусть существует последовательность T_n разбиений пространства C такая, что

\lim_{n\rightarrow\infty}\max\{diam(C_{jn}),C_{jn}\in T_n\}=0,
т.е. последовательность T_n является безгранично измельчающейся. Самое существенное - пусть условие (1) не выполнено для последовательности T_n. Тогда существует последовательность случайных элементов X_{\alpha} такая, что L(X_\alpha,X)\rightarrow 0 при \alpha\rightarrow\infty, но L_1(f(X_{\alpha}),f_{\alpha}(X)) не сходится к 0 при \alpha\rightarrow\infty.

Несколько огрубляя, можно сказать, что условие (1) является необходимым и достаточным для наследования сходимости.

Пример 1. Пусть C и Y - конечномерные линейные пространства, функции f_{\alpha} не зависят от \alpha, т.е. f_{\alpha}\equiv f, причем функция f ограничена. Тогда условие (1) эквивалентно требованию интегрируемости по Риману-Стилтьесу функции f по мере G(A)=P(X\in A). В частности, условие (1) выполнено для непрерывной функции f.

В конечномерных пространствах C вместо сходимости L(X_{\alpha},X)\rightarrow 0 при \alpha\rightarrow\infty можно говорить о слабой сходимости функций распределения случайных векторов X_{\alpha} к функции распределения случайного вектора X. Речь идет о "сходимости по распределению", т.е. о сходимости во всех точках непрерывности функции распределения случайного вектора X. В этом случае разбиения могут состоять из многомерных параллелепипедов [ [ 1.15 ] , гл.2].

Пример 2. Полученные выше результаты дают обоснование для следующих рассуждений (ср., например, утверждения в "Статистический анализ числовых величин" ). Пусть по двум независимым выборкам объемов m и n соответственно построены статистики X_m и Y_n. Пусть известно, что распределения этих статистик сходятся при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Пусть a(m, n) и b(m, n) - некоторые коэффициенты. Тогда согласно результатам примера 1 распределение случайной величины Z(m,n) = a(m,n)X_m + b(m, n)Y_n сближается с распределением нормально распределенной случайной величины с математическим ожиданием 0 и дисперсией a^2(m,n)+b^2(m,n). Если же a^2(m,n)+b^2(m,n)=1, например,

a(m,n)=\sqrt{\frac{m}{m+n}}.\quad b(m,n)=\sqrt{\frac{n}{m+n}},
то распределение Z(m,n) сходится при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?