Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 4084 / 1035 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 6:

Оценивание

6.3. Асимптотика решений экстремальных статистических задач

Если проанализировать приведенные выше (см. 5.5) постановки и результаты, касающиеся эмпирических и теоретических средних и законов больших чисел, то становится очевидной возможность их обобщения. Так, доказательства теорем практически не меняются, если считать, что функция f(x,y) определена на декартовом произведении бикомпактных пространств X и Y, а не на X^2. Тогда можно считать, что элементы выборки лежат в Х, а Y - пространство параметров, подлежащих оценке.

Обобщения законов больших чисел. Пусть, например, выборка х_1=х_1(\omega), х_2=х_2(\omega), ..., х_n=х_n(\omega) взята из распределения с плотностью p(x,y), где у - неизвестный параметр. Если положить

f(x,y)=-\ln p(x,y),
то задача нахождения эмпирического среднего
f_n(\omega,y)=\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\rightarrow\min
переходит в задачу оценивания неизвестного параметра y методом максимального правдоподобия
\sum_{k=1}^n\ln p(x_k(\omega),y)\rightarrow\max.

Соответственно законы больших чисел переходят в утверждения о состоятельности этих оценок в случае пространств X и Y общего вида. При такой интерпретации функция f(x,y) уже не является расстоянием или показателем различия. Однако для доказательства сходимости оценок к соответствующим значениям параметров это и не требуется. Достаточно непрерывности этой функции на декартовом произведении бикомпактных пространств X и Y.

В случае функции f(x,y) общего вида можно говорить об определении в пространствах произвольной природы оценок минимального контраста и их состоятельности. При этом при каждом конкретном значении параметра y справедливо предельное соотношение

f_n(\omega,y)=\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\rightarrow
Mf(x_1(\omega),y)=g(y),
где f - функция контраста. Тогда состоятельность оценок минимального контраста вытекает из справедливости предельного перехода
Arg\min\left\{\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\right\}\rightarrow
Arg\min\{Mf(x_1(\omega),y)\}.

Частными случаями оценок минимального контраста являются устойчивые (робастные) оценки Тьюки-Хубера (см. ниже), а также оценки параметров в задачах аппроксимации (параметрической регрессии) в пространствах произвольной природы.

Можно пойти и дальше в обобщении законов больших чисел. Пусть известно, что при каждом конкретном y при безграничном росте n имеет быть сходимость по вероятности

f_n(\omega,y)\rightarrow f(y),
где f_n(\omega, y) - последовательность случайных функций на пространстве Y, а f(y) - некоторая функция на Y. В каких случаях и в каком смысле имеет место сходимость
Arg\min\{f_n(\omega,y),y\in X\}\rightarrow Arg\min\{f(y),y\in X\}?

Другими словами, когда из поточечной сходимости функций вытекает сходимость точек минимума?

Причем под n здесь можно понимать натуральное число. А можно рассматривать сходимость по направленному множеству (см. 4.3), или же, что практически то же самое - "сходимость по фильтру" в смысле Картана и Бурбаки [ [ 4.11 ] , с.118]. В частности, можно описывать ситуацию вектором, координаты которого - объемы нескольких выборок, и все они безгранично растут. В классической математической статистике такие постановки рассматривать не любят.

Поскольку, как уже отмечалось, основные задачи прикладной статистики можно представить в виде оптимизационных, то ответ на поставленный вопрос о сходимости точек минимума дает возможность единообразного подхода к изучению асимптотики решений разнообразных экстремальных статистических задач. Одна из возможных формулировок, основанная на бикомпактности пространств X и Y и нацеленная на изучение оценок минимального контраста, дана и обоснована выше. Другой подход развит в работе [ [ 1.17 ] ]. Он основан на использовании понятий асимптотической равномерной разбиваемости и координатной асимптотической равномерной разбиваемости пространств. С помощью указанных подходов удается стандартным образом обосновывать состоятельность оценок характеристик и параметров в основных задачах прикладной статистики.

Рассматриваемую тематику можно развивать дальше, в частности, рассматривать аналоги законов больших чисел в случае пространств, не являющихся бикомпактными, а также изучать скорость сходимости Arg\min\{f_n(x(\omega), y),y\in X\} к Arg\min\{f(y), y\in X\}.

Приведем примеры применения результатов о предельном поведении точек минимума.

Задача аппроксимации зависимости (параметрической регрессии). Пусть X и Y - некоторые пространства. Пусть имеются статистические данные - n пар (x_k, y_k), где x_k\in X, y_k\in Y, k=1,2,...,n. Задано параметрическое пространство \Theta произвольной природы и семейство функций g(x,\theta):X\times\Theta\rightarrow Y. Требуется подобрать параметр \theta\in\Theta так, чтобы g(x_k,\theta) наилучшим образом приближали y_k, k=1,2,...,n. Пусть f_k - последовательность показателей различия в Y. При сделанных предположениях параметр \theta естественно оценивать путем решения экстремальной задачи:

\theta_n=Arg\min_{\theta\in\Theta} f_k(g(x_k,\theta),y_k). ( 1)

Часто, но не всегда, все f_k совпадают. В классической постановке, когда X=R^k,Y=R^1, функции f_k различны при неравноточных наблюдениях, например, когда число опытов меняется от одной точки x проведения опытов к другой.

Если f_k(y_1,y_2) = f(y_1,y_2) = (y_1-y_2)^2, то получаем общую постановку метода наименьших квадратов (см. подробности в "Многомерный статистический анализ" ):

\theta_n=Arg\min_{\theta\in\Theta}\sum_{k=1}^n(g(x_k,\theta)-y_k)^2.

В рамках детерминированного анализа данных остается единственный теоретический вопрос - о существовании \theta_n. Если все участвующие в формулировке задачи (1) функции непрерывны, а минимум берется по бикомпакту, то \theta_n существует. Есть и иные условия существования \theta_n [ [ 1.17 ] , [ 3.4 ] , [ 2.15 ] ].

При появлении нового наблюдения x в соответствии с методологией восстановления зависимости рекомендуется выбирать оценку соответствующего y по правилу

y*=g(x,\theta_n).

Обосновать такую рекомендацию в рамках детерминированного анализа данных невозможно. Это можно сделать только в вероятностной теории, равно как и изучить асимптотическое поведение \theta_n, доказать состоятельность этой оценки.

Как и в классическом случае, вероятностную теорию целесообразно строить для трех различных постановок.

  1. Переменная x - детерминированная (например, время), переменная y - случайная, ее распределение зависит от x ;
  2. Совокупность (x_k, y_k), k=1,2,...,n, - выборка из распределения случайного элемента со значениями в X\times Y ;
  3. Имеется детерминированный набор пар (x_{k0}, y_{k0}), k=1,2,...,n, результат наблюдения (x_k, y_k) является случайным элементом, распределение которого зависит от (x_{k0}, y_{k0}). Это - постановка конфлюэнтного анализа.

Во всех трех случаях

f_n(\omega,\theta)=\sum_{k=1}^n f_k(g(x_k,\theta),y_k),
однако случайность входит в правую часть по-разному в зависимости от постановки, от которой, в свою очередь, зависит и определение предельной функции f(\theta).

Проще всего выглядит f(\theta) в случае второй постановки при f_k\equiv f:f(\theta)=Mf(g(x_1(\omega),\theta),y_1(\omega)).

В случае первой постановки

f(\theta)=\lim_{n\rightarrow\infty}\sum_{k=1}^n Mf_k(g(x_k,\theta),y_k(\omega))
в предположении существования указанного предела. Ситуация усложняется для третьей постановки:
f(\theta)=\lim_{n\rightarrow\infty}\sum_{k=1}^n Mf_k(g(x_k,(\omega),\theta),y_k(\omega)).

Во всех трех случаях на основе общих результатов о поведении решений экстремальных статистических задач можно изучить [ [ 1.17 ] , [ 3.4 ] , [ 2.15 ] ] асимптотику оценок ?n. При выполнении соответствующих внутриматематических условий регулярности оценки оказываются состоятельными, т.е. удается восстановить зависимость.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?