НОУ ИНТУИТ | Эконометрика. Лекция 8: Статистика нечисловых данных

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 16.12.2009 | Уровень: для всех | Доступ: свободно

|

Вам нравится? Нравится 55 студентам

| Поделиться |

Поддержать программу

Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы

Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.

Однако математический аппарат при этом основан на свойствах сумм случайных величин (векторов, элементов линейных пространств). Следовательно, он не пригоден для изучения вероятностных и статистических проблем, связанных со случайными объектами нечисловой природы. Это такие объекты, как бинарные отношения, нечеткие множества, вообще элементы пространств без векторной структуры. Объекты нечисловой природы все чаще встречаются в прикладных исследованиях. Много конкретных примеров приведено выше в настоящей лекции. Поэтому представляется полезным получение законов больших чисел в пространствах нечисловой природы. Необходимо решить следующие задачи.

Определить понятие эмпирического среднего.
Определить понятие теоретического среднего.
Ввести понятие сходимости эмпирических средних к теоретическому.
Доказать при тех или иных комплексах условий сходимость эмпирических средних к теоретическому.
Обобщив это доказательство, получить метод обоснования состоятельности различных статистических оценок.
Дать применения полученных результатов при решении конкретных задач.

Ввиду принципиальной важности рассматриваемых результатов приводим доказательство закона больших чисел, а также результаты компьютерного анализа множества эмпирических средних.

Определения средних величин. Пусть - пространство произвольной природы, $x_1, x_2, x_3, \dots, x_n$ - его элементы. Чтобы ввести эмпирическое среднее для $x_1, x_2, x_3, \dots, x_n$ будем использовать действительнозначную (т.е. с числовыми значениями) функцию f(x,y) двух переменных со значениями в . В стандартных математических обозначениях, $f:X^2 \to R^1$ Величина f(x,y) интерпретируется как показатель различия между и : чем f(x,y) больше, тем и сильнее различаются. В качестве можно использовать расстояние в , квадрат расстояния и т.п.

Определение 1. Средней величиной для совокупности $x_1, x_2, x_3, \dots, x_n$ (относительно меры различия ), обозначаемой любым из трех способов:

$х_{ср} = E_n(f) = E_n(x_1, x_2, x_3, \dots, x_n ; f),$

называем решение оптимизационной задачи

$\sum_{i=1}^nf(x,y) \to \min, y \in X$

Это определение согласуется с классическим: если Х = R^1, f(x,y) = (x - y)^2 , то $х_{ср}$ - выборочное среднее арифметическое. Если же Х = R^1, f(x,y) = |x - y| , то при n = 2k+1 имеем $х_{ср} = x(k+1)$ , при n= 2k эмпирическое среднее является отрезком [x(k), x(k+1)] . Здесь через x(i) обозначен -ый член вариационного ряда, построенного по $x_1, x_2, x_3,\dots, x_n$ , т.е. -я порядковая статистика. Таким образом, при Х = R^1, f(x,y) = |x - y| решение задачи (1) дает естественное определение выборочной медианы, правда, несколько отличающееся от предлагаемого в курсах "Общей теории статистики", в котором при n= 2k медианой называют полусумму двух центральных членов вариационного ряда (x(k) + x(k+1))/2 . Иногда x(k) называют левой медианой , а х(k+1) - правой медианой [3].

Решением задачи (1) является множество E_n(f) , которое может быть пустым, состоять из одного или многих элементов. Выше приведен пример, когда решением является отрезок. Если $Х = R^1 \{х_0\} , f(x,y) = (x - y)^2 ,$ а среднее арифметическое выборки равно х_0 , то E_n(f) пусто.

При моделировании реальных ситуаций часто можно принять, что состоит из конечного числа элементов, а тогда E_n(f) непусто - минимум на конечном множестве всегда достигается.

Понятия случайного элемента $x=x(\omega)$ со значениями в , его распределения, независимости случайных элементов используем согласно пункту 2 настоящей лекции, т.е. справочнику Ю.В. Прохорова и Ю.А. Розанова [25]. Будем считать, что функция измерима относительно $\sigma$ -алгебры, участвующей в определении случайного элемента $x=x(\omega)$ . Тогда $f(x(\omega),y)$ при фиксированном является действительнозначной случайной величиной. Предположим, что она имеет математическое ожидание.

Определение 2. Теоретическим средним (математическим ожиданием) для случайного элемента $x=x(\omega)$ относительно меры различия , обозначаемом E(x,f) , называется решение оптимизационной задачи

$Ef(x(\omega),y) \to \min, y \in X$

Это определение также согласуется с классическим. Если Х = R^1, f(x,y) = (x - y)^2 , то E(x,f) = E(x) - обычное математическое ожидание, при этом $Ef(x(\omega),y)$ - дисперсия случайной величины $x=x(\omega)$ . Если же Х = R^1 , f(x,y) = |x - y|, то E(x,f) = [a,b] , где $a = \sup\{t: F(t) \le 0,5\}, b =\ inf\{t: F(t)\ge 0,5\}$ , причем F(t) - функция распределения случайной величины $x=x(\omega)$ . Если график F(t) имеет плоский участок на уровне F(t) = 0,5 , то медиана - теоретическое среднее в смысле определения 2 - является отрезком. В классическом случае обычно говорят, что каждый элемент отрезка [a; b] является одним из возможных значений медианы. Поскольку наличие указанного плоского участка - исключительный случай, то обычно решением задачи (2) является множество из одного элемента a = b - классическая медиана распределения случайной величины $x=x(\omega)$ .

Теоретическое среднее E(x,f) можно определить лишь тогда, когда $Ef(x(\omega),y)$ существует при всех $y \in Y$ . Оно может быть пустым множеством, например, если $Х = R^1 \\ {х_0\} , f(x,y) = (x - y)^2 , x_0= E(x)$ . И то, и другое исключается, если конечно. Однако и для конечных Х теоретическое среднее может состоять не из одного, а из многих элементов. Отметим, однако, что в множестве всех распределений вероятностей на подмножество тех распределений, для которых E(x,f) состоит более чем из одного элемента, имеет коразмерность 1, поэтому основной является ситуация, когда множество E(x,f) содержит единственный элемент [3].

Существование средних величин. Под существованием средних величин будем понимать непустоту множеств решений соответствующих оптимизационных задач.

Если состоит из конечного числа элементов, то минимум в задачах (1) и (2) берется по конечному множеству, а потому, как уже отмечалось, эмпирические и теоретические средние существуют.

Ввиду важности обсуждаемой темы приведем доказательства. Для строгого математического изложения нам понадобятся термины из раздела математики под названием "общая топология". Топологические термины и результаты будем использовать в соответствии с классической монографией [29]. Так, топологическое пространство называется бикомпактным в том и только в том случае, когда из каждого его открытого покрытия можно выбрать конечное подпокрытие [29, с.183].

Теорема 1. Пусть - бикомпактное пространство, функция непрерывна на Х^2 (в топологии произведения). Тогда эмпирическое и теоретическое средние существуют.

Доказательство. Функция f(x_i,y) от непрерывна, сумма непрерывных функций непрерывна, непрерывная функция на бикомпакте достигает своего минимума, откуда и следует заключение теоремы относительно эмпирического среднего.

Перейдем к теоретическому среднему. По теореме Тихонова [29, с.194] из бикомпактности вытекает бикомпактность Х^2 . Для каждой точки (x, y) из Х^2 рассмотрим $\epsilon/2$ - окрестность в Х^2 в смысле показателя различия , т.е. множество

$U(x,y)=\{(x', y'):|f(x,y)-f(x',y')| < \epsilon /2\}$

Поскольку непрерывна, то множества U(x,y) открыты в рассматриваемой топологии в Х^2 . По теореме Уоллеса [29, с.193] существуют открытые (в ) множества V(x) и W(y) , содержащие и соответственно и такие, что их декартово произведение V(x) x W(y) целиком содержится внутри U(x, y) .

Рассмотрим покрытие Х^2 открытыми множествами V(x) x W(y) . Из бикомпактности Х^2 вытекает существование конечного подпокрытия $\{V(x_i) x W(y_i), i = 1,2, \dots, m\}$ . Для каждого из рассмотрим все декартовы произведения , куда входит точка (x, y) при каком-либо . Таких декартовых произведений и их первых множителей V(x_i) конечное число. Возьмем пересечение таких первых множителей V(x_i) и обозначим его Z(x) . Это пересечение открыто, как пересечение конечного числа открытых множеств, и содержит точку . Из покрытия бикомпактного пространства X открытыми множествами Z(x) выберем открытое подпокрытие $Z_1, Z_2,\dots, Z_k$ .

Покажем, что если x'_1 и x'_2 принадлежат одному и тому же Zj при некотором , то

$\sup\{|f(x'_1, y)-f(x'_2,y)|, y \in X\} \lt; \epsilon$

( 3)

Пусть Z_j = Z(x_0) при некотором x_0 . Пусть V(x_i) x W(y_i) , $y \in I$ , - совокупность всех тех исходных декартовых произведений из системы $\{V(x_i) x W(y_i), i = 1,2, \dots, m\}$ , куда входят точки (x_0, y) при различных . Покажем, что их объединение содержит также точки (x'_2,y) и (x'_1,y) при всех . Действительно, если (х_0, y) входит в V(x_i) x W(y_i) , то входит в W(y_i) , а x'_1 и x'_2 вместе с x_0 входят в V(x_i) , поскольку x'_1, x'_2 и x_0 входят в Z(x_0) . Таким образом, (x'_1, y) и (x'_2,y) принадлежат , а потому согласно определению V(x_i) x W(y_i)

$|f(x'_1,y)-f(x_i,y_i)| < \epsilon /2,\\ |f(x'_2,y)-f(x_i,y_i)| < \epsilon /2$

откуда и следует неравенство (3).

Поскольку Х^2 - бикомпактное пространство, то функция ограничена на Х^2, а потому существует математическое ожидание $E f(x(\omega),y)$ для любого случайного элемента $x(\omega)$ , удовлетворяющего приведенным в предыдущем разделе условиям согласования топологии, связанной с , и измеримости, связанной с $x(\omega)$ . Если х_1 и х_2 принадлежат одному открытому множеству Z_j, то $|Ef(x_1,y)-|Ef(x_2,y)| < \epsilon$ а потому функция

$g(y)=Ef(x(\omega),y)$

( 4)

непрерывна на . Поскольку непрерывная функция на бикомпактном множестве достигает своего минимума, т.е. существуют такие точки , на которых $g(z) = \inf\{g(y), y\inX\}$ , то теорема 1 доказана.

В ряде интересных для приложений ситуаций не является бикомпактным пространством. Например, если Х = R^1 . В этих случаях приходится наложить на показатель различия некоторые ограничения, например, так, как это сделано в теореме 2.

Дальше >>

Авторизоваться

Эконометрика

Статистика нечисловых данных

Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы

Вопросы и ответы