Опубликован: 14.07.2009 | Уровень: для всех | Доступ: платный
Лекция 13:

Основы эконометрических методов

< Лекция 12 || Лекция 13: 12345 || Лекция 14 >

Асимптотическое распределение прогностической функции. Из формул (5) и (6) следует, что

M(x^*(t))=M{a^*(t-t_{cp}+b^*}=M(a^*)(t-t_{cp})+M(b^*)=a(t-t_{cp})+b=x(t)

т.е. рассматриваемая оценка прогностической функции является несмещенной. Поэтому

D(x^*(t))=D(a^*)(t-t_{cp})^2+2M{(a^*-a)(b^*-b)(t-t_{cp}}+D(b^*)

При этом, поскольку погрешности независимы в совокупности и M(e_i)=0, то

M{(a^*-a)(b^*-b)(t-t_{cp})}=\frac{1}{n}\sum_{i=1}^n c_i(t-t_{cp})M(e_i^2)=\frac{1}{n}(t-t_{cp})\sigma^2\sum_{i=1}^n c_i=0

Таким образом,

D(x^*(t))=\sigma^2{\frac{1}{n}+\frac{(t-t_{cp})^2}{\sum_{i=1}^n(t_i - t_{cp})^2}

Итак, оценка x^{*(t)} является несмещенной и асимптотически нормальной. Для ее практического использования необходимо уметь оценивать остаточную дисперсию M(e_i^2)=\sigma^2

Оценивание остаточной дисперсии. В точках t_k , k = 1,2,\dots,n, имеются исходные значения зависимой переменной x_k и восстановленные значения x^*(t_k). Рассмотрим остаточную сумму квадратов

SS=\sum_{i=1}^n(x^*(t_i)-x(t_i))^2=\sum_{i=1}^2\{(a^*-a)(t_i-t_{cp})+(b^*-b)-e_i)^2

В соответствии с формулами (5) и (6)

SS=\sum_{i=1}^n\{(t_i-t_{cp})\sum_{i=1}^n c_je_j+\frac{1}{n}\sum_{i=1}^n e_j-e_i\}^2=\\ \sum_{i=1}^n\{\sum_{i=1}^n\{c_j(t_i-t_{cp})+\frac{1}{n}\}e_j-e_i\}^2=\sum_{i=1}^nSS_i

Найдем математическое ожидание каждого из слагаемых:

M(SS_i)= \sum_{i=1}^n\{c_j(t_i-t_{cp})+\frac{1}{n}\}^2\sigma^2-2\{c_i(t_i-t_{cp})+\frac{1}{n})\sigma^2+\sigma^2

Из сделанных ранее предположений вытекает, что при n \to \infty имеем M(ss_i)\to\sigma^2, i=1,2,\dots,n следовательно, по закону больших чисел статистика SS/n является состоятельной оценкой остаточной дисперсии \sigma^2.

Получением состоятельной оценкой остаточной дисперсии завершается последовательность задач, связанных с рассматриваемым простейшим вариантом метода наименьших квадратов. Не представляет труда выписывание верхней и нижней границ для прогностической функции:

x_{вверх}(t)=a^*(t-t_{cp})+b^*+\delta(t), x_{нижн}(t)=a^*(t-t_{cp})+b^*-\delta(t)

где погрешность \delta(t) имеет вид

\delta(t)=U(p)\sigma^*\{\frac{1}{n}+\frac{(t-t_{cp})^2}{\sum_{i=1}^n (t_i-t_{cp})^2}^{1/2}, \sigma^*=(\frac{SS}{n})^{1/2}

Здесь p - доверительная вероятность, U(p) , как и в главе 4 - квантиль нормального распределения порядка (1+р)/2, т.е.

Ф(U(p))=\frac{1+p}{2}

При p= 0,95 (наиболее применяемое значение) имеем U(p) = 1,96. Для других доверительных вероятностей соответствующие значения квантилей можно найти в статистических таблицах .

Сравнение параметрического и непараметрического подходов. Во многих литературных источниках рассматривается параметрическая вероятностная модель метода наименьших квадратов. В ней предполагается, что погрешности имеют нормальное распределение. Это предположение позволяет математически строго получить ряд выводов. Так, распределения статистик вычисляются точно, а не в асимптотике, соответственно вместо квантилей нормального распределения используются квантили распределения Стьюдента, а остаточная сумма квадратов SS делится не на n, а на (n-2) . Ясно, что при росте объема данных различия стираются.

Рассмотренный выше непараметрический подход не использует нереалистическое предположение о нормальности погрешностей. Распределения, встречающиеся в задачах менеджмента, как правило, не являются нормальными. Платой за отказ от нормальности является асимптотический характер результатов. В случае простейшей модели метода наименьших квадратов оба подхода дают практически совпадающие рекомендации. Это не всегда так, не всегда два подхода бают близкие результаты. Например, в задаче обнаружения выбросов методы, опирающиеся на нормальное распределение, нельзя считать обоснованными, и обнаружено это было с помощью непараметрического подхода.

Общие принципы. Кратко сформулируем несколько общих принципов построения, описания и использования эконометрических методов анализа данных. Во-первых, должны быть четко сформулированы исходные предпосылки, т.е. полностью описана используемая вероятностно-статистическая модель. Во-вторых, не следует принимать предпосылки, которые редко выполняются на практике. В-третьих, алгоритмы расчетов должны быть корректны с точки зрения математико-статистической теории. В-четвертых, алгоритмы должны давать полезные для практики выводы.

Применительно к задаче восстановления зависимостей это означает, что целесообразно применять непараметрический подход, что и сделано выше.

Пример оценивания по методу наименьших квадратов. Пусть даны n=6 пар чисел (t_k , x_k), k = 1,2, \dots,6, представленных во втором и третьем столбцах табл.13.1. В соответствии с формулами (2) и (4) выше для вычисления оценок метода наименьших квадратов достаточно найти суммы выражений, представленных в четвертом и пятом столбцах табл.13.1.

Таблица 13.1. Расчет по методу наименьших квадратов при построении линейной прогностической функции одной переменной
i t_i x_i t_i^2 t_ix_i a^*t_i \hat x_i x_i-\hat x_i (x_i-\hat x_i)^2
1 2 12 1 12 3,14 12,17 -0,17 0,03
2 3 20 9 60 9,42 18,45 1,55 2,40
3 4 20 16 80 12,56 21,59 -1,59 2,53
4 7 32 49 224 21,98 31,01 0,99 0,98
5 9 35 81 315 28,26 37,29 -2,29 5,24
6 10 42 100 420 31,40 40,43 1,57 2,46
\sum 34 161 256 1111 0,06 13,64
\frsc{\sum}{n} 5,67 26,83 42,67 185,17

В соответствии с формулой (2) b^* =26,83, а согласно формуле (4)

a^*=\frac{1111-\frac{1}{6}161*34}{256-1/6(34)^2}=3,14

Следовательно, прогностическая формула имеет вид

x^*(t)=3,14(t-5,67)+26,83=3,14t-3,14*5,67+26,83=3,14t-17,80+26,83=3,14t+9,03

Следующий этап анализа данных - оценка точности приближения функции методом наименьших квадратов. Сначала рассматриваются т.н. восстановленные значения

\hat x_i-x^*(t_i), j=1,2,\dots, n

Это те значения, которые полученная в результате расчетов прогностическая функция принимает в тех точках, в которых известны истинные значения зависимой переменной xi.

< Лекция 12 || Лекция 13: 12345 || Лекция 14 >
Михаил Агапитов
Михаил Агапитов
ВКР
Подобед Александр
Подобед Александр
Как оплатить обучение?
Елена Сергеева
Елена Сергеева
Россия, Таганрог, ТРТУ, 2003
Ольга Иванова
Ольга Иванова
Россия, Санкт-Петербург, ГУАП, 1994