В дисциплине "Основы эконометрики" тест 6 дается по теме 7. |
Стационарные временные ряды, модели авторегрессии - скользящего среднего
10.8. Алгоритм выбора модели оптимальной сложности для временного ряда в АРСС(p, q)-моделях
Все множество наблюдений разбивают на две выборки:
- обучающую с объемом наблюдений
;
- экзаменационную
с объемом наблюдений
.
На обучающей выборке определяют числовые характеристики временного ряда, а именно: среднее, дисперсию, автоковариации и автокорреляционные функции (АКФ):
Организуются циклы по переменным - числу параметров авторегрессии и
- числу параметров скользящего среднего:
![p = 1, 2, \dots , p_{max}; q = 1, 2, \dots , q_{max}.](/sites/default/files/tex_cache/28e02a369e03615faf4cd24ce1d6e204.png)
Для каждой пары () вычисляются оценки параметров авторегрессии
) путем решения системы р линейных уравнений
![АФ = x,](/sites/default/files/tex_cache/cbeb205f5781ce6fa658b4dbb11cb436.png)
По известным автоковариациям вычисляется модифицированная последовательность ковариаций
:
Вычисляются начальные значения , т.е. формируется начальный вектор \
.
Далее используется алгоритм Ньютона - Рафсона вида
![\tau ^{i+1 }= \tau ^{i } - h, \tau ^{i }= (\tau _{0}^{i}, \tau _{1}^{i}, \tau _{2}^{i}, \dots , \tau _{q}^{i}) .](/sites/default/files/tex_cache/2871186aad76ec3e384b5bed0b3e4f91.png)
При этом
![f ^{i }= (f_{0}^{i}, f_{1}^{i}, f_{2}^{i}, \dots , f_{q}^{i}),](/sites/default/files/tex_cache/77fba68484c4f9fdb7e7f43f585e640f.png)
и начальный вектор определен выше.
Если , для некоторого выбираемого заранее малого
, то итерационный процесс завершается.
Оценки параметров скользящего среднего находятся по формулам
![\beta _{j} = -\tau _{j }/ \tau _{0}, j = 0, 1, \dots , q,](/sites/default/files/tex_cache/2fdb5022f89e27fd4e63611b87d4638e.png)
где получен в результате применения алгоритма Ньютона - Рафсона (см. выше).
Вычисляем свободный член модели
Определяем оценку дисперсии белого шума:
Вычисляем остаточные ошибки модели на обучающей выборке. Пусть , тогда остаточные ошибки на обучающей выборке
имеют вид
![\alpha _{1}^{об} = \alpha _{2}^{об} = \alpha _{3}^{об} = \dots = \alpha _{s}^{об};](/sites/default/files/tex_cache/cc02d12b47e7b85f51704e2f3c5e69a6.png)
Найдем остаточные ошибки модели на проверочной последовательности. Полагаем:
![\alpha _{0}^{пр} = \alpha _{1}^{об}; = \alpha _{-1}^{пр} = \dots = \alpha T1-1^{об}; \dots , \alpha _{-s}^{пр} = \alpha T1-s^{об}](/sites/default/files/tex_cache/5601e9d18c863d399a0e5986799f4ce6.png)
и далее
Вычисляем на экзаменационной (проверочной) последовательности среднюю сумму квадратов ошибок:
Оформляем конец циклов на и
.
Выбираем пару и
, для которой
принимает минимальное значение:
![(p^{опт}, q^{опт}) = arg min \sigma ^{2}_{pq}.](/sites/default/files/tex_cache/845bbe47600a7bb7a3cd9e92dfe42356.png)
Далее производится оценка коэффициентов авторегрессии и скользящего среднего для модели выбранной оптимальной сложности с , повторяя описанный выше алгоритм для всей выборки
и получая окончательные значения коэффициентов
.
Экономичность модели. Помимо "внешнего" критерия при построении модели можно использовать принцип экономичности. Включение дополнительных переменных в модель увеличивает адекватность модели (на обучающей выборке), так как средняя ошибка модели убывает. Часто можно заменить одну модель другой - более экономичной. Например, СС( )-модель
![y_{t} = \varepsilon _{t} + 0,5\varepsilon _{t} - 1 + 0,25\varepsilon _{t} - 2 + 0,125\varepsilon _{t} - 3 + 0,0625\varepsilon _{t} - 4 +\dots](/sites/default/files/tex_cache/48e4aed1733022c9df3fc6f06b812077.png)
эквивалентна модели , что легко проверить.
Для того чтобы сделать модель более экономичной, считают, что коэффициенты авторегрессии и скользящего среднего должны иметь -статистики больше или равны 2 (чтобы каждый коэффициент значимо отличался от нуля при 5%-ном уровне значимости). Кроме того, необходимо следить за тем, чтобы коэффициенты не были сильно коррелированны друг с другом. Сильная корреляция коэффициентов делает модель неустойчивой. В этом случае следует исключать те коэффициенты, которые в наименьшей степени ухудшают результаты прогноза.
Кроме того, важно, чтобы остатки оцениваемой модели были сериально некоррелированные. Наличие сериальной корреляции остатков сигнализирует о систематических изменениях в последовательности , которые не могут быть учтены АРСС-моделью.
Чтобы проверить корреляцию остатков, строят АКФ и ЧАКФ для остатков оцениваемой модели. Затем можно использовать -статистики Бокса - Пирса и Льюиса - Бокса (см. (10.49)-(10.50)). Они позволяют определить, будут ли автокорреляции остатков или частные автокорреляции статистически значимы. Обычно можно предполагать наличие сериальной корреляции остатков при превышении критического уровня
-статистикой при 10%-ном уровне значимости. В этом случае велика вероятность построения другой модели, лучше отражающей специфику процесса.
Стационарность и обратимость модели. Из теории вероятностей известно, что выборочные АКФ и ЧАКФ аппроксимируют АКФ и ЧАКФ реального временного ряда в том случае, если предполагать стационарность ряда . Далее,
и
-статистики также предполагают стационарность ряда
.
Если искомый ряд не стационарный, то первым шагом в подходе Бокса - Дженкинса является взятие первой, второй и следующих разностей временного ряда
![\Delta ^{2}y_{t} = y_{t} - y_{t} - 1, \Delta ^{2}y_{t} = \Delta (\Delta y_{t})](/sites/default/files/tex_cache/660dd3508de6b850afa678ce713c3d1b.png)
и так далее до тех пор, пока в результате не получится стационарный временной ряд. Этот подход обладает серьезным недостатком, так как не позволяет включать в модель долговременные составляющие. Современные подходы к построению модели временных рядов в условиях нестационарности рассмотрены в последующих главах книги.
Подход Бокса - Дженкинса требует также обратимости модели. Она означает возможность представления модели в виде конечного или бесконечного, но сходящегося авторегрессионного процесса. Это необходимо для АКФ и ЧАКФ. Рассмотрим, к примеру, СС(1)-модель
![y_{t} = \varepsilon _{t} - \beta _{1}\varepsilon _{t} - 1.](/sites/default/files/tex_cache/fe25f18f5acf625debfcde00bd7780a2.png)
Если , то
![\varepsilon _{t} = y_{t}/(1 - \beta _{1}L).](/sites/default/files/tex_cache/5090c62da0171e8ad7c891c64f7e5000.png)
Разлагая в ряд правую часть равенства, получаем:
![y_{t} + \beta _{1}y_{t-1} + \beta _{1}^{2}y_{t} + \beta _{1}^{3}y_{t} + \dots = \varepsilon _{t}.](/sites/default/files/tex_cache/be5d7f3a338ec78a9b34960af28b47f5.png)
Полученная модель представляет собой сходящуюся авторегрессионную модель бесконечного порядка, для которой могут быть посчитаны АКФ и ЧАКФ. Однако если , то последовательность
не может быть представлена сходящейся авторегрессией. В общем случае для АРСС(
)-модели корни многочлена
должны лежать вне единичного круга. Тогда модель обратима.
Заметим, что могут существовать и необратимые модели с "долгосрочной памятью", которые нельзя построить по методу Бокса - Дженкинса. Например, модель стационарного процесса
![y_{t} = \varepsilon _{t} - \varepsilon _{t} - 1](/sites/default/files/tex_cache/6b55f98a2db72fe1d9aad2bb0b188071.png)
с постоянным средним , дисперсией и автоковариациями
и \
. Записывая модель в эквивалентном виде
![y_{t} = -y_{t} - 1 + y_{t} - 2 - y_{t} - 3 + y_{t} - 4 +\dots](/sites/default/files/tex_cache/0175482357cb1ab52b670812c0141361.png)
убеждаемся, что ЧАКФ не затухают с увеличением лага .