Опубликован: 10.09.2016 | Уровень: для всех | Доступ: платный
Лекция 12:

Ложная регрессия, коинтеграция и модели корректировки ошибок

12.1. Проблема обнаружения ложной корреляции в данных

Тренды в данных могут привести к ложным корреляциям, следствием которых являются ложные связи между переменными в регрессионном уравнении. Однако в действительности между собой коррелируют только временные тренды.

Временной тренд может быть исключен из результирующей переменной путем построения регрессии этой переменной по времени и перехода к остаткам, которые образуют новую стационарную переменную, уже свободную от тренда. Или этот тренд может быть сразу включен в модель путем введения времени в качестве одной из переменных-регрессоров. При этом используются регрессионные модели, основанные на стандартных t- и F-тестах и оперирующие со стационарными временными рядами, имеющими постоянные средние и дисперсии.

При построении регрессии нестационарной переменной на детерминированную переменную времени остатки обычно не дают в результате стационарную переменную.

Рассмотрим, например, два процесса случайного блуждания

y_{t} = y_{t} - 1 + u_{t}, u_{t} ~ IN(0, 1), (12.1)
x_{t}= x_{t} - 1 + n_{t}, n_{t} ~ IN(0, 1), (12.2)

где

IN (0, 1) - класс временных рядов с независимыми приращениями с нулевым средним и единичной дисперсией, подчиняющимися нормальному закону.

Оба процесса представляют некоррелированные нестационарные переменные. Поэтому, если оценивается регрессионная модель

y_{t} = \beta _{0} +\beta _{1}x_{t} + \varepsilon _{t}, (12.3)

то естественно за нулевую гипотезу H_{0} принять, что H_{0} : \beta _{1} = 0, и ожидать, что коэффициент детерминации R^{2} будет близок к нулю. Однако нестационарная природа данных влечет нестационарность \varepsilon _{t}. Таким образом, любая тенденция к росту в обоих рядах ведет к появлению корреляции, которая и будет отражена в регрессионный модели. Хотя каждый ряд растет по совершенно разным причинам с некоррелированными уровнями роста, а значит, что в уравнении \Delta y_{t} = \alpha _{0} + \alpha _{1}\Delta x_{t} + \eta _{t} коэффициент \alpha _{1} сходится по вероятности к нулю. Итак, корреляция между нестационарными рядами еще не означает наличие существенных (причинных) связей между ними, как это выводится в случае стационарных рядов.

Кроме того, проблема ложной (кажущейся) корреляции, выражающаяся в ненулевой оценке коэффициента \beta _{1}, осложняется тем, что обычные выборочные t- и F-статистики не имеют стандартных распределений, как в случае стационарных рядов. Существует явная тенденция к отрицанию гипотезы H_{0} : \beta _{1} = 0, которая возрастает по мере увеличения объема выборки. Были проведены по методу Монте-Карло следующие эксперименты. Уравнение (12.3) было оценено 10 000 раз, при этом y_{t} и x_{t} определялись по уравнениям (12.1) и (12.2). В результате оценок среднее значение \beta 1 оказалось равным -0,012 и соответствующая стандартная ошибка равна 0,006 (при размере выборки Т = 100). Это дает отрицание нулевой гипотезы. Основываясь на 10 000 повторений, вероятность отрицания H_{0} при уровне значимости 0,05 равна 0,753, т.е. для 75,3% регрессий были получены значения t-статистики с |t| > 1,96. Это объясняется тем, что средняя t-статистика, полученная в эксперименте, равна -0,12 с соответствующим стандартным отклонением 7,3. Нестандартное распределение t-статистики привело к очень высокой вероятности отрицания гипотезы H_{0}.

Это позволяет сделать вывод, что проблема ошибочного обнаружения связей часто возникает в не связанных между собой нестационарных временных рядах. Данная проблема возрастает с ростом выборки и не может быть разрешена путем выделения трендов в изучаемых рядах, как для стационарных рядов с временным трендом.

Возникает вопрос: когда можно делать вывод о причинной долговременной связи между нестационарными рядами, основываясь на регрессионном уравнении (12.3)? Решение этой проблемы лежит в области коинтеграции нестационарных временных рядов.

Говорят, что ряд содержит единичные корни и интегрируем с порядком d, т.е. принадлежит классу I(d), если он становится стационарным после взятия d раз операций вычисления разности от временного ряда. В общем случае любая линейная комбинация рядов класса I(d) должна также принадлежать I(d). Однако если существует такой вектор \beta, при котором вектор возмущений ut = yt - \beta xt имеет меньший порядок интеграции I(d - b), где \beta > 0, то, по определению Р. Энгла и К. Грангера, y_{t} и x_{t} коинтегрированы с порядком (d, b). Если y_{t} \hat{I} I(1) и x_{t} \hat{I} I(1), а u_{t} \hat{I} I(0), то оба ряда коинтегрированы с порядком CI(1, 1).

С экономической точки зрения, если два или более ряда коинтегрированы, то между ними существует равновесная устойчивая долговременная связь, хотя сами ряды содержат стохастические тренды, т.е. не стационарны. Концепция коинтеграции может быть интерпретирована как существование долговременного устойчивого равновесного соотношения между параметрами экономической системы, а \varepsilon _{t} (см. (12.3)) - как расстояние (ошибка) от равновесного направления в пространстве состояний (y_{t}, x_{t}).

Инесса Воробьева
Инесса Воробьева

В дисциплине "Основы эконометрики" тест 6 дается по теме 7.

Вера Борисова
Вера Борисова
Россия
Студентик Студент
Студентик Студент
Россия