Опубликован: 10.09.2016 | Доступ: свободный | Студентов: 955 / 167 | Длительность: 15:27:00
Тема: Экономика
Лекция 4:

Гетероскедастичность моделей, ее обнаружение и методы устранения

4.1. Понятие гетероскедастичности модели

Одним из предположений теории наименьших квадратов является предположение, что все ошибки \varepsilon _{i } наблюдений имеют одинаковые дисперсии. Однако при моделировании реальных экономических процессов это предположение выполняется далеко не всегда. Посмотрев на ряд показателей урожайности пшеницы в США с 1866 по 1988 гг. (рис. 4.1), можно предположить, что с начала XX в. с повышением уровня агротехники, индустриализацией и химизацией сельского хозяйства росли не только средняя урожайность, но и абсолютные колебания урожаев вокруг среднего уровня. Если описать изменения среднего уровня урожайности некоторым уравнением регрессии, то ошибки наблюдений будут возрастать с течением времени.


Рис. 4.1.

Предположение о том, что ошибки \varepsilon _{i } наблюдений имеют одинаковые дисперсии, называется гомоскедастичностью. Если же ошибки \varepsilon _{i } наблюдений имеют разные дисперсии, то говорят о гетероскедастичности наблюдений.

В связи с этим возникают три вопроса:

  1. как правильно провести диагностику (тестирование) существования гетероскедастичности;
  2. какие следствия для оценок получаемых по методу наименьших квадратов влечет гетероскедастичность;
  3. как решать проблему гетероскедастичности?

4.2. Тестирование гетероскедастичности

В примере урожайности зерновых культур в России за 200 лет (см. рис. 3.1) присутствие гетероскедастичности не вызывает сомнений. Однако во многих случаях обнаружение гетероскедастичности визуально не столь очевидно. Чтобы определить наличие гетероскедастичности, применяют различные тесты.

Все тесты основаны на предположении о наличии связи между дисперсиями остатков моделей и объясняющими переменными или расчетными значениями зависимой переменной в случае гетероскедастичности.

Эта связь обнаруживается с помощью:

  • коэффициента ранговой корреляции в тесте ранговой корреляции Спирмена;
  • предположения о пропорциональности стандартных отклонений \sigma (\varepsilon _{i}) и зависимой переменной Y в тесте Голдфелда - Квандта;
  • построения различных линейных и нелинейных регрессий \varepsilon _{i}, \varepsilon _{i}^{2}, |\varepsilon _{i}| на объясняющие переменные или степени зависимой переменной Y и проверки значимости полученных коэффициентов регрессии в тестах Анскомба, Рамсея, Уайта и Глейзера.

В асимптотическом тесте Бреуша и Пагана проверяется по критерию \chi ^{2}(r) значимость величины , где \sigma ^{4} = \sum^{n}_{i=1}e^{2}_{i}, а S - сумма квадратов, объясняемая регрессией произвольного вида e_{i}^{2} на некоторые переменные z_{1}, z_{2}, \dots , z_{i}.

Тест Голдфелда - Квандта исходит из того, что ошибки регрессии e_{1}, e_{2}, \dots , e_{n} являются выборочными значениями нормально распределенной случайной величины. В случае гомоскедастичности первая треть наблюдений и последняя треть наблюдений имеют одинаковые дисперсии. Эта гипотеза проверяется с помощью критерия Фишера - Снедекора.

Строится наблюдаемое значение критерия


Если F_{набл} > F_{крит}(\u03b1; n/3 - k; n/3 - k), где \alpha- уровень значимости, k - число объясняющих переменных (регрессоров), F_{крит} - табличное значение критерия Фишера, то гипотеза о гомоскедастичности отвергается на \alpha-процентном уровне. В противном случае нет оснований отвергнуть нулевую гипотезу о гомоскедастичности остатков модели.

Тест ранговой корреляции Спирмена не требует предположения о нормальности распределения регрессионных остатков. Проверяется лишь предположение, что в случае гетероскедастичности остатки коррелированны со значениями регрессоров или расчетными значениями зависимой переменной. Для нахождения коэффициента ранговой корреляции следует предварительно ранжировать наблюдения по одной из объясняющей переменной x_{i} или расчетные значения зависимой переменной y_{i} и ранжировать остатки e_{i}. Далее вычисляется выборочное значение коэффициента корреляции Спирмена по формуле


где d_{i} - разности между рангами значений x_{i} и e_{i}.

После этого проверяется значимость коэффициента корреляции. Гетероскедастичность считается доказанной на уровне значимости \alpha, если наблюдаемое значение критерия Стьюдента


где t_{крит}(1 - \alpha n - 2) - табличное значение критерия Стьюдента при уровне значимости a и с числом степеней свободы n - 2.

Рассмотрим график изменения урожайности пшеницы в США с 1866 по 1998 г. (см. рис. 4.1). Аппроксимируем ряд моделью вида Y = A + exp(a + bx). Выполнив расчеты в модуле "Нелинейная регрессия" пакета STATISTICA, получим уравнение

Y = -11,52 + exp(-1,65718 + 0,002537t).

В модуле "Непараметрические статистики", сохранив предварительно остатки и расчетные значения модели, рассчитаем значение коэффициента ранговой корреляции Спирмена и его значимость (табл. 4.1).

Таблица 4.1


Результаты таблицы свидетельствуют о значимости коэффициента Спирмена, а следовательно, о гетероскедастичности остатков модели.

Инесса Воробьева
Инесса Воробьева

В дисциплине "Основы эконометрики" тест 6 дается по теме 7.