В дисциплине "Основы эконометрики" тест 6 дается по теме 7. |
Парный регрессионный анализ
2.1. Основные понятия регрессионного анализа
Регрессионный анализ является одним из наиболее распространенных инструментов эконометрического анализа. Он позволяет проанализировать и оценить связи между зависимой (объясняемой) и независимыми (объясняющими) переменными. Зависимую переменную иногда называют результативным признаком, а объясняющие переменные - предикторами, регрессорами или факторами. Как это часто бывает, название этого метода не связано с его сутью, а имеет исторические корни. Термин "регрессия" ввел лорд Ф. Гальтон (1822-1911), исследуя связь между ростом родителей и детей. Он установил, что хотя у высоких родителей - высокие дети, а у невысоких чаще рождаются маленькие дети, рост детей имеет тенденцию к постепенному выравниванию, т.е. стремится к средним значениям. Будучи аристократом, Ф. Гальтон к такой тенденции относился негативно и потому назвал ее регрессией (упадком).
Обозначим зависимую (объясняемую) переменную как , а независимые (объясняющие) переменные как
. Если
и есть только одна независимая переменная
(которую обозначим
), то регрессия называется простой (simple), или парной. Если
то регрессия называется множественной.
Теперь обратимся к вопросам, связанным с априорными предположениями, оценкой коэффициентов и доверительными интервалами для прогноза парной регрессии.
Начнем с построения простейшей модели
где - зависимая переменная, состоящая из двух слагаемых: 1) неслучайной составляющей
(
- независимая переменная,
и
- постоянные числа - параметры уравнения); 2) случайного члена
.
Допустим, мы имеем данные, представленные в двух видах: табличном (табл. 2.1) и графическом (рис. 2.1). Предположим, что истинная зависимость между и
- линейная, т.е. существует некая прямая
, отражающая "истинную" зависимость. Задача регрессионного анализа состоит в получении оценок
, а следовательно, и положения прямой. На рисунке 2.2 такое уравнение построено с помощью пакета STATISTICA.
Таблица 2.1
Существование отклонений от прямой регрессии, т.е. случайных слагаемых , объясняется рядом причин. К ним относятся:
- ошибки измерения. Например, при сборе данных об урожайности сельскохозяйственных культур, результаты работы в отчетах могут завышаться или занижаться в зависимости от экономической политики, или оцениваться "на глазок" и т.д.;
-
невключение объясняющих переменных. Возможно, что простая зависимость
является очень большим упрощением. Наверняка существуют и другие влияющие на изменение
, факторы, которые не удалось оценить и включить в уравнение;
- неправильный выбор вида зависимости в уравнении. Возможно, зависимость не линейная, а более сложная. Приведем наиболее употребительные виды связей, используемые при построении парной регрессии:
![Y = a + b/x; Y = ax^{b}; Y = ab^{x}; Y = a + bx + cx^{2};](/sites/default/files/tex_cache/e71a58896e1277516122995a921a953c.png)
![Y = a + bx + cx^{2} + dx^{3};](/sites/default/files/tex_cache/a0f1ad7dced4f1f13742913c506fa3d6.png)
![Y = 1/(a + bx); Y = a + bx + c/x;](/sites/default/files/tex_cache/49a206eddc75aeddb3f6615627c45edb.png)
![Y = 1/(a + bx + cx^{2}); Y = a + b x \cdot tg x;](/sites/default/files/tex_cache/5bfac56ee9f0b2f74fc8aaaa0fc78e7e.png)
![\ln{Y} = a + bx; Y = a/(1 + be^{cx})\ и\ др.](/sites/default/files/tex_cache/24cc6e057f49e0a5a077ee04feecc151.png)
Вид зависимости выбирают либо графически, либо проверяя качество моделей на контрольной выборке, либо используя априорные экономические соображения. Например, валовой выпуск продукции в зависимости от числа занятых в производстве работников
может быть описан уравнением
, где
. Разделив уравнение слева и справа на
, получим зависимость производительности труда от числа работников в производстве:
, где
;
- отражение уравнением регрессии связи между агрегированными переменными. Например, зависимость между урожайностью и количеством внесенных удобрений индивидуальна для различных полей, и любая попытка определить зависимость между совокупным урожаем и совокупным внесением удобрений является лишь приближением (аппроксимацией).
Для оценки параметров обычно применяют метод наименьших квадратов (МНК). Существуют и другие методы оценки параметров, например: метод моментов, метод наименьших модулей, метод максимального правдоподобия.