Опубликован: 26.05.2021 | Доступ: платный | Студентов: 30 / 3 | Длительность: 14:25:00
Лекция 14:

Анализ временных рядов, тренд ряда динамики, точечная оценка прогноза

< Лекция 13 || Лекция 14 || Лекция 15 >
Аннотация: Цель работы: научиться выполнять прогнозирование временного ряда данных с помощью средств Microsoft Excel и математически. Содержание работы: Анализ временных рядов. Прогноз, характеристики и параметры прогнозирования. Уравнение тренда временного ряда. Порядок выполнения работы: Изучить методические указания. Выполнить задания с использованием средств MS Excel. Оформить отчет, сделав выводы по заданиям.

МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

Анализ временных рядов

Временной ряд (или ряд динамики) – это упорядоченная по времени последовательность значений некоторой произвольной переменной величины. Тем самым, временной ряд существенным образом отличается от простой выборки данных. Каждое отдельное значение данной переменной называется отсчётом (уровнем элементов) временного ряда.

Временные ряды состоят из двух элементов:

  • периода времени, за который или по состоянию на который приводятся числовые значения;
  • числовых значений того или иного показателя, называемых уровнями ряда.

Временные ряды классифицируются по следующим признакам:

  • по форме представления уровней: ряды абсолютных показателей, относительных показателей, средних величин;
  • по количеству показателей, когда определяются уровни в каждый момент времени: одномерные и многомерные временные ряды;
  • по характеру временного параметра: моментные и интервальные временные ряды. В моментных временных рядах уровни характеризуют значения показателя по состоянию на определенные моменты времени. В интервальных рядах уровни характеризуют значение показателя за определенные периоды времени. Важная особенность интервальных временных рядов абсолютных величин заключается в возможности суммирования их уровней. Отдельные же уровни моментного ряда абсолютных величин содержат элементы повторного счета. Это делает бессмысленным суммирование уровней моментных рядов;
  • по расстоянию между датами и интервалами времени выделяют равноотстоящие – когда даты регистрации или окончания периодов следуют друг за другом с равными интервалами и неполные (неравноотстоящие) – когда принцип равных интервалов не соблюдается;
  • по наличию пропущенных значений: полные и неполные временные ряды. Временные ряды бывают детерминированными и случайными: первые получают на основе значений некоторой неслучайной функции (ряд последовательных данных о количестве дней в месяцах); вторые есть результат реализации некоторой случайной величины;
  • в зависимости от наличия основной тенденции выделяют стационарные ряды – в которых среднее значение и дисперсия постоянны и нестационарные – содержащие основную тенденцию развития.

Временные ряды, как правило, возникают в результате измерения некоторого показателя. Это могут быть как показатели (характеристики) технических систем, так и показатели природных, социальных, экономических и других систем (например, погодные данные). Типичным примером временного ряда можно назвать биржевой курс, при анализе которого пытаются определить основное направление развития (тенденцию или тренда).

Анализ временных рядов – совокупность математико-статистических методов анализа, предназначенных для выявления структуры временных рядов и для их прогнозирования. Сюда относятся, в частности, методы регрессионного анализа. Выявление структуры временного ряда необходимо для того, чтобы построить математическую модель того явления, которое является источником анализируемого временного ряда. Прогноз будущих значений временного ряда используется для эффективного принятия решений.

Прогноз, характеристики и параметры прогнозирования

Прогноз (от греч. $\pi\rho o\gamma\nu\omega\sigma\iota\varsigma$ – предвидение, предсказание) – предсказание будущего с помощью научных методов, а также сам результат предсказания. Прогноз – это научная модель будущего события, явлений и т.п.

Прогнозирование, разработка прогноза; в узком значении – специальное научное исследование конкретных перспектив развития какого-либо процесса.

Прогнозы делятся:

  • по срокам: краткосрочные, среднесрочные, долгосрочные;
  • по масштабу: личные, на уровне предприятия (организации), местные, региональные, отраслевые, мировые (глобальные).

К основным методам прогнозирования относятся:

  • статистические методы;
  • экспертные оценки (метод Дельфи);
  • моделирование.

Прогноз – обоснованное суждение о возможном состоянии объекта в будущем или альтернативных путях и сроках достижения этих состояний. Прогнозирование – процесс разработки прогноза. Этап прогнозирования – часть процесса разработки прогнозов, характеризующаяся своими задачами, методами и результатами. Деление на этапы связано со спецификой построения систематизированного описания объекта прогнозирования, сбора данных, с построением модели, верификацией прогноза.

Прием прогнозирования – одна или несколько математических или логических операций, направленных на получение конкретного результата в процессе разработки прогноза. В качестве приема могут выступать сглаживание динамического ряда, определение компетентности эксперта, вычисление средневзвешенного значения оценок экспертов и т. д.

Модель прогнозирования – модель объекта прогнозирования, исследование которой позволяет получить информацию о возможных состояниях объекта прогнозирования в будущем и (или) путях и сроках их осуществления.

Метод прогнозирования – способ исследования объекта прогнозирования, направленный на разработку прогноза. Методы прогнозирования являются основанием для методик прогнозирования.

Методика прогнозирования – совокупность специальных правил и приемов (одного или нескольких методов) разработки прогнозов.

Прогнозирующая система – система методов и средств их реализации, функционирующая в соответствии с основными принципами прогнозирования. Средствами реализации являются экспертная группа, совокупность программ и т. д. Прогнозирующие системы могут быть автоматизированными и неавтоматизированными.

Прогнозный вариант – один из прогнозов, составляющих группу возможных прогнозов.

Объект прогнозирования – процесс, система, или явление, о состоянии которого даётся прогноз.

Характеристика объекта прогнозирования – качественное или количественное отражение какого-либо свойства объекта прогнозирования.

Переменная объекта прогнозирования – количественная характеристика объекта прогнозирования, которая является или принимается за изменяемую в течение периода основания и (или) периода упреждения прогноза.

Период основания прогноза – промежуток времени, за который используют информацию для разработки прогноза. Этот промежуток времени называют также периодом предыстории.

Период упреждения прогноза – промежуток времени, на который разрабатывается прогноз.

Прогнозный горизонт – максимально возможный период упреждения прогноза заданной точности.

Точность прогноза – оценка доверительного интервала прогноза для заданной вероятности его осуществления.

Достоверность прогноза – оценка вероятности осуществления прогноза для заданного доверительного интервала.

Ошибка прогноза – апостериорная величина отклонения прогноза от действительного состояния объекта.

Источник ошибки прогноза – фактор, способный привести к появлению ошибки прогноза. Различают источники регулярных и нерегулярных ошибок.

Верификация прогноза – оценка достоверности и точности или обоснованности прогноза.

Статистические методы прогнозирования – научная и учебная дисциплина, к основным задачам которой относятся разработка, изучение и применение современных математико-статистических методов прогнозирования на основе объективных данных; развитие теории и практики вероятностно-статистического моделирования экспертных методов прогнозирования; методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических (как математико-статистических, так и экспертных) моделей. Научной базой статистических методов прогнозирования является прикладная статистика и теория принятия решений.

Простейшие методы восстановления используемых для прогнозирования зависимостей исходят из заданного временного ряда, т. е. функции, определённой в конечном числе точек на оси времени. Временной ряд при этом часто рассматривается в рамках той или иной вероятностной модели, вводятся другие факторы (независимые переменные), помимо времени, например, объем денежной массы. Временной ряд может быть многомерным. Основные решаемые задачи – интерполяция и экстраполяция. Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К. Гауссом в 1794–1795 гг. Могут оказаться полезными предварительные преобразования переменных, например, логарифмирование. Наиболее часто используется метод наименьших квадратов при нескольких факторах.

Оценивание точности прогноза (в частности, с помощью доверительных интервалов) – необходимая часть процедуры прогнозирования. Обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей). Применяются также эвристические приемы, не основанные на вероятностно-статистической теории: метод скользящих средних, метод экспоненциального сглаживания.

Многомерная регрессия, в том числе с использованием непараметрических оценок плотности распределения – основной на настоящий момент статистический аппарат прогнозирования. Нереалистическое предположение о нормальности погрешностей измерений и отклонений от линии (поверхности) регрессии использовать не обязательно; однако для отказа от предположения нормальности необходимо опереться на иной математический аппарат, основанный на многомерной Центральной Предельной Теореме теории вероятностей, технологии линеаризации и наследования сходимости. Он позволяет проводить точечное и интервальное оценивание параметров, проверять значимость их отличия от 0 в непараметрической постановке, строить доверительные границы для прогноза.

Уравнение тренда временного ряда

Рассматривая временной ряд как множество результатов наблюдений изучаемого процесса, проводимых последовательно во времени, в качестве основных целей исследования временных рядов можно выделить: выявление и анализ характерного изменения параметра у, оценка возможного изменения параметра в будущем (прогноз).

Значения временного ряда можно представить в виде: $y_{t}=f(t)+\varepsilon_{t}$, где f(t) – неслучайная функция, описывающая связь оценки математического ожидания со временем, $\varepsilon_{t}$ – случайная величина, характеризующая отклонение уровня от f(t).

Неслучайная функция f(t) называется трендом. Тренд отражает характерное изменение (тенденцию) yt за некоторый промежуток времени. На практике в качестве тренда выбирают несколько возможных теоретических или эмпирических моделей. Могут быть выбраны, например, линейная, параболическая, логарифмическая, показательная функции. Для выявления типа модели на координатную плоскость наносят точки с координатами (t, yt) и по характеру расположения точек делают вывод о виде уравнения тренда. Для получения уравнения тренда применяют различные методы: сглаживание с помощью скользящей средней, метод наименьших квадратов и другие.

Уравнение тренда линейного вида будем искать в виде yt=f(t), где f(t) = a0+a1(t).

Пример 1. Имеется временной ряд:

ti 1 2 3 4 5 6 7 8 9 10
xti 2 1 4 4 6 8 7 9 12 11

Построим график xti во времени. Добавим на графике линию тренда исходных значений ряда. При этом, щелкнув правой кнопкой мыши по линии тренда, можно вызвать контекстное меню "Формат линии тренда", а в нем поставить флажок "показывать уравнение на диаграмме", тогда на диаграмме высветится уравнение линии тренда, вычисленное встроенными возможностями Excel.


Рис. 14.1.

Чтобы определить уравнение тренда, необходимо найти значения коэффициентов а0 и а1. Эти коэффициенты следует определять, исходя из условия минимального отклонения значений функции f(t) в точках ti от значений исходного временного ряда в тех же точках ti. Это условие можно записать в виде (на основе метода наименьших квадратов):

$$\sum\limits_{t=1}^{n}[x_{t}-a_{0}-a_{1}t]^{2}\rightarrow min\eqno(1)$$

где n – количество значений временного ряда.

Для того, чтобы найти значения а0 и а1, необходимо иметь систему из двух уравнений. Эти уравнения можно получить, используя условие равенства нулю производной функции в точках её экстремума. В нашем случае эта функция имеет вид $\sum\limits_{t=1}^{n}[x_{t}-a_{0}-a_{1}t]^{2}$. Обозначим её через Q. Найдем производные функции Q(а0, а1) по переменным а0 и а1. Получим систему уравнений:

$$\left\{\begin{aligned}
 \frac{dQ}{da_{0}}=-2\sum\limits_{t=1}^{n}(x_{t}-a_{0}-a_{1}t)=0;\\
 \frac{dQ}{da_{1}}=-2\sum\limits_{t=1}^{n}(x_{t}-a_{0}-a_{1}t)t=0;
 \end{aligned}
 \right.$$

Полученная система может быть преобразована (математически) в систему так называемых нормальных уравнений. При этом уравнения примут вид:

$$\left\{\begin{aligned}
 \sum\limits_{t=1}^{n}x_{t}=n\cdot a_{0}+a_{1}\cdot \sum\limits_{t=1}^{n}t;\\
 \sum\limits_{t=1}^{n}x_{t}\cdot t=a_{0}\cdot \sum\limits_{t=1}^{n}t+a_{1}\cdot \sum\limits_{t=1}^{n}t^{2}.
 \end{aligned}
 \right.\eqno(2)$$

Теперь необходимо решить преобразованную систему уравнений относительно а0 и а1. Однако предварительно следует составить и заполнить вспомогательную таблицу:

t t2 хt хtt
1 1 2 2
2 4 1 2
3 9 4 12
4 16 4 16
5 25 6 30
6 36 8 48
7 49 7 49
8 64 9 72
9 81 12 108
10 100 11 110
$\sum  t=55$ $\sum  t^{2}=  385$ $\sum  x_{t}=  64$ $\sum  x_{t}\cdot  t=  449$

Подставив значения n = 10 в систему уравнений (2), получим

$$\left\{\begin{aligned}
 64=10\cdot a_{0}+a_{1}\cdot 55;\\
 449=a_{0}\cdot 55+a_{1}\cdot 385.
 \end{aligned}
 \right.$$

Решив систему уравнений относительно а0 и а1, получим а0 = -0,035, а1 = 1,17. Тогда функция тренда заданного временного ряда f(t) имеет вид:

f(t) = -0,035 + 1,17t.

Изобразим полученную функцию на графике.


Рис. 14.2.

Задание 1.

Временной ряд приведен в таблице. Используя средства MS Excel:

  1. построить график временного ряда;
  2. добавить линию тренда и ее уравнение;
  3. найти уравнение тренда методом наименьших квадратов, сравнить уравнения (выше на графике и полученное);
  4. построить график временного ряда и полученной функции тренда в одной системе координат.

Варианты.

1. Реализация аспирина по аптеке (у.е.) за последние 7 недель приведена в таблице:

t 1 2 3 4 5 6 7
хti 3,2 3,3 2,9 2,2 1,6 1,5 1,2

2. Динамика потребления молочных продуктов (у.е.) по району за последние 7 месяцев:

t 1 2 3 4 5 6 7
хti 30 29 27 24 25 24 23

3. Динамика числа работников, занятых в одной из торговых сетей города за последние 8 лет приведена в таблице:

t 1 2 3 4 5 6 7 8
хti 280 361 384 452 433 401 512 497

4. Динамика потребления сульфаниламидных препаратов в клинике по годам (тыс. упаковок):

t 1 2 3 4 5 6 7 8
хti 14 21 29 33 38 44 46 50

5. Динамика продаж однокомнатных квартир в городе за последние 8 лет (тыс. ед.):

t 1 2 3 4 5 6 7 8
уt 39 40 36 34 36 37 33 35

6. Динамика потребления антибиотиков в клинике (тыс. упаковок):

t 1 2 3 4 5 6 7 8
хti 10 17 18 13 17 21 25 29

7. Динамика производства хлебобулочных изделий на хлебозаводе (тонн):

t 1 2 3 4 5 6 7 8
хti 510 502 564 680 523 642 728 665

8. Динамика потребления противовирусных препаратов по аптечной сети в начале эпидемии гриппа (тыс. единиц):

t 1 2 3 4 5 6 7 8
хti 36 42 34 38 12 32 26 20

9. Динамика потребления противовирусных препаратов по аптечной сети в конце эпидемии гриппа (тыс. единиц):

t 1 2 3 4 5 6 7 8
хti 46 52 44 48 32 42 36 30

10. Динамика потребления витаминов по аптечной сети в весенний период (с марта по апрель) в разные годы (у.е.):

t 1 2 3 4 5 6 7 8
хti 0,9 1,7 1,5 1,7 1,5 2,1 2,5 3,6

Пример 2. Используя данные примера 1, приведенного выше, вычислить точечный прогноз исходного временного ряда на 5 шагов вперед.

Исходя из условия задачи, необходимо определить точечную оценку прогноза для t = 11, 12, 13, 14, 15, где t в данном случае – шаг упреждения.

Решение.

Рассмотрим решение этой задачи средствами Microsoft Excel. При решении данной задачи следует так же, как и в примере 1, ввести исходные данные. Выделив данные, построить точечный график, щелкнув правой кнопкой мыши по ряду данных, вызвать контекстное меню и выбрать "Добавить линию тренда".

Щелкнув правой кнопкой мыши по линии тренда, вызвать контекстное меню, выбрать "Формат линии тренда", в окне Параметры линии тренда указать прогноз на 5 периодов и поставить флажок в окошке "Показывать уравнение на диаграмме (рис. 14.3 рис. 14.3.). В версии Excel ранее 2007 окно диалога представлено на рисунке 14.4 рис. 14.4.

Задание параметров тренда в MS Excel 2007

Рис. 14.3. Задание параметров тренда в MS Excel 2007
Задание параметров тренда в версии ранее MS Excel 2007

Рис. 14.4. Задание параметров тренда в версии ранее MS Excel 2007

Итоговый график представлен на рисунке 14.5 рис. 14.5.


Рис. 14.5.

Значения прогноза для 11, 12, 13, 14 и 15 уровней получим, используя функцию ПРЕДСКАЗ( ). Данная функция позволяет получить значения прогноза линейного тренда. Вычисленные значения: 12,87, 14,04, 15,22, 16,39, 17,57.

Значения точечного прогноза для исходного временного ряда на 5 шагов вперед можно вычислить и с помощью уравнения функции тренда f(t), найденного по методу наименьших квадратов. Для этого в полученное для f(t) выражение необходимо подставить значения t = 11, 12, 13, 14, 15. В результате получим (эти значения следует рассчитать, сформировав формулу в табличном процессоре MS Excel):

$$f(11) = 1,17\cdot 11-0,035 = 12,84;$$$$f(12) = 1,17\cdot 12-0,035 = 14,01;$$$$f(13) = 1,17\cdot 13-0,035 = 15,18;$$$$f(14) = 1,17\cdot 14-0,035 = 16,35;$$$$f(15) = 1,17\cdot 15-0,035 = 17,52.$$

Сравнивая результаты точечных прогнозных оценок, полученных разными способами, выявляем, что данные отличаются незначительно, таким образом, в любом из способов расчета присутствует определенная погрешность (ошибка) прогноза ($\varepsilon_{t}$).

Задание 2.

Используя значения временного ряда Задания 1 согласно вашего варианта, вычислить точечный прогноз на 4 шага вперед. Продлить линию тренда на 4 прогнозных значения, вывести уравнение тренда, определить эти значения с помощью функции ПРЕДСКАЗ() или ТЕНДЕНЦИЯ(), а также по выражению функции тренда f(t), полученному по методу наименьших квадратов в Задании 1. Сравнить полученные результаты.

< Лекция 13 || Лекция 14 || Лекция 15 >
Арсен Никифоров
Арсен Никифоров

Есть такие задания, и они никак не принимаются. Притом ошибки только по этим заданиям, в какой бы последовательности я их не заполнял. Как их заполнять??? Инструкций в заданиях нет. Там через запятые, подряд как число, через пробел, или надо текст весь писать через запятую или точку?

Задание: Пронумеруйте шаги Создание имени путем выделения ячеек на листе:
​1) На вкладке Формулы в группе Присвоенные имена выберите команду Создать из выделенного.
2) В диалоговом окне Создание имен из выделенного диапазона укажите место, содержащее заголовки.
3) Выберите диапазон, которому нужно присвоить имя.