Опубликован: 25.12.2006 | Доступ: свободный | Студентов: 1832 / 361 | Оценка: 4.43 / 4.13 | Длительность: 15:29:00
Специальности: Программист, Экономист
Лекция 8:

Предсказание финансовых временных рядов

Использование комитетов сетей

Из-за случайности в выборе начальных значений синаптических весов, предсказания сетей, обученных на одной и той же выборке, будут, вообще говоря, разниться. Этот недостаток (элемент неопределенности) можно превратить в достоинство, организовав комитет нейро-экспертов, состоящий из различных нейросетей. Разброс в предсказаниях экспертов даст представление о степени уверенности этих предсказаний, что можно использовать для правильного выбора стратегии игры.

Легко показать, что среднее значений комитета должно давать лучшие предсказания, чем средний эксперт из этого же комитета. Пусть ошибка i -ого эксперта для значения входа x равна \varepsilon_i(x). Средняя ошибка комитета всегда меньше среднеквадратичной ошибки отдельных экспертов в силу неравенства Коши:

\left(\frac{1}{L}\sum_{i=1}^L\varepsilon_i\right)^2\leq\frac{1}{L}\sum_{i=1}^L\varepsilon_i^2

Причем, снижение ошибки может быть довольно заметным. Так, если ошибки отдельных экспертов не коррелируют друг с другом, т. е. \langle\varepsilon_i\varepsilon_j\rangle=\langle\varepsilon^2_i\rangle\delta_{ij}, то среднеквадратичная ошибка комитета из L экспертов в \sqrt{L} раз меньше, чем средняя индивидуальная ошибка одного эксперта!

E^2_L\equiv\left\langle\left(\frac{1}{L}\sum_{i=1}^L\varepsilon_i\right)^2\right\rangle=\frac{1}{L^2}\left\langle\sum_{i=1}^L\varepsilon^2_i+\sum_{i\neq
j}\varepsilon_i\varepsilon_j\right\rangle=\frac{1}{L^2}\sum^L_{i=1}\langle\varepsilon^2_i\rangle=\frac{1}{L}E^2_1

Поэтому, в предсказаниях всегда лучше опираться на средние значения всего комитета. Иллюстрацией этого факта служит рисунок 8.12.

Норма прибыли на последних 100 значениях ряда sp500 при предсказании комитетом из 10 сетей.   Выигрыш комитета (кружки) выше, чем выигрыш среднего эксперта. Счет угаданных знаков для комитета 59:41

Рис. 8.12. Норма прибыли на последних 100 значениях ряда sp500 при предсказании комитетом из 10 сетей. Выигрыш комитета (кружки) выше, чем выигрыш среднего эксперта. Счет угаданных знаков для комитета 59:41

Как видно из приведенного выше рисунка, в данном случае выигрыш комитета даже выше, чем выигрыш каждого из экспертов. Таким образом, метод комитетов может существенно повысить качество прогнозирования. Обратите внимание на абсолютное значение нормы прибыли: капитал комитета возрос в 3.25 раза при 100 вхождениях в рынок (Естественно, эта норма будет ниже при учете транзакционных издержек).

Предсказания получены при обучении сети на 30 последовательных экспоненциальных скользящих средних (EMA1 … EMA30) ряда приращений индекса. Предсказывался знак приращения на следующем шаге.

В этом эксперименте ставка была зафиксирована на уровне \langle|x|\rangle\delta=0.16, близком к оптимальному при данной точности предсказаний (59 угаданных знаков против 41 ошибки) т.е. p-q\approx 0.18. На следующем же рисунке приведены результаты более рискованной игры по тем же предсказаниям, а именно - с \langle|x|\rangle\delta=0.2.

Норма прибыли на последних 100 значениях ряда sp500 при тех же предсказаниях комитета из 10 сетей,   но по более рискованной стратегии

Рис. 8.13. Норма прибыли на последних 100 значениях ряда sp500 при тех же предсказаниях комитета из 10 сетей, но по более рискованной стратегии

Выигрыш комитета в целом остался на прежнем уровне (чуть увеличился), поскольку данное значение риска так же близко к оптимуму, как и предыдущее. Однако, для большинства сетей, предсказания которых хуже, чем у комитета в целом, такие ставки оказались слишком рискованными, что привело к практически полному их разорению.

Приведенные выше примеры показывают как важно уметь правильно оценить качество предсказания и как можно использовать эту оценку для увеличения прибыльности от одних и тех же предсказаний.

Можно пойти еще дальше и вместо среднего использовать взвешенное мнение сетей-экспертов. Веса выбираются адаптивно максимизируя предсказательную способность комитета на обучающей выборке. В итоге, хуже обученные сети из комитета вносят меньший вклад и не портят предсказания.

Возможности этого пути иллюстрирует приведенное ниже сравнение предсказаний двух типов комитетов из 25 экспертов (см. рисунки 8.14,8.15). Предсказания проводились по одной и той же схеме: в качестве входов использовались экспоненциальные скользящие средние приращений ряда с периодами равными первым 10 числам Фибоначчи. По результатам 100 экспериментов взвешенное предсказание дает в среднем превышение правильно угаданных знаков над ошибочным равное примерно 15, тогда как среднее - около 12. Заметим, что общее число повышений курса над понижением за указанный период как раз равно 12. Следовательно, учет общей тенденции к повышению в виде тривиального постоянного предсказания знака "+" дает такой же результат для процента угаданных знаков, что и взвешенное мнение 25 экспертов.

Гистограмма сумм угаданных знаков при средних предсказаниях 25 экспертов. Среднее по 100   комитетам = 11.7 при стандартном отклонении 3.2

Рис. 8.14. Гистограмма сумм угаданных знаков при средних предсказаниях 25 экспертов. Среднее по 100 комитетам = 11.7 при стандартном отклонении 3.2
Гистограмма сумм угаданных знаков при взвешенных предсказаниях тех же 25 экспертов. Среднее по   100 комитетам = 15.2 при стандартном отклонении 4.9

Рис. 8.15. Гистограмма сумм угаданных знаков при взвешенных предсказаниях тех же 25 экспертов. Среднее по 100 комитетам = 15.2 при стандартном отклонении 4.9