Опубликован: 25.12.2006 | Доступ: свободный | Студентов: 1816 / 336 | Оценка: 4.43 / 4.13 | Длительность: 15:29:00
Специальности: Программист, Экономист
Лекция 8:

Предсказание финансовых временных рядов

Измерение качества предсказаний

Хотя предсказание финансовых рядов и сводится к задаче аппроксимации многомерной функции, оно имеет свои особенности как при формировании входов, так и при выборе выходов нейросети. Первый аспект, касающийся входов, мы уже обсудили. Теперь коснемся особенностей выбора выходных переменных. Но прежде ответим на главный вопрос: как измерить качество финансовых предсказаний. Это поможет определить наилучшую стратегию обучения нейросети.

Связь предсказуемости с нормой прибыли

Особенностью предсказния финансовых временных рядов является стремление к получению максимальной прибыли, а не минимизации среднеквадратичного отклонения, как это принято в случае аппроксимации функций.

В простейшем случае ежедневной торговли прибыль зависит от верно угаданого знака изменения котировки. Поэтому нейросеть нужно ориентировать именно на точность угадывания знака, а не самого значения. Найдем как связана норма прибыли с точностью определения знака в простейшей постановке ежедневного вхождения в рынок ( рисунок 8.9).

Ежедневное вхождение в рынок

Рис. 8.9. Ежедневное вхождение в рынок

Обозначим на момент t: полный капитал игрока K_t, относительное изменение котировки x_t=\Delta C_t/C_t, а в качестве выхода сети возьмем степень ее уверенности в знаке этого изменения y_t\in [-1,1]. Такая сеть с выходной нелинейностью вида y=tanh(\alpha) обучается предсказывать знак изменения и выдает прогноз знака с амплитудой пропорциональной его вероятности. Тогда возрастание капитала на шаге t запишется в виде:

K_t=K_{t-1}[1+|x_t|\deltasgn(x_t,y_t)]
где \delta - доля капитала, "в игре". Выигрыш за все время игры:
K_t=K_0 \exp\left(\sum_{k=1}^t\ln[1+x_k \deltasgn(y_k)]\right)
нам и предстоит максимизировать, выбрав оптимальный размер ставок \sigma. Пусть в среднем игрок угадывает долю p=\frac{1}{2}+\varepsilon знаков и, соответственно, ошибается с вероятностью q=\frac{1}{2}-\varepsilon. Тогда логарифм нормы прибыли,
\langle\ln(K_t/K_0)\rangle=t\langle
p\ln(1+|x|\delta)+q\ln(1-|x|\delta)\rangle,
а следовательно и сама прибыль, будет максимальной при значении \delta=(p-q)\langle|x|\rangle/\langlex^2\rangle и составит в среднем:
\langle\ln(K_t/K_0)\rangle\approx
t(p-q)^2\frac{\langle|x|\rangle^2}{2\langle x^2\rangle}=2\alpha
t\varepsilon^2.

Здесь мы ввели коэффициент \alpha=\langle|x|\rangle^2/\langle x^2\rangle\leq1. Например, для Гауссова распределения \alpha\approx0.8. Степень предсказуемости знака напрямую связана с кросс-энтропией, которую можно оценить a priori методом box-counting. Для бинарного выхода (см. рисунок 8.10):

Доля правильно угаданных направлений изменений ряда как функция кросс-энтропии знака выхода при   известных входах

Рис. 8.10. Доля правильно угаданных направлений изменений ряда как функция кросс-энтропии знака выхода при известных входах

В итоге получаем следующую оценку нормы прибыли при заданной величине предсказуемости знака I, выраженной в битах:

K_t=K_0 2^{\alpha It}.

То есть, для ряда с предсказуемостью I в принципе возможно удвоить капитал за t=1/(\alpha I) вхождений в рынок. Так, например, измеренная выше предсказуемость временного ряда S&P500, равная I=0.17 (см. рисунок 8.8) предполагает удвоение капитала в среднем за t=1/(0.8\cdot 0.17)\approx8 вхождений в рынок. Таким образом, даже небольшая предсказуемость знака изменения котировок способна обеспечить весьма заметную норму прибыли.

Подчеркнем, что оптимальная норма прибыли требует достаточно аккуратной игры, когда при каждом вхождении в рынок игрок рискует строго определенной долей капитала:

\langle\Delta
K\rangle/K=\delta\langle|x|\rangle=(p-q)\langle|x|\rangle^2/\langle
x^2\rangle=2\alpha\varepsilon\approx 1.6\varepsilon,
где \Delta K - типичная при данной волатильности рынка \langle|x|\rangle величина выигрыша или проигрыша7Это отношение, в принципе, может быть не малым даже при очень маленькой волатильности - за счет механизмов залоговой торговли, практикуемых на биржах Как меньшие, так и большие значения ставок уменьшают прибыль. Причем, чересчур рискованная игра может привести к проигрышу при любой предсказательной способности. Этот факт иллюстрирует рисунок 8.11.
Зависимость средней нормы прибыли от выбора доли капитала "на кону"

Рис. 8.11. Зависимость средней нормы прибыли от выбора доли капитала "на кону"

Поэтому приведенные выше оценки дают представление лишь о верхнем пределе нормы прибыли8Помимо явного пренебрежения комиссионными, вызывает сомнения само предположение о постоянном перевложении капитала. В более реалистичной игре на фиксированном капитале экспоненциальный рост сменяется линейным Более тщательный анализ с учетом влияния флуктуаций, выходит за рамки нашего изложения. Качественно понятно, однако, что выбор оптимального размера контрактов требует оценки точности предсказаний на каждом шаге.

Выбор функционала ошибки

Если принять, что целью предсказаний финансовых временных рядов является максимизация прибыли, логично настраивать нейросеть именно на этот конечный результат. Например, при игре по описанной выше схеме для обучения нейросети можно выбрать следующую функцию ошибки обучения, усредненную по всем примерам из обучающей выборки:

E=-\langle\ln[1+x_t\delta_t sgn(y_t)]\rangle.

Здесь доля капитала в игре введена в качестве дополнительного выхода сети, настраиваемого в процессе обучения. При таком подходе, первый нейрон, y_t, с функцией активации f=tanh() даст вероятность возрастания или убывания курса, в то время как второй выход сети \delta_t даст рекомендованную долю капитала в игре на данном шаге.

Поскольку, однако, в соответствии с предыдущим анализом, эта доля должна быть пропорциональна степени уверености предсказания, можно заменить два выхода сети - одним, положив \delta_t=\delta|y_t|, и ограничиться оптимизацией всего одного глобального параметра \delta минимизирующего ошибку:

E=-\langle\ln[1+\delta x_t y_t]\rangle

Тем самым, появляется возможность регулировать ставку в соответствии с уровнем риска, предсказываемым сетью. Игра с переменными ставками приносит большую прибыль, чем игра с фиксированными ставками. Действительно, если зафиксировать ставку, определив ее по средней предсказуемости, то скорость роста капитала будет пропорциональна \langle\varepsilon\rangle^2, тогда как если определять оптимальную ставку на каждом шаге, то - пропорциональна \langle\varepsilon^2\rangle\geq \langle\varepsilon\rangle^2.