Новосибирский Государственный Университет
Опубликован: 13.09.2006 | Доступ: свободный | Студентов: 2219 / 533 | Оценка: 4.52 / 4.28 | Длительность: 12:23:00
ISBN: 978-5-9556-0063-5
Специальности: Программист
Лекция 5:

Виды нейронных сетей и способы организации их функционирования

< Лекция 4 || Лекция 5: 1234 || Лекция 6 >

Оценка способности сети решить задачу

В данном разделе рассматриваются только сети, все элементы которых непрерывно зависят от своих аргументов. Предполагается, что все входные данные предобработаны так, чтобы все входные и выходные сигналы сети лежали в диапазоне приемлемых входных сигналов [a,b].

Нейронная сеть вычисляет некоторую вектор-функцию F от входных сигналов. Эта функция зависит от параметров сети. Обучение сети состоит в подборе такого набора параметров сети, чтобы величина

\sum_{i,p}[F_i(x^p) - f_i^p]^2

была минимальной (в идеале равна нулю), здесь \{f_i\} - множество аппроксимируемых функций. Для того, чтобы нейронная сеть могла хорошо приблизить заданную таблично функцию f, необходимо, чтобы реализуемая сетью функция F при изменении входных сигналов с x^i на x^j могла изменить значение с f^i на f^j. Очевидно, что наиболее трудным для сети должно быть приближение функции в точках, в которых при малом изменении входных сигналов происходит большое изменение значения функции. Таким образом, наибольшую сложность будет представлять приближение функции f в точках, в которых достигает максимума выражение \|f^i -
f^j\|/||x^i
- x^j\|. Для аналитически заданных функций величина

sup_{x,y} (\|f(x) - f(y)\|/\|x - y\|)

называется константой Липшица. Исходя из этих соображений, можно дать следующее определение сложности задачи.

Сложность аппроксимации таблично заданной функции f, которая в точках x^i принимает значения f^i, задается выборочной оценкой константы Липшица, вычисляемой по формуле:

\begin{equation}
 \Lambda_t = \max_{i \neq j} (\|f(x^i) - f(x^j)\|/\|x^i - x^j\|)
\end{equation} ( 1)

Оценка (1) является оценкой константы Липшица аппроксимируемой функции снизу.

Константа Липшица сети вычисляется по следующей формуле:

\Lambda_n = sup_{x,y} (\|F(x) - F(y)\|/\|x - y\|)

Для того, чтобы оценить способность сети заданной конфигурации решить задачу, необходимо оценить константу Липшица сети и сравнить ее с выборочной оценкой (1). В случае \Lambda_n <  \Lambda_t сеть принципиально не способна решить задачу аппроксимации функции f. Однако из \Lambda_n  \ge   \Lambda_t еще не следует утверждение о способности сети аппроксимировать функцию f!

Константа Липшица сигмоидальной сети

Рассмотрим слоистую сигмоидальную сеть (сеть с сигмоидальными нейронами) со следующими свойствами:

  1. Число входных сигналов - n_0.
  2. Число нейронов в i -м слое - n_i.
  3. Каждый нейрон первого слоя получает все входные сигналы, а каждый нейрон любого другого слоя получает сигналы всех нейронов предыдущего слоя.
  4. Все нейроны всех слоев имеют одинаковые функции активации f(x) =
1/(1+e^{-\beta\chi}).
  5. Все синаптические веса ограничены по модулю единицей.
  6. В сети m слоев.

В этом случае оценка константы Липшица сети равна:

\begin{equation}
  \Lambda_n \le   \beta^m(n_0n_m)^{1/2} \prod_{i=1}^{m-1} n_i
\end{equation} ( 2)

Формула (2) подтверждает экспериментально установленный факт, что, чем круче характеристическая функция нейрона (т.е. чем больше \beta ), тем более сложные функции (функции с большей константой Липшица) может аппроксимировать сеть с такими нейронами.

< Лекция 4 || Лекция 5: 1234 || Лекция 6 >