Виды нейронных сетей и способы организации их функционирования
Предобработка данных
Нормировка и центрирование данных (предобработка) используются почти всегда (кроме тех случаев, когда данные представляют собой бинарные векторы с координатами 0,1 или , либо символьные последовательности). Цель этих преобразований - сделать так, чтобы каждая компонента вектора данных лежала в отрезке (или ) или, по крайней мере, не слишком далеко выходила из этого отрезка, и её характерный разброс тоже был бы единичным.
Стандартные преобразования исходной выборки :
или где - -я компонента вектора ,
- выборочная оценка математического ожидания ;
- выборочная оценка среднего квадратичного отклонения. Любое изменение выборки должно, согласно этим формулам, менять и нормировку. Нормировка и центрирование вписывают исходную выборку в куб со стороной 2, вершинами которого являются векторы с координатами
Интерпретация ответов сети
При интерпретации выходных сигналов сети необходимы аккуратность и порой изобретательность, ведь от этого истолкования зависят требования, которые мы предъявляем к работе НС. Удачная их формулировка может упростить обучение и повысить точность работы, неудачная — свести на нет предыдущие усилия.
Масштабирование является естественной операцией при обработке выходных сигналов. Стандартные (обезразмеренные) НС формируются так, чтобы их выходные сигналы лежали в интервалах (или ). Если нам нужно получить сигнал в интервале , то нужно преобразовать выходной сигнал :
В задачах классификации наиболее распространено правило интерпретации "победитель забирает все": число нейронов равно числу классов, номер нейрона с максимальным сигналом интерпретируется как номер класса. К сожалению, если классов много, то этот наглядный метод является слишком расточительным, потребляет слишком много выходных нейронов.
Знаковая интерпретация требует только нейронов ( - число классов). Строится она так. Пусть - совокупность выходных сигналов нейронов. Заменим в этой последовательности положительные числа единицами, а отрицательные - нулями. Полученную последовательность нулей и единиц рассматриваем как номер класса в двоичной записи.
Порядковая интерпретация является еще более емкой, чем знаковая. В ней с помощью нейронов можно описать принадлежность к ! классам (а не как для знаковой). Пусть - выходные сигналы. Проведем их сортировку и обозначим через номер -го сигнала после сортировки (1 соответствует наименьшему сигналу, - наибольшему). Перестановку рассмотрим как слово, кодирующее номер класса. Всего возможно ! перестановок. Этим интерпретатором можно пользоваться, если характерная ошибка выходного сигнала меньше Даже при получаем реализуемые требования к точности и богатые возможности (10! классов).