| Россия |
Линейный классификатор. Алгоритм персептрона
3.2.3. Сходимость алгоритма персептрона.
Основной вопрос, связанный с алгоритмом персептрона связан с его сходимостью. Конечен ли построенный итерационный процесс обучения?
Теорема Новикова. Пусть
– бесконечная последовательность векторов из двух непересекающихся
замкнутых множеств
и
; и пусть существует гиперплоскость,
проходящая через начало координат и разделяющая
и
(не имеет с ними
общих точек). Тогда при использовании алгоритма персептрона число
коррекций весового вектора конечно.
Доказательство. Пусть
- направляющий вектор разделяющей
гиперплоскости (которая существует по условию). Не нарушая общности,
будем считать, что он является единичным.
Пусть
,
в – симметричное
к
множество;
, где
– евклидово
расстояние. Согласно утверждению 3.3
.
Оценим
.
Пусть
– единичный вектор нормали, разделяющий
и
.


Пусть
– весовой вектор после предъявления вектора
;
– начальная итерация весового вектора
.
Тогда, если
, то коррекции не происходит.
Иначе, если
, то коррекция: 
, т.к.
и 
Таким образом, к моменту
происходит
коррекций, то
![]() |
( 3.1) |
В начальный момент времени
.
Если в момент
произошла коррекция, то


произошло
коррекций, то

![]() |
( 3.2) |
Из неравенств 3.1 и 3.2 следует:

не превосходит
.3.2.4. Оптимизационная интерпретация. Рассмотрим непрерывную кусочно-линейную функцию
:

– множество векторов неправильно классифицированных гиперплоскостью
.
Тогда
и
. Задача состоит в минимизации этой функции:

, то 
Таким образом, алгоритм персептрона представляет собой вариант
алгоритма градиентного спуска. Выбор последовательности величин
для
обычно осуществляется так, чтобы:

3.2.5. Схема Кеслера. Идея построения линейного классификатора
естественно обобщается на случай классификации с числом классов больше
двух. Рассмотрим задачу классификации по
классам. Для каждого класса
необходимо определить линейную дискриминантную функцию
.
Пусть –
-мерный вектор в расширенном пространстве. Вектор
относится к
классу
, если

Схема Кеслера позволяет применить алгоритм персептрона для решения этой задачи.
Для каждого вектора-прецедента из
строим
векторов
размерности
:

, где
– весовой вектор
-ой
дискриминантной функции.Пусть
, тогда вектор
можно записать в виде:

Если
относится к классу
, то
, т.к.
и
.
Таким образом, задача заключается в построении линейного
классификатора в
-мерном пространстве так, чтобы каждый из
векторов-прецедентов лежал в положительном полупространстве. Если
вектора в исходной задаче разделимы, то это можно сделать с помощью
алгоритма персептрона.


