Линейный классификатор. Алгоритм персептрона
3.2.3. Сходимость алгоритма персептрона.
Основной вопрос, связанный с алгоритмом персептрона связан с его сходимостью. Конечен ли построенный итерационный процесс обучения?
Теорема Новикова. Пусть – бесконечная последовательность векторов из двух непересекающихся замкнутых множеств и ; и пусть существует гиперплоскость, проходящая через начало координат и разделяющая и (не имеет с ними общих точек). Тогда при использовании алгоритма персептрона число коррекций весового вектора конечно.
Доказательство. Пусть - направляющий вектор разделяющей гиперплоскости (которая существует по условию). Не нарушая общности, будем считать, что он является единичным.
Пусть , в – симметричное к множество; , где – евклидово расстояние. Согласно утверждению 3.3 .
Оценим .
Пусть – единичный вектор нормали, разделяющий и .
Пусть – весовой вектор после предъявления вектора ; – начальная итерация весового вектора . Тогда, если , то коррекции не происходит. Иначе, если , то коррекция:
, т.к. и
Таким образом, к моменту происходит коррекций, то
( 3.1) |
В начальный момент времени . Если в момент произошла коррекция, то
Если коррекция не происходит, то Если к моменту произошло коррекций, то С другой стороны Поэтому( 3.2) |
Из неравенств 3.1 и 3.2 следует:
Таким образом, число коррекций не превосходит .3.2.4. Оптимизационная интерпретация. Рассмотрим непрерывную кусочно-линейную функцию :
– множество векторов неправильно классифицированных гиперплоскостью . Тогда и . Задача состоит в минимизации этой функции: Построим минимизацию по схеме градиентного спуска: Т.к. , тоТаким образом, алгоритм персептрона представляет собой вариант алгоритма градиентного спуска. Выбор последовательности величин для обычно осуществляется так, чтобы:
3.2.5. Схема Кеслера. Идея построения линейного классификатора естественно обобщается на случай классификации с числом классов больше двух. Рассмотрим задачу классификации по классам. Для каждого класса необходимо определить линейную дискриминантную функцию . Пусть – -мерный вектор в расширенном пространстве. Вектор относится к классу , если
Схема Кеслера позволяет применить алгоритм персептрона для решения этой задачи.
Для каждого вектора-прецедента из строим векторов размерности :
и вектор , где – весовой вектор -ой дискриминантной функции.Пусть , тогда вектор можно записать в виде:
Если относится к классу , то , т.к. и .
Таким образом, задача заключается в построении линейного классификатора в -мерном пространстве так, чтобы каждый из векторов-прецедентов лежал в положительном полупространстве. Если вектора в исходной задаче разделимы, то это можно сделать с помощью алгоритма персептрона.