Линейный классификатор. Алгоритм персептрона
3.1. Линейная дискриминантная функция
Рассмотрим задачу построения линейной разделяющей гиперповерхности. Главным достоинством линейного классификатора является его простота и вычислительная эффективность.
Рассмотрим линейную дискриминантную функцию: , где – весовой вектор, – порог. Поведение решения задается уравнением . Пусть и – два конечных множества векторов признаков в евклидовом пространстве, относящихся к классу и соответственно, т.е принадлежит классу при , а принадлежит классу при .
Задача состоит в том, чтобы:
- установить разделимость этих множеств;
- найти разделяющую гиперплоскость.
Рассмотрим сначала в качестве примера двумерную задачу, когда образы представляются точками на плоскости.
Определение. Множество, содержащее отрезок, соединяющий две произвольные внутренние точки, называется выпуклым.
Определение. Выпуклая оболочка – это минимальное выпуклое множество, содержащее данное.
Утверждение 3.1. Два множества на плоскости линейно разделимы тогда и только тогда, когда их выпуклые оболочки не пересекаются.
Из этого утверждения получаем следующее правило проверки разделимости множеств на плоскости:
- Построить выпуклые оболочки.
- Проверить пересечение выпуклых оболочек. Если они не пересекаются, то множества разделимы.
Очевидно и правило, по которому можно найти разделяющую прямую:
- Найти ближайшую пару точек в выпуклых оболочках обоих множеств.
- Построить срединный перпендикуляр к отрезку, соединяющему эти точки. Этот перпендикуляр и будет разделяющей прямой.
Пусть размерность вектора признаков и вектора коэффициентов равна . Рассмотрим "пополненные" вектора следующего вида: – пополненный весовой вектор, – пополненный вектор признаков. Рассмотрим также в -мерном пространстве однородную линейную функцию .
Очевидно следующее
Утверждение 3.2. Множества и линейно разделимы в пространстве дискриминантной функцией тогда и только тогда, когда они разделимы в пополненном пространстве однородной дискриминантной функцией .
Далее будем рассматривать дискриминантные функции и вектора в пополненном пространстве.
Определение. Множество называется симметричным множеством к множеству .
Утверждение 3.3. Два замкнутых множества и разделимы тогда и только тогда, когда выпуклая оболочка множества не содержит начала координат.
Доказательство. Пусть множества и разделимы. Тогда существует линейная функция такая, что при и при . Рассмотрим множество , тогда при . Следовательно, для выпуклой линейной комбинации из , а это означает, что , т.к. – замкнутое. Здесь обозначает начало координат.
Пусть , и пусть – ближайшая к началу координат точка из . Плоскость с направляющим вектором не пересекает , а, значит, на . Следовательно, на .