Комитетные методы решения задач распознавания
7.4. Функция Шеннона
Пусть – это число гиперплоскостей, достаточное для разделения любых точечных множеств и точек общего положения в пространстве .
Лемма 1. Если , то
Доказательство. Если , то добавим точки общего положения до . Через точек из проводим гиперплоскость:
Для такого, что .
Выберем и возьмем гиперплоскости и . и отделяют точки от всех остальных.
Аналогичным образом из оставшихся точек выделяем еще и строим еще пару гиперплоскостей. Далее из оставшихся точек выделяем еще и строим еще пару гиперплоскостей и т.д. В конце получим точек. Следовательно:
Утверждение 1. Если разделяют множества и , и – непрерывная кривая в такая, что , а , то существует и такие, что .
Утверждение 2. Любая гиперплоскость пересекает кривую не более, чем в точках.
Доказательство. Рассмотрим линейный функционал . Запишем условие пересечения гиперплоскости и кривой :
Кривая задана многочленом степени . Следовательно, – то же многочлен степени . Значит, уравнение является уравнением степени . Следовательно, т.к. корни могут быть кратными, данное уравнение имеет не более корней.
Лемма 2. .
Доказательство. Построим . Рассмотрим последовательность точек:
Пусть , где , . Тогда – точки в .
Без ограничения общности положим , при нечетном, и , при четном. Тогда получим непрерывную кривую (см. рис).
Каждая гиперплоскость дает не более, чем пересечений. Кривая должна иметь разделение, т.е. должно быть гиперплоскостей. Следовательно, всего гиперплоскостей должно быть не менее, чем , т.е. .
Т.к.
то .Следовательно, , при нечетном , , при четном .
Окончательно получаем: , .
Пример. Пусть , , . Обозначим и . Тогда
7.5. Метод построения комитета.
Пусть – множество прецедентов; в – размерность пространства признаков; и – количество прецедентов в каждом классе.
Построим – линейный функционал такой, что, если , то объект из класса , и, если , то объект из класса . Если данный функционал правильно классифицирует меньше половины объектов, то возьмем его со знаком минус.
Итак, пусть линейный функционал правильно классифицирует больше половины объектов. Разобьем множество прецедентов на множество правильно классифицированных объектов и множество неправильно классифицированных объектов , т.е. .
Далее строим последовательно пары функционалов и :
Делаем очередной шаг. . Пусть на – правильно классифицированных объектов, а на – правильно классифицированных объектов. Строим пару . В выделяем точек одного класса. Эти точки можно перевести в , т.е. , а .
На каждом шаге множество неправильно классифицированных объектов уменьшается на , следовательно, процесс сходится.
Общее число функционалов:
Теорема. Существует комитет линейных функционалов, в котором число членов не превосходит .