Опубликован: 15.06.2007 | Уровень: специалист | Доступ: платный
Лекция 4:

Адаптация и обучение

Метод потенциальных функций

Предположим, что требуется разделить два непересекающихся образа V1 и V2. Это значит, что в пространстве изображений существует, по крайней мере, одна функция, которая полностью разделяет множества, соответствующие образам V1 и V2. Эта функция должна принимать положительные значения в точках, которые соответствуют объектам, принадлежащим образу V1, и отрицательные — в точках образа V2. В общем случае таких разделяющих функций может быть много, тем больше, чем компактней разделяемые множества. В процессе обучения требуется построить одну из этих функций, иногда в некотором смысле наилучшую.

Метод потенциальных функций связан со следующей процедурой. В процессе обучения с каждой точкой пространства изображений, соответствующей единичному объекту из обучающей последовательности, связывается функция U(X, Xi), заданная на всем пространстве и зависящая от Xi как от параметра. Такие функции называются потенциальными, так как они напоминают функции потенциала электрического поля вокруг точечного электрического заряда. Изменение потенциала электрического поля по мере удаления от заряда обратно пропорционально квадрату расстояния. Потенциал, таким образом, может служить мерой удаления точки от заряда. Когда поле образовано несколькими зарядами, потенциал в каждой точке этого поля равен сумме потенциалов, создаваемых в этой точке каждым из зарядов. Если заряды, образующие поле, расположены компактной группой, потенциал поля будет иметь наибольшее значение внутри группы зарядов и убывать по мере удаления от нее.

Обучающей последовательности объектов соответствует последовательность векторов X1, X2, …, с которыми в пространстве изображений связана последовательность U(X, X1), U(X, X2), … потенциальных функций, используемых для построения функций f(X1, X2, …). По мере увеличения числа объектов в процессе обучения функция f должна стремиться к одной из разделяющих функций. В результате обучения могут быть построены потенциальные функции для каждого образа:

U_1(X)=\sum\limits_{X_1\in V_1} U(X,X_i),\\ U_2(X)=\sum\limits_{X_1\in V_2} U(X,X_i) ( 4.35)

В качестве разделяющей функции f(X) можно выбрать функцию вида:

f(X)=U1(X)-U2(X),(4.36)

которая положительна для объектов одного образа и отрицательна для объектов другого.

В качестве потенциальной функции рассмотрим функцию вида

U(X,X_i)=\sum\limits_{j=1}^{\infty} \lambda_j^2 \varphi_j (X)\varphi_j (X_i)=\sum\limits_{j=1}^{\infty} \psi_j(X)\psi_j(X_i) ( 4.37)

где \varphi_j (X) — линейно независимая система функций; \lambda_j — действительные числа, отличные от нуля для всех j = 1, 2, … ; Xi — точка, соответствующая i -му объекту из обучающей последовательности. Предполагается, что \varphi_j (X) и U(X, Xi) ограничены при X\in V_1\cup V_2;\psi_j(X)=\lambda_j \varphi_j (X).

В процессе обучения предъявляется обучающая последовательность и на каждом n-м такте обучения строится приближение fn(X), которое характеризуется следующей основной рекуррентной процедурой:

fn+1(X)=qnfn(X)+rnU(Xn+1,X),(4.38)

Разновидности алгоритмов потенциальных функций отличаются выбором значений qn и rn, которые являются фиксированными функциями номера n. Как правило, q_n \equiv 1, а rn выбирается в виде:

r_n \equiv \gamma_n (S(f_n(X_{n+1}),f(X{n+1}))) ( 4.39)

где S(fn, f) — невозрастающие функции, причем

S(f,f)\equiv 0 \\
S(f_n,f)=\begin{cases}
\le0,&f_n\ge f\\
\ge0,&f_n\le f
\end{cases} ( 4.40)

Коэффициенты \gamma_n представляют собой неотрицательную числовую последовательность, зависящую только от номера n. Кроме того, \sum\limits_{n=1}^{\infty} \gamma_n = \infty и \sum\limits_{n=1}^{\infty} \gamma_n^2 < \infty (например, \gamma_n=1/n ) или \gamma_n=const.

Разработано несколько вариантов алгоритмов потенциальных функций, различие между которыми состоит в выборе законов коррекции разделяющей функции от шага к шагу, т. е. в выборе законов коррекции разделяющей функции от шага к шагу, иными словами, в выборе коэффициентов rn. Приведем два основных алгоритма потенциальных функций.

  1. Будем считать, что f_0(X)\equiv 0 (нулевое приближение). Пусть в результате применения алгоритма после n -го шага построена разделяющая функция fn(X), а на (n+1) -м шаге предъявлено изображение Xn+1, для которого известно действительное значение разделяющей функции f(Xn+1 ). Тогда функция fn+1(X) строится по следующему правилу:

    f_{n+1}(X)=f_n(X)+\gamma_{n+1}sign(f(X_{n+1})-f_n(X_{n+1}))\cdot U(X,X_{n+1}) ( 4.41)

  2. Во втором алгоритме также принимается, что f_0(X)\equiv 0. Переход к следующему приближению, т. е. переход от функции fn(X) к fn+1(X), осуществляется в результате следующей рекуррентной процедуры:

    f_{n+1}(X)=f_n(X)+(f(X_{n+1})-f_n(X_{n+1}))\cdot  \frac{1}{\lambda}U(X,X_{n+1}) ( 4.42)

    где \lambda — произвольная положительная константа, удовлетворяющая условию \lambda =(1/2)\cdot max(X,X_i).

Если в (ф. 5) принять

\psi_j(X)=sign(\sum\limits_{v=1}^{m} \beta_{vj} \cdot x_v + \Theta_j),
и предположить, что xv может иметь только два значения 0 и 1, то в этом случае алгоритм потенциальных функций будет совпадать со схемой персептрона с индивидуальными порогами А -элементов и с коррекцией ошибок. Поэтому многие теоретические положения метода потенциальных функций могут быть успешно применены для анализа некоторых перцептронных схем.

Сергей Пчеляков
Сергей Пчеляков

Добрый день!

В курсе "Проектирование систем искусственного интеллекта" начал проходить обучение и сдал тесты по лекциям 1,2,3,4. Но видимо из-за того что не записался на курс, после того как записался на курс у меня затерлись результаты сданных тестов. Можно как-то исправить (восстановить результаты по тестам 1,2,3,4) ?

Виктор Рубцов
Виктор Рубцов
Никита Тищенко
Никита Тищенко
Россия
Александр Смирнов
Александр Смирнов
Россия, Ульяновск, Ульяновский государственный педагогический университет имени И.Н.Ульянова, 1993