Опубликован: 30.04.2008 | Уровень: специалист | Доступ: платный | ВУЗ: Московский государственный университет имени М.В.Ломоносова
Лекция 11:

Методы генерации признаков

11.6. Признаки формы и размера

Рассмотрим методы генерации признаков, описывающих структуру. Существует два основных пути описания формы:

  • Полное описание формы в регенеративной манере (например, признаки Фурье). По такому описанию полностью можно восстановить образ.
  • Не восстановительное описание формы (дескриптивные признаки). По такому описанию можно отличить заданную форму от других, но не полностью восстановить образ.

11.6.1. Признаки Фурье

Отметим, что полное описание позволяет восстанавливать границу образа. Частичное же описание дает признаки для распознавания. Нас интересует вопрос о зависимости изменения признаков от преобразований.

Пусть x_k, y_k, где k=0,1,\ldots,N-1, – координаты последовательных точек границы; u_k=x_k+j*y_k – комплексные числа. Для N точек u_k определим ДФП (DFT):

f_l=\sum_{k=0}^{N-1}u_k\exp
\left(
-j\cdot\frac{2\pi}{N}\cdot l\cdot k
\right),
\;l=0,1,\cdot,N-1,

где f_l – Фурье-описание границы.

Рассмотрим, как изменяется f_l при сдвиге, повороте, масштабировании и сдвиге начальной точки.

Сдвиг описывается следующим образом: x'_k=x_k+\Delta x, y'_k=y_k+\Delta y и u'_k=u_k+\Delta u. Тогда

f'_l=f_l+\Delta u\delta(l),\text{ где }\delta=
\left\{
\begin{aligned}
&1,\text{ при }l=0\\
&0,\text{ при }l\neq 0
\end{aligned}
\right. .

При l=0\quad f'_0\neq f_0, т.к.

f'_0=f_0+\Delta u\delta(0)=f_0+\Delta u\neq f_0.

При l\neq 0\quad f'_l\neq f_l, т.к.

f'_l=f_l+\Delta u\delta(l)=f_l+\Delta u\cdot 0 = f_l.

Поворот описывается следующим соотношением: u'_k=u_k\cdot\exp(j\theta). Следовательно, f'_l=f_l\cdot\exp(j\theta), т.е. поворот не меняет модулей, а именно |f'_l|=|f_l|.

Масштабирование описывается следующим соотношением: u'_k=a\cdot u_k. Следовательно, f'_l=a\cdot f_l. Т.к.

\frac{f'_i}{f_i}=a\text{ и }\frac{f'_j}{f_j}=a,
то масштабирование не меняет соотношения
\frac{f'_i}{f'_j}=\frac{f_i}{f_j}

Сдвиг начальной точки определяется следующим образом: u'_k=u_{k-k_0). Следовательно

f'_l=f_l\cdot\exp
\left(
-j\cdot\frac{2\pi}{N}\cdot k_0\cdot l
\right),
т.е. сдвиг начальной точки сохраняет модули: |f'_l|=|f_l|.

11.6.2. Цепной код

Определение. Цепным кодом называется кодирование (запоминание) последовательности поворота вектора по пикселям на границе описываемой области – маршрута обхода.

Из построенного цепного кода конструируются следующие признаки:

  • относительная доля каждого направления,
  • относительная доля разных сочетаний кривизны.

Недостатком представления изображения цепным кодом является появления шума. Способом борьбы с данным недостатком является использование более мелкой (точной) сетки.


11.6.3. Геометрические свойства фигуры

Пусть P – периметр фигуры, Aплощадь фигуры. Рассмотрим следующие свойства: некруглость фигуры и энергию изгиба.

11.6.3.1. Некруглость фигуры определяется по следующей формуле:

r=\frac{P^2}{4\pi A}.

Рассмотрим два крайних значения для данного свойства. Наиболее лучшее (наибольшая "круглость") значение должно быть для круга, оно равно

r=\frac{P^2}{4\pi A}=\frac{(2\pi R)^2}{4\pi\cdot\pi R^2}=
\frac{4\pi^2 R^2}{4\pi^2 R^2}=1.

Более худший вариант (меньшая "круглость") наблюдается у квадрата. Соответствующее значение равно

r=\frac{P^2}{4\pi A}=\frac{(4a)^2}{4\pi\cdot a^2}=
\frac{16a^2}{4\pi a^2}=\frac{4}{\pi}.

11.6.3.2. Энергия изгиба. Пусть задано n точек фигуры. Тогда Энергия изгиба описывается следующей формулой:

E(n)=\frac{1}{P}\sum_{i=0}^n-1|k_i|^2,
где k_i=\theta_{i+1}-\theta_i и \theta_i=\arctan\frac{y_{i+1}-y_i}{x_{i+1}-x_i}. k_i характеризует изменение угла в вершине.

11.6.4. Скелетизация

Определение. Скелетизацией называется построение скелета, описывающего форму фигуры.

Определение. Скелетом называется множество всех центров вписанных в фигуру максимальных окружностей.


MAT (Medial Area Transform) определяется как скелет плюс функция ширины фигуры.

sevda ibrahimova
sevda ibrahimova
Азербайджан
Виктория Семенова
Виктория Семенова
Россия, г. Москва