Опубликован: 18.05.2005 | Уровень: специалист | Доступ: свободно | ВУЗ: Московский государственный технологический университет «Станкин»
Лекция 4:

Распознавание изображений

< Лекция 3 || Лекция 4: 12 || Лекция 5 >
Аннотация: В лекции рассматриваются характеристики задач распознавания образов и их типы, основы теории анализа и распознавания изображений (признаковый метод), распознавание по методу аналогий. Среди множества интересных задач по распознаванию рассмотрены принципы и подход к распознаванию в задачах машинного чтения печатных и рукописных текстов.

Современные роботы, снабженные телевизионными камерами, способны достаточно хорошо видеть, чтобы работать с реальным миром. Они могут делать заключения о том, какого типа объекты присутствуют, в каких они находятся отношениях между собой, какие группы образуют, какой текст содержат и т. д. Однако сложные задачи распознавания, например, распознавание похожих трехмерных быстродвижущихся объектов или неразборчивого рукописного текста требуют совершенствования методов и средств для своего решения. В этой лекции мы рассмотрим основы некоторых традиционных методов распознавания. Наше рассмотрение мы начнем с наиболее часто применяемого признакового метода распознавания [ 1.4 ] , [ 4.1 ] .

Общая характеристика задач распознавания образов и их типы.

Под образом понимается структурированное описание изучаемого объекта или явления, представленное вектором признаков, каждый элемент которого представляет числовое значение одного из признаков, характеризующих соответствующий объект. Общая структура системы распознавания и этапы в процессе ее разработки показаны на рис. 4.1.

Структура системы распознавания

Рис. 4.1. Структура системы распознавания

Суть задачи распознавания - установить, обладают ли изучаемые объекты фиксированным конечным набором признаков, позволяющим отнести их к определенному классу.

Задачи распознавания имеют следующие характерные черты.

  1. Это информационные задачи, состоящие из двух этапов: а) приведение исходных данных к виду, удобному для распознавания ; б) собственно распознавание (указание принадлежности объекта определенному классу).
  2. В этих задачах можно вводить понятие аналогии или подобия объектов и формулировать понятие близости объектов в качестве основания для зачисления объектов в один и тот же класс или разные классы.
  3. В этих задачах можно оперировать набором прецедентов-примеров, классификация которых известна и которые в виде формализованных описаний могут быть предъявлены алгоритму распознавания для настройки на задачу в процессе обучения.
  4. Для этих задач трудно строить формальные теории и применять классические математические методы (часто недоступна информация для точной математической модели или выигрыш от использования модели и математических методов не соизмерим с затратами).
  5. В этих задачах возможна "плохая" информация (информация с пропусками, разнородная, косвенная, нечеткая, неоднозначная, вероятностная).

Целесообразно выделить следующие типы задач распознавания.

  1. Задача распознавания - отнесение предъявленного объекта по его описанию к одному из заданных классов (обучение с учителем).
  2. Задача автоматической классификации - разбиение множества объектов (ситуаций) по их описаниям на систему непересекающихся классов (таксономия, кластерный анализ, обучение без учителя).
  3. Задача выбора информативного набора признаков при распознавании.
  4. Задача приведения исходных данных к виду, удобному для распознавания.
  5. Динамическое распознавание и динамическая классификация - задачи 1 и 2 для динамических объектов.
  6. Задача прогнозирования - это задачи 5, в которых решение должно относиться к некоторому моменту в будущем.

Основы теории анализа и распознавания изображений.

Пусть дано множество M объектов ; на этом множестве существует разбиение на конечное число подмножеств (классов) \Omega, i = {1,m}, M = \cup \Omega _{i} (i = 1..m). Объекты \omega задаются значениями некоторых признаков xj, j= {1,N}. Описание объекта I(\omega )=(x_{1}(\omega ), \dots , x_{N}(\omega )) называют стандартным, если x_{j}(\omega ) принимает значение из множества допустимых значений.

Пусть задана таблица обучения ( таблица 4.1). Задача распознавания состоит в том, чтобы для заданного объекта \omega и набора классов \Omega _{1}, ..., \Omega _{m} по обучающей информации в таблице обучения I_{0}(\Omega _{1}\dots \Omega _{m}) о классах и описанию I(\omega ) вычислить предикаты:

P_{i}(\omega  \in  \Omega _{i})=\{ 1(\omega  \in  \Omega _{i}), 0(\omega  \in  \Omega _{i}), (\omega  \in  \Omega _{i})\} ,

где i= {1,m}, \Delta - неизвестно.

Таблица 4.1. Таблица обучения
Объект Признаки и их значения Класс
x1 xj xn
_{\omega 1} \alpha _{11} \alpha _{1j} \alpha _{1n} \Omega _{1}
...
\omega _{r_1} r11 \alpha _{r_1j} \alpha _{r_1n}
...
\omega _{r_k} \alpha _{r_k 1} \alpha _{r_k j} \alpha _{r_k n} \Omega _{m}
...
\omega _{r_m} \alpha _{r_m 1} \alpha _{r_m j} \alpha _{r_m n}

Рассмотрим алгоритмы распознавания, основанные на вычислении оценок. В их основе лежит принцип прецедентности (в аналогичных ситуациях следует действовать аналогично).

Пусть задан полный набор признаков x1, ..., xN. Выделим систему подмножеств множества признаков S1, ..., Sk. Удалим произвольный набор признаков из строк \omega _{1}, \omega _{2}, ..., \omega _{rm} и обозначим полученные строки через S\omega _{1}, S\omega _{2}, ..., S\omega _{rm}, S\omega '.

Правило близости, позволяющее оценить похожесть строк S\omega ' и S\omega _{r} состоит в следующем. Пусть "усеченные" строки содержат q первых символов, то есть S\omega _{r}=(a_{1}, \dots , a_{q}) и S\omega '=(b_{1}, \dots , b_{q}). Заданы пороги \varepsilon _{1}... \varepsilon _{q}, \delta. Строки S\omega _{r} и S\omega ' считаются похожими, если выполняется не менее чем \delta неравенств вида

|a_{j}-b_{j}| \le  \varepsilon _{j}, j=1,2,\dots , q.

Величины \varepsilon _{1}... \varepsilon _{q}, \delta входят в качестве параметров в модель класса алгоритмов на основе оценок.

Пусть Г_{i}(\omega ') - оценка объекта \omega ' по классу \Omega _{i}.

Описания объектов \{ \omega '\}, предъявленные для распознавания, переводятся в числовую матрицу оценок. Решение о том, к какому классу отнести объект, выносится на основе вычисления степени сходства распознавания объекта (строки) со строками, принадлежность которых к заданным классам известна.

Проиллюстрируем описанный алгоритм распознавания на примере. Задано 10 классов объектов (рис. 4.2а). Требуется определить признаки таблицы обучения, пороги и построить оценки близости для классов объектов, показанных на рис. 4.2б. Предлагаются следующие признаки таблицы обучения:

x1 - количество вертикальных линий минимального размера;

x2 - количество горизонтальных линий;

x3 - количество наклонных линий;

x4 - количество горизонтальных линий снизу объекта.

Пример задачи по распознаванию

Рис. 4.2. Пример задачи по распознаванию

На рис. 4.3 приведена таблица обучения и пороги

\varepsilon _{1}=1, \varepsilon _{2}=1, \varepsilon _{3}=1, \varepsilon _{4}=1, \delta =1.

Из этой таблицы видно, что неразличимость символов 6 и 9 привела к необходимости ввода еще одного признака x4.

Таблица обучения для задачи по распознаванию

Рис. 4.3. Таблица обучения для задачи по распознаванию

Теперь может быть построена таблица распознавания для объектов на рис. 4.2б.

Объект x1 x2 x3 x4 Результат распознавания
Объект 1 1 2 1 Цифра 2
Объект 2 3 3 0 1 Цифра 8 или 5
Объект 3 4 1 0
Объект 4 4 2 0 1

Читателю предлагается самостоятельно ответить на вопрос: что будет, если увеличить пороги \varepsilon _{1}, \varepsilon _{2}, \varepsilon _{3}, \varepsilon _{4}, \delta? Как изменится качество распознавания в данной задаче?

Заключая данный раздел лекции, отметим важную мысль, высказанную А. Шамисом в работе [ 4.2 ] : качество распознавания во многом зависит от того, насколько удачно создан алфавит признаков, придуманный разработчиками системы. Поэтому признаки должны быть инвариантны к ориентации, размеру и вариациям формы объектов.

< Лекция 3 || Лекция 4: 12 || Лекция 5 >
Дмитрий Черепанов
Дмитрий Черепанов

Неоднократно находил ошибки в тестах, особенно в экзаменационных вопросах, когда правильно данный ответ на вопрос определялся в итоге как не правильно отвеченный... Из-за этого сильно страдает конечный бал! Да еще в заблуждение студентов вводит! Они-то думают, что это они виноваты!!! Но они тут не причем! Я много раз проверял ответы на некоторые такие "ошибочные" вопросы по нескольким источникам - результат везде одинаковый! Но ИНТУИТ выдавал ошибку... Как это понимать?

Из-за подобных недоразумений приходиться часами перерешивать экзамен на отличную оценку...!!!

Исправьте, пожалуйста, такие "ошибки"...

Анжелика Шлома
Анжелика Шлома

Огромная просьба сделать проще тесты, это просто ужас какой-то! Слишком сложно! 

Тимур Швецов
Тимур Швецов
Казахстан