НОУ ИНТУИТ | Интеллектуальные робототехнические системы. Лекция 4: Распознавание изображений

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Твой путь к знаниям!

Опубликован: 18.05.2005 | Уровень: специалист | Доступ: свободно | ВУЗ: Московский государственный технологический университет «Станкин»

Вам нравится? Нравится 48 студентам

| Поделиться |

Поддержать программу

Аннотация: В лекции рассматриваются характеристики задач распознавания образов и их типы, основы теории анализа и распознавания изображений (признаковый метод), распознавание по методу аналогий. Среди множества интересных задач по распознаванию рассмотрены принципы и подход к распознаванию в задачах машинного чтения печатных и рукописных текстов.

Современные роботы, снабженные телевизионными камерами, способны достаточно хорошо видеть, чтобы работать с реальным миром. Они могут делать заключения о том, какого типа объекты присутствуют, в каких они находятся отношениях между собой, какие группы образуют, какой текст содержат и т. д. Однако сложные задачи распознавания, например, распознавание похожих трехмерных быстродвижущихся объектов или неразборчивого рукописного текста требуют совершенствования методов и средств для своего решения. В этой лекции мы рассмотрим основы некоторых традиционных методов распознавания. Наше рассмотрение мы начнем с наиболее часто применяемого признакового метода распознавания [ 1.4 ] , [ 4.1 ] .

Общая характеристика задач распознавания образов и их типы.

Под образом понимается структурированное описание изучаемого объекта или явления, представленное вектором признаков, каждый элемент которого представляет числовое значение одного из признаков, характеризующих соответствующий объект. Общая структура системы распознавания и этапы в процессе ее разработки показаны на рис. 4.1.

Рис. 4.1. Структура системы распознавания

Суть задачи распознавания - установить, обладают ли изучаемые объекты фиксированным конечным набором признаков, позволяющим отнести их к определенному классу.

Задачи распознавания имеют следующие характерные черты.

Это информационные задачи, состоящие из двух этапов: а) приведение исходных данных к виду, удобному для распознавания ; б) собственно распознавание (указание принадлежности объекта определенному классу).
В этих задачах можно вводить понятие аналогии или подобия объектов и формулировать понятие близости объектов в качестве основания для зачисления объектов в один и тот же класс или разные классы.
В этих задачах можно оперировать набором прецедентов-примеров, классификация которых известна и которые в виде формализованных описаний могут быть предъявлены алгоритму распознавания для настройки на задачу в процессе обучения.
Для этих задач трудно строить формальные теории и применять классические математические методы (часто недоступна информация для точной математической модели или выигрыш от использования модели и математических методов не соизмерим с затратами).
В этих задачах возможна "плохая" информация (информация с пропусками, разнородная, косвенная, нечеткая, неоднозначная, вероятностная).

Целесообразно выделить следующие типы задач распознавания.

Задача распознавания - отнесение предъявленного объекта по его описанию к одному из заданных классов (обучение с учителем).
Задача автоматической классификации - разбиение множества объектов (ситуаций) по их описаниям на систему непересекающихся классов (таксономия, кластерный анализ, обучение без учителя).
Задача выбора информативного набора признаков при распознавании.
Задача приведения исходных данных к виду, удобному для распознавания.
Динамическое распознавание и динамическая классификация - задачи 1 и 2 для динамических объектов.
Задача прогнозирования - это задачи 5, в которых решение должно относиться к некоторому моменту в будущем.

Основы теории анализа и распознавания изображений.

Пусть дано множество M объектов ; на этом множестве существует разбиение на конечное число подмножеств (классов) $\Omega,$ i = {1,m}, $M = \cup \Omega _{i} (i = 1..m).$ Объекты $\omega$ задаются значениями некоторых признаков x_j, j= {1,N}. Описание объекта $I(\omega )=(x_{1}(\omega ), \dots , x_{N}(\omega ))$ называют стандартным, если $x_{j}(\omega )$ принимает значение из множества допустимых значений.

Пусть задана таблица обучения ( таблица 4.1). Задача распознавания состоит в том, чтобы для заданного объекта $\omega$ и набора классов $\Omega _{1}$ , ..., $\Omega _{m}$ по обучающей информации в таблице обучения $I_{0}(\Omega _{1}\dots \Omega _{m})$ о классах и описанию $I(\omega )$ вычислить предикаты:

$P_{i}(\omega \in \Omega _{i})=\{ 1(\omega \in \Omega _{i}), 0(\omega \in \Omega _{i}), (\omega \in \Omega _{i})\} ,$

где i= {1,m}, $\Delta$ - неизвестно.

Таблица 4.1. Таблица обучения
Объект	Признаки и их значения			Класс
Объект	x₁	x_j	x_n	Класс
$_{\omega 1}$	$\alpha _{11}$	$\alpha _{1j}$	$\alpha _{1n}$	$\Omega _{1}$
...
$\omega _{r_1}$	_r11	$\alpha _{r_1j}$	$\alpha _{r_1n}$
...
$\omega _{r_k}$	$\alpha _{r_k 1}$	$\alpha _{r_k j}$	$\alpha _{r_k n}$	$\Omega _{m}$
...
$\omega _{r_m}$	$\alpha _{r_m 1}$	$\alpha _{r_m j}$	$\alpha _{r_m n}$

Рассмотрим алгоритмы распознавания, основанные на вычислении оценок. В их основе лежит принцип прецедентности (в аналогичных ситуациях следует действовать аналогично).

Пусть задан полный набор признаков x₁, ..., x_N. Выделим систему подмножеств множества признаков S₁, ..., S_k. Удалим произвольный набор признаков из строк $\omega _{1}$ , $\omega _{2}$ , ..., $\omega _{rm}$ и обозначим полученные строки через $S\omega _{1}$ , $S\omega _{2}$ , ..., $S\omega _{rm}$ , $S\omega '$ .

Правило близости, позволяющее оценить похожесть строк $S\omega '$ и $S\omega _{r}$ состоит в следующем. Пусть "усеченные" строки содержат q первых символов, то есть $S\omega _{r}=(a_{1}, \dots , a_{q})$ и $S\omega '=(b_{1}, \dots , b_{q}).$ Заданы пороги $\varepsilon _{1}$ ... $\varepsilon _{q}$ , $\delta.$ Строки $S\omega _{r}$ и $S\omega '$ считаются похожими, если выполняется не менее чем $\delta$ неравенств вида

$|a_{j}-b_{j}| \le \varepsilon _{j}, j=1,2,\dots , q.$

Величины $\varepsilon _{1}$ ... $\varepsilon _{q}$ , $\delta$ входят в качестве параметров в модель класса алгоритмов на основе оценок.

Пусть $Г_{i}(\omega ')$ - оценка объекта $\omega '$ по классу $\Omega _{i}$ .

Описания объектов $\{ \omega '\}$ , предъявленные для распознавания, переводятся в числовую матрицу оценок. Решение о том, к какому классу отнести объект, выносится на основе вычисления степени сходства распознавания объекта (строки) со строками, принадлежность которых к заданным классам известна.

Проиллюстрируем описанный алгоритм распознавания на примере. Задано 10 классов объектов (рис. 4.2а). Требуется определить признаки таблицы обучения, пороги и построить оценки близости для классов объектов, показанных на рис. 4.2б. Предлагаются следующие признаки таблицы обучения:

x₁ - количество вертикальных линий минимального размера;

x₂ - количество горизонтальных линий;

x₃ - количество наклонных линий;

x₄ - количество горизонтальных линий снизу объекта.

Рис. 4.2. Пример задачи по распознаванию

На рис. 4.3 приведена таблица обучения и пороги

$\varepsilon _{1}=1, \varepsilon _{2}=1, \varepsilon _{3}=1, \varepsilon _{4}=1, \delta =1.$

Из этой таблицы видно, что неразличимость символов 6 и 9 привела к необходимости ввода еще одного признака x₄.

Рис. 4.3. Таблица обучения для задачи по распознаванию

Теперь может быть построена таблица распознавания для объектов на рис. 4.2б.

Объект	x₁	x₂	x₃	x₄	Результат распознавания
Объект 1	1	2	1		Цифра 2
Объект 2	3	3	0	1	Цифра 8 или 5
Объект 3	4	1	0
Объект 4	4	2	0	1

Читателю предлагается самостоятельно ответить на вопрос: что будет, если увеличить пороги $\varepsilon _{1}$ , $\varepsilon _{2}$ , $\varepsilon _{3}$ , $\varepsilon _{4}$ , $\delta?$ Как изменится качество распознавания в данной задаче?

Заключая данный раздел лекции, отметим важную мысль, высказанную А. Шамисом в работе [ 4.2 ] : качество распознавания во многом зависит от того, насколько удачно создан алфавит признаков, придуманный разработчиками системы. Поэтому признаки должны быть инвариантны к ориентации, размеру и вариациям формы объектов.

Дальше >>

Интеллектуальные робототехнические системы

Распознавание изображений

Общая характеристика задач распознавания образов и их типы.

Основы теории анализа и распознавания изображений.

Вопросы и ответы

Студенты

Авторизоваться

Интеллектуальные робототехнические системы

Распознавание изображений

Общая характеристика задач распознавания образов и их типы.

Основы теории анализа и распознавания изображений.

Вопросы и ответы

Студенты