Московский государственный университет путей сообщения
Опубликован: 12.09.2011 | Доступ: свободный | Студентов: 3884 / 394 | Оценка: 4.67 / 4.33 | Длительность: 18:55:00
Специальности: Программист
Лекция 1:

Модель нейронной сети

Лекция 1: 1234 || Лекция 2 >

Ввод и "разглядывание" эталонов и образов

Устройства ввода информации — эталонов, исходных ситуаций — имеют определяющее значение для нейросети. С их помощью формируются и поддерживаются возбуждения входного слоя . Сегодня успешно решается проблема видео-ввода. Однако ввести в компьютер "картинку" — это лишь часть дела. Картинку надо обработать — в целом и по частям, чтобы по максимуму интересующей информации получить полные и достоверные выводы – сформировать реакцию. Здесь мы ищем аналоги нашего восприятия действительности.

Мы совершаем обзор представляемой нам картины тремя способами:

  • сканированием сектора обзора, разбитого на элементарные сегменты (рис. 1.6);
  • спонтанным обзором, обусловленным привлечением внимания к цветовому или скоростному всплеску, быстрым увеличением размера (угрожающим приближением) объекта, указанием извне (целеуказанием) и т.д. (рис. 1.7);
  • сканированием сектора обзора с выделением зон особого внимания (рис. 1.8).

При первом и третьем способах анализ сложнее, т.к. требует согласования всего виденного по сегментам. Это, в свою очередь, требует включения высших уровней логического вывода (интеллекта).

Второй способ также требует сканирования сектора обзора, однако со значительно меньшими энергетическими затратами. При этом способе можно добиться избирательности, чрезвычайности реакции, например, на резкие движения, на бег, появление яркой расцветки в одежде и т.д. Это может с успехом использоваться в развлекательных, игровых системах.

Все способы реализуются легче, если речь идет о единственном объекте единовременного распознавания, например, буквы, хозяина квартиры, подписи и т.д. Ибо любая сцена, например, туристская группа, пришедшая полюбоваться "умным" монстром, требует не только детального, но и совместного анализа этим монстром всех (многих) ее составляющих.

Сканирование по строкам

Рис. 1.6. Сканирование по строкам
Реакция на внезапность

Рис. 1.7. Реакция на внезапность
Поиск зон особого внимания

Рис. 1.8. Поиск зон особого внимания

Говоря о туристах, можно говорить о конечной, усредненной реакции на всю группу. Ведя обзор, сеть постепенно, по критериям обучения "это хорошо — это плохо", воспринимая "настроение" как последовательное добавление элементов радости и огорчения, приходит к некоторому окончательному состоянию, обусловленному тем, сколько того и другого она увидела. Тогда для разных групп туристов или экскурсантов это состояние будет разным. Это может стать источником веселья и шутливого "поощрения" той группы, которая привела объект в радость, и "осуждение" группы, ввергнувшей его в печаль.

Итак, в каждом такте обзора, формируется сегмент, содержимое которого необходимо распознать. Чаще всего целесообразно допущение о том, что в элементарном сегменте при дискретном сканировании находится не более чем один значимый объект. Пусть это — максимальная область текста, вмещающая единственную букву, написанную с допустимой долей небрежности. Как помочь себе же разглядеть эту букву? По-видимому, следует пытаться разместить эту букву на входном слое так, чтобы она максимально соответствовала тому размещению эталонов, с помощью которых производилось обучение. Тогда распознавание заработает правильно (рис.1.9). Такой процесс "разглядывания" может предполагать:

  • поиск возможности совмещения условного центра элемента изображения и центра экрана — входного (рецепторного) слоя сети (фокусировка);
  • поиск варианта масштабирования элемента изображения (приближение — удаление);
  • поиск угла наклона и др.

В результате таких пробных действий может вдруг "запуститься" процесс распознавания, хотя, возможно, и ошибочного. Что ж, в жизни бывает и так.

Напомним, что работа нейросети тактируется. Тогда развитие сценария в увлекательной многофункциональной детской игре с обучаемым компьютерным человечком КОМПИ может быть таким, как представлено на рис.1.10.

Однако следует отметить, что обработка изображений, особенно – для распознавания, представляет сложную проблему компьютерного зрения, которой посвящено много исследований. Отметим здесь лишь монографию [11].

Поиск условия узнавания

увеличить изображение
Рис. 1.9. Поиск условия узнавания
Реакция на распознавание в реальном времени

увеличить изображение
Рис. 1.10. Реакция на распознавание в реальном времени
Лекция 1: 1234 || Лекция 2 >
Кирилл Артамонов
Кирилл Артамонов

"Тогда как задать возбуждение рецепторов, если инспектор точно установил, что скорость автомобиля при наезде на пешехода была равна 114 км/час?
По-видимому, он рассуждает на основе близости скорости к границам указанного интервала: "Достоверность того, что скорость автомобиля составляет 100 км/час, я найду как (114 – 100):(120 – 100), а достоверность того, что скорость автомобиля составляет 120 км/час, я найду как (120 – 114):(120 – 100). Следует обратить внимание на то, что сумма найденных достоверностей равна единице."

Вопрос по расчёту скорости и сумме достоверности: этот математический (приведенный выше в виде контекста из материала лекции 1, страницы 3) метод справедлив к скоростным показателям выходящим за рамки диапазона 100-120. 
То есть, практически применяв к расчёту, скорости из диапазона 114-155, к диапазону 100-120, получал в результате суммирования достоверностей единицу.
Это похоже на то, как я видимые разные скоростные показатели своим рецептором, буду воспринимать линейно с помощью одного диапазона, так как он универсален. 
Правильно ли это ? 
И как манипулировать данными показателями, если есть универсальный диапазон, по результату выводящий в сумме постоянно единицу на разных скоростных показателях стремящегося.

Владислав Гладышев
Владислав Гладышев

А как проходить курс ? я же могу прямо сейчас все лекции прочитать и здать экзамен, к чему там даты ?