| Россия |
Классификация на основе сравнения с эталоном
8.3. Задача сравнения речевых команд
В обработке речи можно выделить следующие основные направления:
- Распознавание отдельных слов (IWR – Isolated Word Recognition),
- Распознавание слитной речи (CSR – Continuous Speech Recognition).
- CDR – Speaker Dependent Recognition,
- SIR – Speaker Independent Recognition.
Ядром IWR-систем является совокупность эталонов и мера. Отрезок
сигнала (см. рис.)
разбивается на сегменты, т.е. сигнал квантуется
(с перекрытием). С каждым сегментом связывается вектор коэффициентов
Фурье.
Обработка звука происходит в два этапа.
Первый этап. Строим цепочку
,
– разговорные сегменты. Далее
строим преобразование Фурье с разбиением на
отрезков. Обозначим
через
,
– отчеты для
-ого сегмента,
. Тогда

Рассмотрим первые
(пусть
),
коэффициентов Фурье в качестве вектора признаков:
![\def\I{\mathop{I}}
r(i)=
\left[
\begin{gathered}
X_i(0) \\
X_i(1) \\
\vdots \\
X_i(l-1)
\end{gathered}
\right],
\;l=1,\ldots,\I\limits^{.}](/sites/default/files/tex_cache/6eb3f4ff5737a5e583ada624365c326d.png)
Второй этап. Определяем ограничения в графе соответствия сегментов эталонной и тестируемой команд.
Глобальные ограничения – ограничения поля для оптимального
маршрута, например,
(рис. слева).
Локальные ограничения – монотонность на сети маршрутов (рис. справа).
Ограничения конечной точки.
Стоимость
– Евклидово расстояние между
:

Таким образом, и эта задача также сводится к поиску кратчайшего пути на графе.
8.4. Динамическое программирование
Задача поиска кратчайшего пути на графе может быть решена
методом динамического программирования. Пусть
– начальный узел
(отправной город),
– конечный узел (город – пункт назначения). Тогда
задача состоит в поиске оптимального маршрута через промежуточные узлы
(города):

Пусть
– промежуточный узел. Тогда по принципу оптимальности
Беллмана имеем

.


