Опубликован: 13.08.2008 | Уровень: специалист | Доступ: свободно
Лекция 3:

Передача речи по IP-сети

< Лекция 2 || Лекция 3: 123 || Лекция 4 >

3.7. Требования к алгоритмам кодирования сигнала

  1. Использование полосы пропускания канала.

    Скорость передачи, которую предусматривают имеющиеся сегодня узкополосные кодеки, лежит в пределах 1.2-64 кбит/с. Естественно, что от этого параметра прямо зависит качество воспроизводимой речи. Существует множество подходов к проблеме определения качества. Так, например, для прослушивания экспертам предъявляются разные звуковые фрагменты - речь, музыка, речь на фоне различного шума и т. д. Искажения оценивают путем опроса разных групп людей по пятибалльной шкале единицами субъективной оценки MOS (Mean Opinion Score). Оценки интерпретируют следующим образом:

    • 4-5 - высокое качество; аналогично качеству передачи речи в ISDN, или еще выше;
    • 3,5-4 - качество ТфОП (toll quality); аналогично качеству речи, передаваемой с помощью кодека АДИКМ при скорости 32 кбит/с. Такое качество обычно обеспечивается в большинстве телефонных разговоров. Мобильные сети обеспечивают качество чуть ниже toll quality;
    • 3-3,5 - качество речи по-прежнему удовлетворительно, однако его ухудшение явно заметно на слух;
    • 2,5-3 - речь разборчива, однако требует концентрации внимания для понимания. Такое качество обычно обеспечивается в системах связи специального применения (например, в вооруженных силах).

    В рамках существующих технологий качество ТфОП (toll quality) невозможно обеспечить при скоростях менее 5 кбит/с.

  2. Подавление периодов молчания.

    При диалоге один его участник говорит в среднем только 35 процентов времени. Таким образом, если применить алгоритмы, которые позволяют уменьшить объем информации, передаваемой в периоды молчания, то можно значительно сузить необходимую полосу пропускания. В двустороннем разговоре такие меры позволяют достичь сокращения объема передаваемой информации до 50 %, а в децентрализованных многоадресных конференциях (за счет большего количества говорящих) - и более. Нет никакого смысла организовывать многоадресные конференции с числом участников больше 5-6, не подавляя периоды молчания.

  3. Генератор комфортного шума (Comfort Noise Generator - CNG) служит для генерации фонового шума. В момент, когда в речи активного участника беседы начинается период молчания, терминалы слушающих могут просто отключить воспроизведение звука. Однако это было бы неразумно. Если в трубке возникает "гробовая тишина", т. е. фоновый шум (шум улицы и т. д.), который был слышен во время разговора, внезапно исчезает, то слушающему кажется, что соединение по каким-то причинам нарушилось, и он обычно начинает спрашивать, слышит ли его собеседник.

    Генератор CNG позволяет избежать таких неприятных эффектов.

  4. Размер кадра.

    Большинство узкополосных кодеков обрабатывает речевую информацию блоками, называемыми кадрами ( frames ), и им необходимо производить предварительный анализ отсчетов, следующих непосредственно за отсчетами в блоке, который они в данный момент кодируют.

    Размер кадра важен, так как минимальная теоретически достижимая задержка передачи информации (алгоритмическая задержка) определяется суммой этого параметра и длины буфера предварительного анализа.

    С другой стороны, кодеки с большей длиной кадра более эффективны, так как здесь действует общий принцип: чем дольше наблюдается явление (речевой сигнал), тем лучше оно отображается на объеме дополнительной служебной информации, которая добавляется к кадру.

  5. Чувствительность к потерям кадров

    Потери пакетов являются неотъемлемым атрибутом IP-сетей. Но потери пакетов и потери кадров не обязательно напрямую связаны между собой, так как существуют подходы, например, применение кодов с исправлением ошибок ("forward error correction"), позволяющие уменьшить число потерянных кадров при заданном числе потерянных пакетов. Необходимая для этого дополнительная служебная информация распределяется между несколькими пакетами, так что при потере некоторого числа пакетов кадры могут быть восстановлены.

    Кодеры типа G.723.1 разработаны так, что они функционируют без существенного ухудшения качества в условиях некоррелированных потерь до 3 % кадров, однако при превышении этого порога качество ухудшается катастрофически.

3.8. Кодеки IP-телефонии

Наибольшее распространение получили кодеки следующих типов.

Кодек G.711 - один из первых цифровых кодеков речевых сигналов, который является минимально необходимым. Это означает, что любое устройство VoIP должно поддерживать этот тип кодирования.

Рекомендация G.723.1 утверждена ITU-T в ноябре 1995 г. Кодек G.723.1 является базовым для приложений IP-телефонии.

Кодек G.723.1 предусматривает две скорости передачи: 6.3 кбит/с и 5.3 кбит/с. Режим работы может меняться динамически от кадра к кадру.

Для этих кодеков оценка MOS (Mean Opinion Score) составляет 3,9 в режиме 6.3 кбит/с и 3,7 в режиме 5.3 кбит/с.

Кодек G.726 обеспечивает кодирование цифрового потока со скоростью 40, 32, 24 или 16 кбит/с, гарантируя оценки MOS на уровне 4,3 (32 кбит/с), что принимается за эталон уровня качества телефонной связи (toll quality). Однако в приложениях IP-телефонии этот кодек практически не используется, так как он не обеспечивает достаточной устойчивости к потерям информации (см. выше).

Кодек G.728 специально разрабатывался для оборудования уплотнения телефонных каналов, при этом было необходимо обеспечить возможно малую величину задержки (менее 5 мс), чтобы исключить необходимость применения эхокомпенсаторов.

Кодек G.729 очень популярен в приложениях передачи речи по сетям Frame Relay. Кодек использует кадр длительностью 10 мс и обеспечивает скорость передачи 8 кбит/с. Однако для кодера необходим предварительный анализ сигнала продолжительностью 5 мс.

Существуют две разновидности кодека:

  • G.729;
  • Упрощенный вариант G.729A.
Таблица 3.1. Основные характеристики кодеков
Кодек Метод компрессии Скорость кодирования Сложность реализации Качество Задержка
G.726 ADPCM 32/24/16 кбит/с Низкая (8 MIPS) Хорошее (32 К), плохое (16 К) Очень низкая (0,125 мс)
G.729 CS-ACELP 8 кбит/с Высокая (30 MIPS) Хорошее Низкая (10 мс)
G.729A CA-ACELP 8 кбит/с Умеренная (20 MIPS) Среднее Низкая (10 мс)
G.723.1 MP-MLQ 6.4/5.3 кбит/с Умеренная (16 MIPS) Хорошее (6,4), среднее (5,3) Высокая (37 мс)
G.728 LD-CELP 16 кбит/с Очень высокая (40 MIPS) Хорошее Очень низкая (3-5 мс)

Количественными характеристиками ухудшения качества речи являются единицы QDU (Quantization Distortion Units): 1 QDU соответствует ухудшению качества при оцифровке с использованием стандартной процедуры ИКМ; значения QDU для основных методов компрессии приведены в таблице 3.2.

Таблица 3.2. Единицы ухудшения качества речи QDU для различных методов компрессии
Метод компрессии QDU
ADPCM 32 кбит/с 3,5
ADPCM 24 кбит/с 7
LD-CELP 16 кбит/с 3,5
CS-CELP 8 кбит/с 3,5

Дополнительная обработка речи всегда ведет к дальнейшей потере качества. Согласно рекомендациям МСЭ-Т, для международных вызовов величина QDU не должна превышать 14, причем передача разговора по международным магистральным каналам ухудшает качество речи, как правило, на 4 QDU. При передаче разговора по национальным сетям должно теряться не более 5 QDU. Поэтому для качественной передачи речи процедуру компрессии/декомпрессии желательно применять в сети только один раз. В некоторых странах это является обязательным требованием регулирующих органов по отношению к корпоративным сетям, подключенным к сетям общего пользования.

Современная аппаратура IP-телефонии применяет разные кодеки, как стандартные, так и нестандартные. Конкурентами являются кодеки GSM (13,5 кбит/с) и кодеки МСЭ-Т серии G, использование которых предусматривается стандартом H.323 для связи по IP-сети.

3.9. Оценка качества воспринимаемой информации

Значения MOS для различных стандартов кодеров приведены в таблице 3.3.

Таблица 3.3. Средние субъективные оценки качества различных методов кодирования
Кодек Скорость передачи, кбит/с MOS Размер кадра, мс
G.711 РСМ 64 4,3 0,125
G.726 Multi-rate ADPCM 16-40 2-4,3 0,125
G.723 MP-MLQ ACELP 5.3; 6.3 3,7; 3,8 30
G.728 LD-CELP 16 4,1 0,625
G.729 CS-ACELP 8 4,0 10
G.729A CA-ACELP 8 3,4 10
GSM RPE-LPC 13 3,9 30

В каналах Интернета важными для IP-телефонии параметрами являются следующие:

  • действительная пропускная способность, определяемая наиболее "узким местом" в виртуальном канале в данный момент времени;
  • трафик, также являющийся функцией времени;
  • временная задержка пакетов, которая определяется трафиком, числом маршрутизаторов, реальными физическими свойствами каналов передачи, образующими в данный момент времени виртуальный канал, задержками на обработку сигналов, возникающими в речевых кодеках и других устройствах шлюзов;
  • потеря пакетов, обусловленная наличием "узких мест", очередями;
  • перестановка пакетов, пришедших разными путями.
< Лекция 2 || Лекция 3: 123 || Лекция 4 >
Нияз Сабиров
Нияз Сабиров
Стоимость "обучения"
Елена Сапегова
Елена Сапегова
диплом
Анатолий Федоров
Анатолий Федоров
Россия, Москва, Московский государственный университет им. М. В. Ломоносова, 1989
Александр Мельников
Александр Мельников
Россия