Московский государственный университет имени М.В.Ломоносова
Опубликован: 23.04.2007 | Доступ: свободный | Студентов: 3308 / 461 | Оценка: 4.18 / 3.71 | Длительность: 17:54:00
ISBN: 978-5-9556-0098-7
Специальности: Программист
Лекция 13:

Алгоритмы сжатия изображений без потерь

< Лекция 12 || Лекция 13: 12345 || Лекция 14 >

13.6. Арифметическое кодирование

Классические статистические алгоритмы сопоставляют элементу кодируемой последовательности некий код. Алгоритмы арифметического кодирования кодируют сразу цепочку элементов в число-дробь f (0 \le f < 1) [40]. При этом учитывается распределение вероятностей появления элементов в последовательности.

Пусть a1, . . . , an - алфавит, все возможные одноэлементные цепочки; p1, . . . , pn - вероятности появления элементов (весов) ( pj = Prob(aj) ). Разобьем полуинтервал [0, 1) на n непересекающихся полуинтервалов I1, . . . , In, соответствующих элементам a1, . . . , an, причем длина Ij пропорциональна pj.

Далее строится кодирующая дробь: производится построение системы вложенных полуинтервалов так, что каждый последующий полуинтервал занимает в предыдущем место, соответствующее положению элемента в исходном разбиении полуинтервала [0, 1).

Кратко процесс выглядит так:

  • считывание очередного элемента;
  • выбор соответствующего полуинтервала из разбиения текущего полуинтервала (на первом шаге - [0, 1) ).

По окончании этого процесса можно взять любое число из получившегося полуинтервала. Обычно число выбирают так, чтобы его запись в двоичном виде была самой короткой. Также часто накладывают ограничение на длину получившейся двоичной дроби. При превышении этого ограничения текущая дробь выводится, и начинается сначала формирование новой, дополняющей предыдущую(ие).

// elem - элемент
// in - вход, out - выход
// cleft - текущая левая граница полуинтервала
// cright - текущая правая граница полуинтервала
// interv - массив границ в исходном разбиении

cleft = 0;
cright = 1;
while( in.Read( elem ) ) // пока есть данные
{
     // длина текущего полуинтервала
     d = cright - cleft;
     // вычислим границы нового полуинтервала
     cright = cleft + d*interv[elem].right;
     cleft = cleft + d*interv[elem].left;
}
// ищем дробь внутри [left, right)
frac = Between( left, right );
out.Write( frac );
Листинг 13.6. Алгоритм арифметического кодирования

Сожмем следующую последовательность "TOBEORNOTTOBE".

  • Составим таблицу весов:
    элемент алфавита B E N O R T
    вес 2 2 1 4 1 3
  • Построим разбиение полуинтервала [0, 1):

    • На входе T, тогда правая граница полуинтервала будет \frac{10}{13}, левая - 1, длина - \frac{3}{13} ;
    • На входе O, тогда правая граница полуинтервала будет \frac{145}{169}, левая - \frac{157}{169}, длина - \frac{12}{169} ;
    • На входе B, тогда правая граница полуинтервала будет \frac{1885}{2197}, левая - \frac{1909}{2197}, длина - \frac{24}{2197} ;
    • На входе E, тогда правая граница полуинтервала будет \frac{24553}{28561}, левая - \frac{24601}{28561}, длина - \frac{48}{2197} ;
    • ...
    • На входе E, тогда правая граница полуинтервала будет \frac{260680817264869}{302875106592253}, левая - \frac{260680817375461}{302875106592253}, длина - \frac{110592}{302875106592253}.
  • Двоичную дробь можно взять такую: 0.1101110001010110000001000000101, т.к. двоичная запись границ итогового полуинтервала следующая: левая - 0.1101110001010110000001000000100111010011000101101, правая - 0.1101110001010110000001000000101101100100100100001.

Закодированная последовательность имеет длину 31 бит. Исходная, если считать алфавитом набор ASCII - 104 бита, если считать алфавитом только набор "TOBERN" - 39 бит.

Декодирование заключается в расшифровке дроби по известному распределению вероятностей появления элементов в последовательности. Следовательно, требуется хранить или передавать информацию о распределении вероятностей появления элементов. Для того чтобы обойти это требование, а также для того чтобы избавиться от необходимости совершать два прохода по последовательности, были предложены адаптивные модификации алгоритма.

// elem - элемент, in - вход, out - выход
// interv - массив границ в исходном разбиении
// frac - кодирующая дробь
// cleft - текущая левая граница полуинтервала
// cright - текущая правая граница полуинтервала
// nelem - количество элементов, закодированное дробью

i = nelem;
in.Read( frac );
while( i > 0 ) // пока надо декодировать
{
     // ищем элемент по дроби и разбиению полуинтервала
     elem = GetElem( interv, frac );
     out.Write( elem );
     // вычислим границы полуинтервала
     cright = interv[elem].right;
     cleft = interv[elem].left;
     // длина полуинтервала
     d = cright - cleft;
     // преобразуем дробь
     x = (x - cleft) / d;
     // отметим обработку очередного элемента
     i--;
}
Листинг 13.7. Алгоритм арифметического декодирования

Опишем идею адаптивной модификации. Изначально предполагается, что появление всех элементов равновероятно. По мере поступления новых элементов веса и разбиение полуинтервала корректируются. При декодировании также осуществляется коррекция после обработки очередного элемента.

Арифметическое кодирование является почти оптимальным видом кодирования, т.е. дает коды, почти равные длинам оптимальных кодов из теоремы Шеннона. Однако такая эффективность достигается за счет больших вычислительных затрат. Существуют модификации алгоритма, использующие только операции сдвига и сложения без деления и умножения для ускорения процесса кодирования. К сожалению, практически все такие модификации защищены патентами. Часть этих патентов уже имеют истекший срок действия, другая часть - нет. Таким образом, по мере истечения сроков патентов эффективные реализации модификаций алгоритма арифметического кодирования будут вытеснять алгоритм Хаффмена в сферах, где производительность не является критичным требованием.

< Лекция 12 || Лекция 13: 12345 || Лекция 14 >