Стандарты дискретизации видеосигналов

В большинстве форматов цифрового видео используется компонентная палитра. Весьма популярен стандарт 4:2:2 (YUV2). Речь идет о раздельной оцифровке значений Y, U и V-каналов. Для цифрового кодирования в качестве базовой принята частота 3,375 МГц. Это значение кратно частотам основных стандартов телевизионных изображений: 625/60 и 525/50. Частота дискретизации для конкретного канала вычисляется как произведение базовой частоты на соответствующий коэффициент: 4 для канала Y и 2 для цветоразностных каналов. Таким образом, частота оцифровки яркостного сигнала равна 13,5 МГц. Эта частота соответствует рекомендациям международного стандарта ITU (бывшего CCIR) 601. Схема дискретизации при данной частоте приведена на рис. 3.4.

Видео на вашем компьютере: ТВ тюнеры, захват кадра, видеомонтаж, DVD _17.jpg

Рис. 3.4. Дискретизация по стандарту 4:2:2 (YUV2)

Отсюда следует, что каждый пиксел строки имеет собственное значение яркости, но значения каждого из цветоразностных компонентов одинаковы для пары соседних пикселов. При 576 активных строках на кадр с сохранением стандартного для телевидения соотношения ширины изображения к высоте 4:3 получаем 720 активных элементов в строке для сигнала яркости и 360 – для цветоразностных сигналов. (Нарушение соотношения 4:3 приводит к искажению изображения, так что квадратные элементы становятся прямоугольными.) Это исходный, наиболее универсальный формат, такие кадры как раз и поступают на вход систем компрессии. Яркостный сигнал кодируется восемью битами, оба цветоразностных – по 8 бит на пару точек. В результате для описания каждой точки используется 16 бит, однако определяемое таким способом кодирования цветовое пространство соответствует 24-битной палитре – 16 миллионов цветов, где каждая отдельная точка может занимать любое положение в пределах цветового охвата данной палитры. Поэтому при перекодировании из YUV 4:2:2 в 16-битный RGB происходят необратимые потери информации.

...

Если в процессе захвата или обработки изображения производится перекодирование из одной палитры в другую, для предсказания возможных потерь недостаточно формальной информации о числе бит на точку. Необходимо знать способ кодирования. По возможности старайтесь избегать многократного перекодирования, поскольку вероятность потерь и искажений информации при этом возрастает.

Для цифрового представления существенна величина потока информации (скорости передачи данных, необходимой для записи информации без потерь). Она является произведением глубины квантования на частоту дискретизации. То есть для стандарта 4:2:2 при уровне квантования 10 бит (распространенном для современной техники) имеем:

Чy х Гу + Чu х Гu + Чv х Гv = 10 бит х (13,5 МГц + 6,75 МГц + 6,75 МГц) = 270 Мбит/с или 33,75 Мбайт/с (где Ч – частота, Г – глубина оцифровки).

Поток достаточно большой, но только при таких характеристиках сохраняется студийное качество изображения.

Встречаются и другие значения частоты дискретизации: для передачи данных непосредственно в RGB-палитре (в измерительной технике или особо точной записывающей аппаратуре) 4:4:4. Этот способ кодирования совсем не искажает изображение, но применяется довольно редко в связи с резким увеличением потока информации. При кодировании дополнительных данных (например, альфа-канала, задающего прозрачные области) встречается представление 4:4:4:4. Это дает поток 540 Мбит/с.

Гораздо чаще встречаются стандарты дискретизации с уменьшенным пространственным разрешением для цветоразностных сигналов: 4:1:1 (BTYUV) и 4:2:0 (YUV12). Оба способа кодирования ухудшают качества кадра и обычно применяются вместе с достаточно высоким уровнем компрессии в форматах, когда компактность оказывается важнее качества.

В первом случае имеем дискретизацию яркостного сигнала с частотой 13,5 МГц, а цветоразностных сигналов – 3,375 Мгц, то есть цветоразностные компоненты общие уже не для двух, а для четырех пикселов.

Стандарт 4:2:0 (рис. 3.5) имеет тот же суммарный поток информации, но для цветоразностных сигналов в два раза снижено разрешение как по горизонтали (360 отсчетов в строке), так и по горизонтали (288 строк). В этом случае имеем не пары, а квадраты точек, для которых приравниваются значения цветоразностных сигналов: две точки в данной строке и две точки в соседней. Ноль в записи, естественно, некоторая условность, вторая цветоразностная компонента никуда не исчезает. Стандарт 4:2:0 используется в бытовых форматах DV.

Видео на вашем компьютере: ТВ тюнеры, захват кадра, видеомонтаж, DVD _18.jpg
Рис. 3.5. Кодирование по стандарту 4:2:0

Еще сильнее уменьшает поток информации (и качество изображения) формат CIF, при котором для яркостной компоненты оцифровывается половина строк (288), горизонтальное разрешение составляет 352 элемента, а разрешение цветоразностных компонент по обоим направлениям в два раз ниже. Такое кодирование используется там, где необходимо очень сильно уменьшить поток данных, например при передаче изображения по телефонным сетям.

Если изображение необходимо копировать без потери качества, надо применять дискретизацию не ниже 4:2:2. Даже если запись производилась с худшими характеристиками, копирование по мере возможности стоит производить на технике именно такого класса.

Для форматов, использующих композитный сигнал, применяется частота дискретизации, совпадающая с частотой четвертой гармоники цветовой несущей: 17,73 МГц для PAL и 14,32 МГц для NTSC.

Сжатие

Существует два принципиально различных варианта сжатия данных: с потерей и без потери информации. Первый вариант используется, например, при архивации данных и основан на том, что информацию можно записывать более или менее «экономным» способом, подобно тому как один и тот же текст можно просто записать, а можно застенографировать. Во втором случае запись, конечно, будет гораздо компактнее. При этом информация не теряется: при расшифровке стенограммы мы получим исходный текст.

Способов сжатия без потерь немного. Один из них основан на частотном анализе компрессируемых данных. В файле различные значения байтов встречаются, естественно, с неодинаковой частотой. Можно перекодировать «текст», поставив в соответствие часто встречающимся значениям байтов более короткие битовые последовательности, а редким значениям – более длинные коды. Для файлов, где существует значительная разница в частоте значений байтов, такой механизм сжатия довольно эффективен. В усовершенствованном варианте, называемом «арифметическим кодированием», анализируется не только частота отдельных значений, но и вероятность их появления в определенном «контексте» (в зависимости от соседних значений).

В другом случае принцип кодирования близок к уже упоминавшейся стенографии: определенные последовательности значений заменяются кодами, из который составляется «словарь». При этом, если в процессе кодирования встречается комбинация значений, являющаяся расширенным вариантом уже зарегистрированной последовательности, она добавляется в словарь. Объем словаря, разумеется, ограничен. Подобным образом создаются, например, специальные компрессированные TIFF-файлы.

Степень сжатия сильно зависит от типа и длины файла. В любом случае к данным добавляется информация, необходимая для декомпрессии (восстановления исходных данных). Поэтому, если данные в файле плохо сжимаются при использовании избранного алгоритма, размер файла может даже возрасти.

Даже в удачном случае уровень компрессии без потери информации обычно не очень высок. Сжатие в два раза – уже победа. Поэтому обычно для видео используют сжатие с потерей качества, отбрасывая информацию, якобы неразличимую глазом. Естественно, чем выше уровень такого сжатия, тем больше искажения. Из «неподвижных» графических компьютерных форматов такое сжатие применяется, например, в формате JPEG. В компьютерном видеоформате AVI (Audio Video Interleave – чередование аудио и видео) используется Motion JPEG.