Mpeg 1 недостатки и преимущества кратко

Обновлено: 02.07.2024

С появления первых компьютеров, а с ними и цифровых устройств хранения данных, начался постепенный переход с аналоговой на полностью цифровую технику. С ней мы получили ряд неоспоримых преимуществ (удобство копирования и обработки) и одну большую проблему хранения цифровых данных. Как избежать потери качества при обработке видео, мы рассказываем в нашей статье.

Сколько весит видео

Видеоизображение стандарта PAL или SECAM – это последовательность картинок, отображаемая с частотой 25 кадров в секунду. В одном цифровом кадре содержится 720х576 точек, то есть 414 тыс. 720 элементов (пикселей). Каждая точка может иметь один из 16,7 млн. цветов и занимать 3 байта в компьютере. Следовательно, один кадр занимает порядка 1,2 Мб. При стандартной частоте получаем цифру около 30 Мб в секунду, то есть хранение одного лишь часа видео (вместе со звуком) без компрессии обойдётся в 107 Гб. Выглядит устрашающе, но уже сейчас допустимо.

Но ведь прогресс видео не стоит на месте. Максимально возможное качество сейчас достигается в HDTV (ТВ высокой чёткости), этот формат подразумевает разрешение 1920х1080 точек, то есть, при прочих равных условиях, серия кадров, рассчитанных на одну секунду, уже займет 148 Мб (521 Гб в час).

Как происходит сжатие


Для сжатия видео используют различные кодеки

Самые популярные кодеки

Сегодня самые распространенные кодеки – это семейство MPEG. Основу ему положило сжатие фотографий. Все мы знакомы с компактными картинками с расширением JPG, а многие даже смогут отличить сильно сжатую картинку (с кубической структурой) от качественной (на глаз, сравнимой с оригиналом). Анатомические особенности глаза человека позволяют, незаметно сжимать картинку в десять раз, используя кодер JPEG.

Максимальное качество

На приведенных примерах можно видеть, какие артефакты, так называемые кубики, возникают на фотографии сжатой неправильно (с большим коэффициентом сжатия) и их отсутствие на фото с правильным сжатием. Подобные потери качества при большом сжатии большинством кодеков, в том числе и JPEG, необратимы.


Получить файлы MPEG-1 можно с помощью программы AVI2MPG. Для увеличения нажмите здесь.

Формат использует простую обработку кодированного аналогового видеосигнала по стандарту JPG (с разрешением 768х576 точек). Расшифровывается как Motion-JPEG (движущийся JPEG). На сегодняшний день этот формат практически не используется, т.к. качественно сжатые ролики занимают достаточно много места. В некоторых моделях устройств (например, фотокамерах с функцией видео) встречается упрощенный вариант M-JPEG с разрешением 320х240 точек.

Доминирующий формат на сегодня это MPEG-2 (с разрешением 720х576 точек). Все DVD-video диски работают именно в формате MPEG-2. Трансляции со спутников в несколько каналов на одной частоте, эфирная трансляция, в том числе ТВ высокой четкости, разнообразные плееры DVD, microMV-видеокамеры используют этот формат сжатия. И это не удивительно. После триумфального успеха MPEG-1, новый формат, обеспечивающий практически профессиональное качество картинки утверждался довольно долго, и получился очень удачным. MPEG-2 подходит для записи полуторачасового фильма отличного качества на стандартный диск DVD (4,7 Гб). Кроме того, в этом формате можно записывать на двойные DVD (9 Гб) фильмы повышенного качества с использованием нескольких разных дорожек звука (дубляж), разных форматов многоканального звучания, субтитров, разных углов обзора видеоматериала (несколько синхронных дорожек видео) и других цифровых новшеств. Среди них, например, присутствует произвольный мгновенный доступ к любой части видеоматериала на диске и отсутствие перемотки при достижении конца видеоматериала, что раньше являлось довольно большой проблемой.

MPEG-2 позволяет использовать разрешения вплоть до 1920х1080 пикселов (25 кадров в секунду, с полями и без полей, с прогрессивной разверткой) и поддерживает 6-канальный звук.

Особенности этого формата широко использует компания Sony в своем расширенном стандарте microMV, хотя поток информации там повышен до 12 Мбит/с (по сравнению с максимальным стандартом DVD 9,8 Мбит/с), а размер кассеты уменьшен (по сравнению с DV). И всё же стандарт DV отличается большей устойчивостью и большим распространением по всему миру.

Недавно появились камеры, которые пишут сразу на miniDVD диски в формате MPEG-2. Они имеют несколько важных достоинств - перезапись дисков до 1000 раз без потери качества, доступность материала и некоторые другие преимущества. Но очевиден и недостаток – ограниченный объем записанного материала (до 30 минут на 1 miniDVD диск). Хотя для любительских съемок это очень подходящий вариант: миниDVD диски прекрасно воспроизводятся на бытовых плеерах и ПК, а программы идущие с такими камерами позволяют проводить монтаж на любом компьютере, оснащенном DVD-приводом.

Общепринятые стандарты для формата MPEG

Развитием формата MPEG-2 является MPEG-4. Все мы уже давно привыкли к звуку MP3, а формат MPEG-4 сочетает отличный звук и максимальное уплотнение видеосигнала (до 30-40% лучше чем у предшественника). Разница заключается в том, что кодируется последовательность более чем из трех кадров (обычно до 250 кадров). Тем самым достигается большее сжатие и возможность смотреть в режиме реального времени качественное потоковое видео в интернет. Динамическое сжатие также эффективно использует ресурсы, и на обычный компакт-диск помещается 1,5 часа видео в достаточно хорошем качестве. Однако, в большинстве случаев, внимательный зритель сможет увидеть на хорошем экране разницу между изображением, закодированном в MPEG2 и MPEG4.


Некоторые параметры, которые можно настроить при кодировании видео в MPEG-4

Некоторые видеокамеры позволяют записывать в формате MPEG-4 видео на собственную карту памяти или работать как web-камера, передавая по USB кабелю видео со звуком в формате MPEG-4.

Кроме того, современные технологии позволяют даже воспроизводить цифровое телевидение (сжатое в формате MPEG-4 или MPEG-2) с помощью мобильных телефонов, используя GPRS.

На сегодня, MPEG-4 - это наиболее популярный формат распространения видео в интернете и на персональных компьютерах. Рациональное использование памяти при хорошем качестве видео дают о себе знать. Каждая последующая версия кодека MPEG-4 (на сегодня используются 3.хх, 4.хх и 5.хх версии) привносит всё новые и новые прогрессивные улучшения. Большое количество бытовых плееров, КПК и прочих устройств без проблем работают с этим форматом. MPEG-4 будет актуален еще, как минимум, лет десять, пока ему на смену не придёт что-то принципиально новое.

Это формат был разработан программистами компании Apple. Используется он в основном на компьютерах этой компании, хотя также распространен довольно сильно и в интернете. Стандарт MOV считается устаревшим, и позволяет хранить несжатое видео, и довольно популярен по сей день, так как воспроизводится практически на любом компьютере. Однако стоит заметить при его использовании неэффективное использование ресурсов ни по качеству изображения, ни по размеру итогового файла.

Windows Media Video предназначен для небольших файлов и плохих каналов передачи данных. Компания Microsoft активно внедряет этот переходной формат в массы. Для просмотра видео небольшого размера в интернете кодек приходится весьма кстати, а потому используется повсеместно, в том числе для прямых трансляций. Некоторые портативные устройства (например, КПК) также используют этот формат хранения сжатых медиа-данных.

Популярностью этот формат пользуется лишь потому, что его продвигает гигант Microsoft. Также Windows Media Video позиционируют для создания высококачественного видео для DVD (в формате Microsoft Windows Media Video High-Definition, или WMV HD), но со скоростью передачи данных, такой же, как и на стандартном DVD. Воспроизводить его можно с использованием плеера Windows Media 10 Series на компьютерах с ОС Microsoft Windows XP. Будущее этой новинки зависит исключительно от настойчивости Микрософт и количество денег, вкладываемых в эту лицензированную разработку.

Digital Video (DV)

По-настоящему качественное цифровое видео появилось с разработкой формата DV (а также с разновидностями DVCAM, DVCPRO, miniDV). Для полноценной работы с этим форматом требуется соединение DV-камеры с компьютером. И оно было найдено – это формат передачи данных IEEE-1394 (также имеющий названия i.Link или FireWire). С помощью порта IEEE-1394 можно копировать все, что отснято на видеокамеру в компьютер и обратно (если камера поддерживает такую возможность). Так как происходит передача цифрового сигнала в обе стороны, потери при переносе информации исключены.

Не вдаваясь в тонкости процесса кодирования, отметим, что благодаря новым методам преобразования, размер кадра в DV достигает 720x576 точек, звук - 48 кГц/стерео, а поток видео - 3,6 Мбайт/с. Таким образом, видео практически профессионального качества стало доступно каждому с цифровой камерой формата DV. Тем более на одну видеокассету подобного формата вмещается до 90 минут (LP режим) высококачественного материала.

Будущее этого формата практически безоблачно. И будет ещё долго радовать всех любителей и ценителей качественного домашнего видео, которое повсеместно используется на ТВ (документальные фильмы, прямые репортажи и пр.)

Что же дальше?

Blue Ray диски уже готовы к массовому использованию, а основное их отличие от DVD – в объеме (на один Blue Ray диск вмещается до 25 Гб информации). Такой объем позволит увеличить объем готовых фалов, а значит, уменьшить степень сжатия и увеличить конечное качество. Видеокамеры с возможностью записи на подобные диски должны появиться в ближайшем будущем и станут очередной ступенькой в развитии прогресса цифровой видеотехники.

История семейства форматов MPEG, к которому собственно и принадлежит стремительно набирающий в последнее время популярность формат MPEG-4, началась в далеком 1988 году. Именно в этом году был основан комитет Moving Pictures Expert Group, что на русский переводится примерно как экспертная группы кинематографии (движущихся изображений), аббревиатура которого - MPEG известна теперь любому, кто имел дело с мультимедиа - компьютерами или с цифровым телевидением. В этом же году была начата разработка формата MPEG-1, который в окончательном виде был выпущен в 1993 году. Несмотря на все очевидные недостатки этого формата, MPEG-1 по-прежнему является одним из наиболее массовых форматов видеосжатия, лишь в последнее время, начиная постепенно сдавать позиции под натиском более новых и совершенных форматов видеокомпрессии, по большей части из этого же семейства.

Надо сказать, что практически все новаторские по тем временам разработки легшие в основу формата MPEG-1, в том или ином виде встречаются и более совершенных форматах данного ряда, поэтому, рассмотрев в подробностях первого представителя этого семейства форматов видеосжатия можно получить общее представление о том, как же работают алгоритмы MPEG.

Формат MPEG-1. Старый, но еще не побежденный.

Формат MPEG-1 начал разрабатываться в те трудно вообразимые времена, когда не было широкодоступных носителей большого объема, в то время, как видеоданные, даже и сжатые, занимали совершенно колоссальные для конца 80-х объемы - средней продолжительности фильм имел размер больше гигабайта. Если кто не помнит, то это была эпоха 286 и 386 процессоров, 4 Мб оперативной памяти и 250 Мб винчестер считались роскошью, а не убогостью, как сейчас, Windows была примочкой для DOS, а не наоборот, а в качестве легко переносимых носителей информации доминировали 5 дюймовые дискеты и только-только появившиеся 3,5" дискеты от фирмы SONY. В таких условиях необходимо было найти носитель, на который можно было бы записать гигабайт информации, при этом этот носитель должен был быть недорогим, иначе ни о какой массовости не могло быть и речи.

И такой носитель был найден. Как раз в эти годы впервые на платформе PC появился такой новый тип носителей информации как CD-ROM диски, которые смогли обеспечить необходимый объем информации. Правда, на один диск фильм в формате MPEG-1 все-таки не вмещался, но что мешало записать его на 2 CD, тем более, что новинка стоила очень недорого? Разумеется, первые CD-ROM проигрыватели были односкоростными, поэтому не стоит удивляться, что максимальная скорость пересылки потока данных (bitstream) в формате MPEG-1 ограничена 150 Кб/сек., что соответствует одной скорости CD-ROM.

Надо сказать, что возможности MPEG-1 не ограничены тем низким разрешением, которое вы все видели при просмотре VIDEO-CD. В самом формате была заложена возможность сжатия и воспроизведения видеоинформации с разрешением вплоть до 4095х4095 и частотой смены кадров до 60 Гц. Но из-за того, что поток передачи данных был ограничен 150 Кб/сек., то есть так называемый Constrained Parameters Bitstream (CPB) - зафиксированная ширина потока передачи данных, разработчики формата, а в дальнейшем и создатели кодеков на его основе, были вынуждены использовать разрешения кадра, оптимизированные под данный CPB. Наиболее широко распространенными являются два таких оптимизированных формата - это формат SIF 352х240, 30 кадров в секунду и урезанный формат PAL/SECAM 352х288, 25 кадров в секунду.

Ну вот, с разрешением определились, теперь можно и посмотреть, как это все сжимается.

Принципы Сжатия информации в MPEG-1.

В качестве примера рассмотрим урезанный формат PAL/SECAM, который более распространен, чем SIF, хотя оба эти формата за исключением разрешения и частоты смены кадров ничем друг от друга не отличаются.

Урезанная версия формата PAL/SECAM содержит 352 ppl (point per line - точек на линию), 288 lpf (line per frame - линий на кадр) и 25 fps (frame per second - кадров в секунду). Надо сказать, что полноценный стандарт PAL/SECAM имеет параметры в 4 раза большие, чем аналогичные у MPEG-1 (кроме fps). Поэтому принято говорить, что VIDEO-CD имеет четкость в четыре раза хуже, по сравнению с обычным видео.

Как видно из таблицы Сb и Cr практически всегда кодируются с меньшим разрешением, чем Y. Чем меньше разрешение цветовых плоскостей, тем грубее и неестественнее цветопередача в видеоролике. Разумеется, самым некачественным, но и самым компактным будет последний вариант.

  1. Кадры типа I - Intra frame. Ключевые кадры, которые сжимаются без изменений.
  2. Кадры типа P - Predirected frame. При кодировании этих кадров часть информации удаляется. При воспроизведении P кадра используется информация от предыдущих I или P кадров.
  3. Кадры типа В - Bidirectional frame. При кодировании этих кадров потери информации еще более значительны. При воспроизведении В кадра используется информация уже от двух предыдущих I или P кадров. Наличие В кадров в видеоролике - тот самый фактор, благодаря которому MPEG-1 имеет высокий коэффициент сжатия (но и не очень высокое качество).

При кодировании формируется цепочка кадров разных типов. Наиболее типичная последовательность может выглядеть следующим образом: IBBPBBPBBIBBPBBPBB. Соответственно очередь воспроизведения по номерам кадров будет выглядеть так: 1423765.

По окончании разбивки кадров на разные типы начинается процесс подготовки к кодированию.

С I кадрами процесс подготовки к кодированию происходит достаточно просто - кадр разбивается на блоки. В MPEG-1 блоки имеют размер 8х8 пикселов.

А вот для кадров типа P и B подготовка происходит гораздо сложнее. Для того, чтобы сильнее сжать кадры указанных типов используется алгоритм предсказания движения.

  1. Вектор движения текущего блока относительно предыдущих
  2. Разницу между текущим и предыдущими блоками, которая собственно и будет подвергаться дальнейшему кодированию.

Вся избыточная информация подлежит удалению, благодаря чему и достигается столь высокий коэффициент сжатия, невозможный при сжатии без потерь.

Но у алгоритма предсказания движения есть ограничения. Зачастую в фильмах бывают статические сцены, в которых движения нет или оно незначительно и возникают блоки или целые кадры, в которых невозможно использовать алгоритм предсказания движения. Думаю, вы замечали, что у видеороликов сжатых MPEG-1 качество сцен с небольшим количеством двигающихся объектов заметно выше, чем в сценах с интенсивным движением. Это объясняется тем, что в статических сценах P и B кадры, по сути, представляют собой копии I кадров, потерь практически нет, но и сжатие информации незначительно.

В случае же корректного срабатывания алгоритма предсказания движения, объемы кадров разного типа в байтах соотносятся друг с другом примерно следующим образом - I:P:B как 15:5:2. Как вы видите из данного соотношения, уменьшение объема видеоинформации налицо уже на стадии подготовки к кодированию.

  1. Discrete Cosine Transformation - DTC, дискретное преобразование косинусов, преобразование Фурье.
  2. Quantization - квантование. Перевод данных из непрерывной формы в прерывистую, дискретную.
  3. Преобразование полученных блоков данных в последовательность, то есть преобразование из матричной формы в линейную.

При кодировании блоки пикселов или вычисленная разница между блоками обрабатывается первым из преобразующим алгоритмов - DTC (дискретное преобразование косинусов). Обычно пиксела в блоке и сами блоки изображения каким-то образом связаны между собой - например однотонный фон, равномерный градиент освещения, повторяющийся узор и т.д. Такая связь называется корреляцией. Алгоритм DTC, используя коррелирующие эффекты, производит преобразование блоков в частотные фурье-компоненты. При этом часть информации теряется за счет выравнивания сильно выделяющихся участков, которые не подчиняются корреляции. После этой процедуры в действие вступает алгоритм Quantization - квантование, который формирует Quantization matrix. Quantization matrix - это матрица квантования, элементами которой являются преобразованные из непрерывной в дискретную форму данные, то есть числа, которые представляют собой значения амплитуды частотных фурье-компонентов. После формирования quantization matrix происходит разбивка частотных коэффициентов на конкретное число значений. Точность частотных коэффициентов фиксирована и составляет 8 бит. После квантования многие коэффициенты в матрице обнуляются. И в качестве завершающей стадии происходит преобразование матрицы в линейную форму.

Все эти преобразования касаются только изображения. Но кроме изображения в практически любом видеофрагменте присутствует так же и звук. Кодирование звука осуществляется отдельным звуковым кодером. По мере развития формата MPEG, звуковые кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства - MPEG-1 Layer I, Layer II и Layer 3 (тот самый знаменитый MP3). Принципы кодирования всех этих кодеков основаны на психоакустической модели, которая становилась все более и более совершенной и достигла своего апофеоза для семейства MPEG-1 в алгоритмах Layer-3.

Про психоакустическую модель и принципы сжатия аудиоданных с потерями написано множество статей, в частности статья "Описание формата аудиосжатия MP3", которую вы можете прочитать на этом сайте, поэтому описание аудиокодеров можно опустить, упомянув, единственно о синхронизации аудио- и видеоданных и форматов аудиотреков.

Синхронизация аудио- и видеоданных осуществляется с помощью специально выделенного потока данных под названием System stream. Этот поток содержит встроенный таймер, который работает со скоростью 90 КГц и содержит 2 слоя - системный слой с таймером и служебной информацией для синхронизации кадров с аудиотреком и компрессионный слой с видео- и аудиопотоками.

Под служебной информацией понимаются несколько видов меток, наиболее важными из которых являются метки SCR (System Clock Reference) - инкремент увеличения временного счетчика кодека и PDS (Presentation Data Stamp) - метка начала воспроизведения видеокадра или аудиофрейма.

Ну вот рассказ о MPEG-1 практически подошел к концу, осталось лишь назвать некоторые параметры аудиотреков, которые используются в этом формате.

Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах - от высококачественных до безобразных. Окончательно все форматы сжатия аудиоданных были стандартизированы в 1992 году европейской комиссией по стандартам ISO.

В зависимости от используемого кодера и степени сжатия аудиоинформация видеоролика может быть представлена в следующем виде: моно, dual mono, стерео, интенсивное стерео (стереосигналы, чьи частоты превышают 2 КГц объединяются в моно), m/s стерео (один канал - сумма сигналов, другой - разница) и по частоте дискретизации могут быть: 48, 44.1и 32 КГц.

На этом хватит о MPEG-1, а в следующих главах речь пойдет о его более чем достойных и перспективных наследниках.

Разница между MPEG1 и MPEG2 - Разница Между

Разница между MPEG1 и MPEG2 - Разница Между

Содержание:

Ключевое отличие: MPEG обозначает Группу экспертов по движущимся изображениям. MPEG1 был первоначально выпущен в 1993 году и фактически является системой сжатия для аудио и видео файлов. Обычно используется для сохранения видео со звуком на жестком диске и компакт-дисках. Он даже используется для цифрового кабельного / спутникового телевидения и цифрового аудио вещания. Тем не менее, он обычно используется для изображений с низким разрешением. MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и нацелен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной аудиоинформации.


MPEG обозначает Группу экспертов по движущимся изображениям. Это рабочая группа экспертов, которая была сформирована в 1988 году ISO и IEC. Это была совместная инициатива Хироши Ясуда из Nippon Telegraph and Telephone и Леонардо Кьярильоне. Chiariglione служил в качестве председателя группы с момента ее создания.

Целью MPEG было установить стандарты для сжатия и передачи аудио и видео. К 2005 году группа выросла до 350 членов на совещание из различных отраслей, университетов и исследовательских институтов.

Стандарты, установленные MPEG, состоят из разных частей. Каждая часть охватывает определенный аспект всей спецификации. MPEG стандартизировал следующие форматы сжатия и вспомогательные стандарты:

  • MPEG-1 (1993): кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с (ISO / IEC 11172). Предназначен для сжатия необработанного цифрового видео и аудио CD с качеством VHS без чрезмерной потери качества, благодаря чему возможны видео компакт-диски, цифровое кабельное / спутниковое телевидение и цифровое аудиовещание (DAB). Он включает в себя популярный формат сжатия звука MPEG1 Audio Layer III (MP3).
  • MPEG-2 (1995): общее кодирование движущихся изображений и соответствующей аудиоинформации (ISO / IEC 13818). Описывает комбинацию методов сжатия видео с потерями и сжатия аудио данных с потерями, которые позволяют хранить и передавать фильмы с использованием доступных в настоящее время носителей и пропускной способности передачи.
  • MPEG-3: имеет дело со стандартизированным масштабируемым сжатием и сжатием с несколькими разрешениями и был предназначен для сжатия HDTV, но был признан избыточным и был объединен с MPEG2.
  • MPEG-4 (1999): Кодирование аудиовизуальных объектов. Включает сжатие AV-данных для веб-приложений (потоковое мультимедиа) и распространения CD, голосовых (телефон, видеофон) и вещательных телевизионных приложений. Включает MPEG-4 Part 14 (MP4).
  • MPEG-7 (2002): интерфейс описания мультимедийного контента. Не стандарт, который имеет дело с фактическим кодированием движущихся изображений и аудио, таких как MPEG1, MPEG2 и MPEG4. Он использует XML для хранения метаданных и может быть присоединен к временному коду, чтобы пометить определенные события или синхронизировать текст песни с песней.
  • MPEG-21 (2001): мультимедийная структура. Он нацелен на определение открытой платформы для мультимедийных приложений. Основано на определении цифрового элемента и пользователей, взаимодействующих с цифровыми элементами.

MPEG1 был первоначально выпущен в 1993 году и фактически является системой сжатия для аудио и видео файлов. Обычно используется для сохранения видео со звуком на жестком диске и компакт-дисках. Он даже используется для цифрового кабельного / спутникового телевидения и цифрового аудио вещания. Тем не менее, он обычно используется для изображений с низким разрешением.

MPEG1 - сжатие с потерями. Сжатие с потерями означает, что при сохранении файла происходит небольшая потеря качества из-за сжатия. При каждом повторном сохранении наблюдается небольшая потеря качества из-за сжатия. Следовательно, это не самый лучший формат, если нужно постоянно вносить многочисленные изменения и повторно сохранять изображение. Тем не менее, если сделать несколько правок и файл сохраняется в формате высокого качества, небольшая потеря качества из-за сжатия в основном незначительна. Преимущество использования этого формата заключается в том, что из-за сжатия файл будет занимать меньше места для хранения данных.

Стандарт MPEG1 состоит из следующих частей:

  • Системы (хранение и синхронизация видео, аудио и других данных вместе)
  • Видео (сжатый видеоконтент)
  • Аудио (сжатый аудиоконтент)
  • Проверка соответствия (тестирование правильности реализации стандарта)
  • Справочное программное обеспечение (пример программного обеспечения, показывающего, как кодировать и декодировать в соответствии со стандартом)


В MPEG1 степень сжатия видео без потери слишком высокого качества составляет 26: 1, а соотношение звука или составляет 6: 1. Поскольку этот коэффициент сжатия экономит много места, этот формат стал вполне обычным пользователем. На это дополнительно влияет тот факт, что MPEG1 обладает широкой совместимостью. Некоторые из наиболее популярных форматов файлов под MPEG1 включают .mpg, .mpeg, .mp3 и т. Д.

MPEG2 был выпущен в 1995 году и фактически является преемником MPEG1. Он очень похож на MPEG1 и нацелен на улучшение предыдущего формата. MPEG2 включает в себя общее кодирование движущихся изображений и связанной аудиоинформации. Это улучшает коэффициент сжатия и расширяет возможности MPEG1, так что MPEG2 в основном используется для DVD-видео, а также для вещания цифрового телевидения, включая эфирное, кабельное и спутниковое.

MPEG2 также представляет собой сжатие с потерями, однако MPEG2 обеспечивает лучшее разрешение. Он также использовал более высокие скорости передачи данных. Кроме того, MPEG2 устраняет некоторые недостатки MPEG1, в том числе:

  • Сжатие звука ограничено двумя каналами
  • Нет стандартизированной поддержки чересстрочного видео с плохой компрессией при использовании чересстрочного видео
  • Ограниченный стандартизированный профиль, который был несовместим с видео с более высоким разрешением. Поддержка видео 4k, но нет практического способа кодировать видео для более высоких разрешений
  • Ограниченная идентификация вспомогательного оборудования
  • Поддержка только одного цветового пространства - 4: 2: 0

Кроме того, MPEG2 также включает в себя поддержку переменного квантования и VBR. MPEG2 также имеет более сложный алгоритм кодирования, из-за чего он несовместим с MPEG1. Следовательно, проигрыватели MPEG1 не могут декодировать и воспроизводить файлы MPEG2.

picturie

В предыдущей публикации " Цифровое и а налоговое вещание. Пути развития. Стандарт сжатия MPEG . Часть I " , опубликованной в журнале Broadcasting . Телевидение и радиовещание-№6, 2018 год, был представлен материал по стандарту сжатия MPEG , как одного из способов снижения скорости цифрового потока, находящегося в состоянии передачи движущихся фона и перемещающихся объектов в кадре. Основное внимание было уделено цифровому преобразованию аналогового цветного телевизионного сигнала и его компонентное кодирование.

Напомним, что стандарты сжатия MPEG были разработаны Экспертной группой по движущимся изображениям в кинематографии ( Moving Picture Experts Group – MPEG ). Эта технология определяет стандарты сжатия как аудио, так и видеоинформации и делает ее удобной для передачи в вещании. Опишем последовательно типы стандартов.

Стандарт сжатия MPEG -1

Стандарт MPEG -1 предполагает переход от пространственного представления изображения к спектральному. Это позволяет избирательно обрабатывать многомерную структуру изображения, чтобы добиться ее более качественных характеристик. В стандарте MPEG -1 для этого используется метод дискретного косинусного образования (ДКП), который применяется к все тем же блокам 8х 8, на которые разбивается изображение. Применение ДКП дает матрицу из 64 спектральных составляющих – коэффициентов. Последовательное добавление коэффициентов при восстановлении изображения, начиная с нулевого, определяемого усредненной яркостью исходного блока, приводит к восстановлению блока до удовлетворительного изображения. Опыт показывает, что для средних картинок изображения более чем 50% всех блоков 8х 8 могут быть восстановлены до хорошего состояния добавлением порядка 20 коэффициентов - спектральных составляющих из 64. Это позволяет сократить число бит, необходимых для кодирования. Степень сжатия при этом достигает восьми.

Стремление к более высоким степеням компрессии до сотен раз при использовании ДКМ-технологии ( 8х 8 ) приводит к сильному искажению первоначальной картинки. А использование блоков 16х 16 требует значительных вычислительных затрат.

По стандарту MPEG -1 аудио и видео информация (потоки) передаются со скоростью 150 Кбайт/с. При управлении потоками выбираются ключевые видеокадры и заполняются только области, изменяющиеся между кадрами.

Вкратце технология сжатия MPEG -1 включает в себя следующие этапы.

Перед кодированием удаление временной избыточности, как мы ранее описывали, происходит по технологии временного сжатия на группе изображений из 12-ти кадров – GOP , в которой выбираются I -кадры ( intra frame – кадры), которые сжимаются без изменений, кадры P ( predirected frame ), при кодировании которых часть информации удаляется, а при воспроизведении используется информация с предыдущих I- или P- кадров. Самым "сжимаемым" типом кадров являются B ( bidirectional frame ) – кадры, у которых при кодировании потери информации значительны, а при воспроизведении используется информация предыдущих I или P кадров. Если взять сформированную при кодировании наиболее типичную цепочку кадров IBBPBBPBBIBB , то "на лицо" процесс сжатия информации, так как в GOP цепочке соотношение между кадрами ( I : P : B ) 2:2:8, т.е. превалирование самых сжимаемых кадров в 4 раза.

После окончания разбивки на кадры I -кадры разбиваются на блоки 8х 8 пикселей, а кадры P и B типа "сжимаются" через технологию "предсказания движения". В качестве обрабатываемой информации алгоритм "предсказания движения" получает блок текущего кадра (8х 8 пикселей) и подобные блоки от предыдущих I или P кадров.

После прохождения обработки в конечном итоге на этом этапе "сжатия" имеется следующая информация:

  • вектор движения текущего блока относительно предыдущих,
  • разница между настоящим и прошедшими блоками, подвергаемая кодированию в дальнейшем.

Процесс кодирования проходит три этапа

  • ДКП ( дискретное косинусное преобазование – DCT (discrete cosine transformation);
  • квантование ( quantization ) – перевод информации из аналоговой формы в дискретную;
  • перевод полученных блоков из матричной формы в линейную.

Стандарт MPEG -1 в системе цветного телевещаания оказался малопригодным, так как в формате YUY (см. выражения (4) и (5) в Части I настоящей статьи) он оптимизирован для использования с параметрами:

  • 240 линий в кадре (line per frame – lpf );
  • 352 точки в линии (point per line – ppl);
  • 30- ти кадровая развертка (frame per second – fps);

поэтому обеспечивает более низкое качество видеоизображения, нежели передаваемое с соблюдением цветного телевизионного стандарта.

Тем не менее по мере развития формата MPEG -1 разрабатывались методы кодирования звука. Результат был представлен в виде серии звуковых кодеров Layer I , Layer II ( Musicam ), Layer III ( MP 3). Формат сжатия звуковой информации работает на принципе эффекта "маскировки" звуков. Чувствительность слуха для двух соседних частот неодинаков из-за последствия воздействия звука на частоте с более высокой мощностью воспроизведения и "затыкания" на время слуха для звука на соседней частоте. Таким образом, использование данного психоакустического эффекта в MPEG -1 заключается в разбивке всего частотного спектра на части, в которых уровень звука считается одинаковым и затем удаляются звуки, не воспринимаемые человеком из-за эффекта "маскировки".

Синхронизация видео- и аудиоинформации осуществляется с помощью технологии потока данных System stream , смыкающего два потока информации системной с таймером на частоте 90 кГц и служебной информацией для синхронизации кадров с звуковым треком и сжатый с видео- и аудиопотоками.

В целом можно подытожить, что результат разработки стандарта MPEG -1 свелся к следующему. Первый стандарт MPEG -1 используется для записи, просмотра и хранения видео- и аудиоинформации на CD дисках. На компакт CD диск помещается примерно 70 минут видео- и аудиоинформации при скорости записи 1,4 Мбит/с.

Стандарт MPEG -1 не получил значительного развития, так как качество видеоизображения было не на много лучше, чем в VHS - стандарте. Однако MPEG -1 все еще используется для записи и хранения информации, архивированной с помощью компьютера.

Стандарт сжатия MPEG -2

Стандартом сжатия, используемый чаще всего в нынешнем телевещании оказался стандарт, разработанный в 1992 году под названием MPEG -2. Технологии кодирования в этом стандарте описаны в основном в предыдущей части статьи. Если подытожить вкратце, то сжатие в формате MPEG -2 сводится к тому, что более 90% цифровой информации видеосигнала избыточна и может быть удалена без особого ущерба качеству изображения. Применительно к видеокартинке мы рассматривали технологии устранения пространственной и временной избыточности таким образом, что после удаления "избыточности" в формате MPEG -2 обеспечивается качественное видеоизображение при низкой скорости передачи информации.

Этапы кодирования в этом формате следующие:

  1. Аналого-цифровое преобразование и масштабирование кадра;
  2. Перевод цветного изображения из RGB формата в формат YUV с минимальными потерями;
  3. Устранение временной избыточности по технологии GOP - цепочек;
  4. Осуществление двумерного косинусного преобразования (ДКП) без потерь;
  5. Квантование Фурье-коэффициентов ;
  6. Компрессия через метод эффективного кодирования по Хаффмену без потерь;
  7. Подсоединение к полученным закодированным кадрам заголовков и отличительных меток.

При кодировании аудиосигналов в стандарте сжатия MPEG -2 поддерживается многоканальность формата 5+1 звуковых каналов и стандарт AAC ( Advanced Audio Coding – продвинутое кодирование звука), который предполагает HiFi качество звука со скоростью цифрового потока в 64 Кбит/с на канал.

Следующий формат сжатия MPEG -3, разработанный для телевидения высокой четкости HD с разрешением 1920 1080 точек при скорости потока 20 40 Мбит/с и 30-ти кадрах в секунду, не дал принципиального улучшения картинки по сравнению со стандартом MPEG -2, поэтому не получил дальнейшего развития.

В целом на данный момент повествования можно резюмировать, что стандарт MPEG -2 в своей первоначальной разработке имел в основе стандарт MPEG -1, но имеет несколько существенных изменений для поддержки таких приложений, как эффективная компрессия ч е ре с строчного и прогрессивного видео, более гибкий синтаксис и более существенную системную часть стандарта.

Стандарт оказался гибким и удобным для дальнейших разработок приложений. Он стал внедряться как основа широковещательной цифровой ТВ-трансляции, используя спутниковые каналы вещания, кабельные сети и наземное вещание. MPEG -2 с успехом используется для кодирования фильмов в формате DVD V ideo . DVD техника, при использовании полупроводникового лазера с длиной волны излучения почти в два раза меньше, чем в CD - устройствах, позволила увеличить рабочие объемы массивов информации и скорость записи и воспроизведения. Кодирование фильмов в формате DVD Video позволило вытеснить из бытового использования устройств а VHS - стандарта. Однако следует заметить, что такое домашнее перевооружение произошло в пользу коммерческих структур, которые записывают и продают видеопродукцию , непозволительную в конечном итоге для пользователя. Совершенно исчезли из разработок и предложений на рынке устройства для DVD - записи информации (домашних фильмов) в быту. Тем самым вкус и желания рядовых зрителей просто игнорируются не только в масштабе отечественного рынка, но и в мировом культурном масштабе. Мы сейчас смотрим и воспринимаем информацию, диктуемую мировыми лидерами в производстве фильмов, передач и анимации.

В повествовании о стандартах сжатия мы забыли упомянуть о таком понятии в передаче цифровой информации как битрейт. Битрейт – это основной параметр (уровень), который задается кодеру и определяется как объем выходного потока в битах за единицу времени. Понятно, что чем выше битрейт, тем выше качество картинки. Ставится условие, что , ориентируясь на заданный б и трейт, кодер должен иметь возможность динамически подстраивать параметры алгоритмов, используемых на различных этапах обработки информации, чтобы битрейт выходного цифрового потока был как можно ближе к заданному значению с минимальными потерями качества. Конечно, задача полна противоречий, но производители кодеров решают ее, каждый по-своему.

Стандарт сжатия MPEG -4

Далее, чтобы было понятно более или менее с развитием стандартов сжатия, нужно отметить следующее. Группа MPEG , которая занимается разработкой стандартов для международной организации по стандартам ( ISO ), поработав весьма успешно при создании стандартов сжатия MPEG -1 и MPEG -2 для кодирования видео- и аудиоинформации, создала еще стандарты MPEG -7 и MPEG -21, которые имеют дело с представлением мультимедийного контента и мультимедийной среды, при разработке стандарта MPEG -4, который является самым последним стандартом, определяющим аудиовизуальное кодирование, разделила свои усилия с рабочей группой VCEG ( Video Coding Experts Group ), работающей в организации ITU ( International Telecommunication Union ). Группа VCEG разработала в свое время первый рабочий стандарт для видеотелефонии H .261, в последствии H .263, и инициируя разработку стандарта H .26 L , вписалась в совместную разработку с группой MPEG , создав совместную группу JVT ( Joint Video Team ) для придания стандарту H .26 L статуса международного стандарта. JVT был создан стандарт H .264/ MPEG -4. Part 10, который был опубликован одновременно ISO / IEC ( Electrotechnical Comission ) и ITU - T в виде ITU - TH .264 в 2001 году.

Такие метаморфозы случились из-за того, что в 1994 году стало ясно, что стандарт H .263 потенциально обеспечивает более производительную и перспективную технологию сжатия. Поэтому группа MPEG , пытаясь соблюсти свои интересы и решив охватить кодирование и функциональность на основе "объектов", сделав это существенной особенностью нового стандарта MPEG -4 Visual взяла новую разработку группы ITU - T под названием H .26 L , (где " L "- Long Term ) и положила ее в основу предложенного в 2003 году стандарта MPEG -4. Part 10, обозначив его как H .264/ MPEG -4. Part 10 Advanced Video Coding или короче H .264/ MPEG -4. Part 10 AVC .

Для этого стандарта, который мы просто будем называть MPEG -4, в качестве базовой была выбрана технология кодирования видеоинформации на основе поблочной компенсации движения с последующим преобразованием и квантованием остаточных блоков. Позже этот стандарт впоследствии разделился на MPEG -4. Part 2 и Part 10/ H .264, которые в настоящее время различаются по ряду параметров.

Полное название первого формата дается в виде MPEG -4 Visual ( Part 2. ISO / IEC 14496, "кодирование аудиовизуальных объектов"). Стандарт ориентирован на определение принципов работы с видео и аудиоинформацией в области интерактивного мультимедиа через каналы различной пропускной способностью цифрового телевидения и работы с графическим цифровым контентом. Так в рамках формата возможна работа с натуральными и созданными компьютером 2 D - и 3 D - объектами, указывая их взаимодействие между собой и обеспечивая интерактивное взаимодействие с пользователем.

Схема компрессии видеоинформации в стандарте MPEG -4 такой же, что и в предыдущих форматах MPEG . При кодировании выявляются и сохраняются ключевые кадры со сменой сюжета и прогнозируется с сохранением информация об изменениях в текущем кадре по отношению к предыдущему. Далее кодек может работать не только с квадратами, на которые разбивается изображение, но и с объектами произвольной формы. Конечно, в данном случае необходимы более значительные вычислительные ресурсы, однако это особенность формата, который дает возможность работать как с движущимися изображениями (прямоугольные кадры), видеообъектами произвольной формы, 2 D - и 3 D -объектами, синтезируемыми компьютером, анимационными объектами, так и с объектами неподвижного изображения.

Формат MPEG -4 поддерживает стандарты :

  • цифрового телевещания, хранения видеоинформации ;
  • потокового видео, передаваемого через Интернет и мобильную связь;
  • стандарты высококачественной видеопродукции, изготовляемой и распространяемой для студийного употребления;
  • представления компьютерной графики в 2 D и 3 D геометрии;
  • стандарты технологии анимационных изображений ;
    и т. д.

Не следует думать, что за внешней многообразностью и большим охватом возможностей MPEG -4 является каким-то особым стандартом сжатия, так как в основе своей имеет простой механизм видеокодирования , использующий кодирование на основе блоков с компенсацией движения. Далее с последующим преобразованием ДКП, квантованием и энтропийным кодированием. Синтаксис базового кодирования с некоторыми ограничениями идентичен стандарту H .263. Большинство остальных функциональных возможностей получились добавлением некоторых деталей, которые разработаны отдельно.

Звуковая часть MPEG -4 аналогично объектно ориентирована. Здесь используется описание звукового поля на языке BIFS , который позволяет располагать объекты-источники звука в трехмерном пространстве сцены в желаемое положение, менять характеристики звука и добавлять эффекты независимо каждому источнику, перемещая его вместе с визуальным объектом.

При кодировании аудиообъектов в технологии MPEG -4 заложены два языка SAOL ( Structured Audio Orchestra Language ) и SASL ( Structured Audio Score Language ), с помощью которых можно запрограммировать любой инструмент и любую программу воспроизведения синтезированного звука.

Особенность MPEG -4 в том, что окончательная сборка общей картины происходит в компьютере или другом приемном устройстве и пользователь может сам формировать получаемое изображение, как телережиссер. Команды пользователя могут обрабатываться в декодере или пересылаться источнику, осуществляя функцию интерактивности.

Переход цифрового вещания в стране от стандарта MPEG -2 к MPEG -4

Что касается перехода цифрового вещания в стране от стандарта сжатия MPEG -2 к стандарту MPEG -4, то у нас этот процесс проявился еще в 2015 году, когда операторы связи спутникового вещания "Триколор TV ", "Орион" и "НТВ плюс" с 2016 года после предварительной подготовки начали постепенную замену оборудования как передающего, так и у пользователей.

Этому процессу способствовал еще и приказ Минкомсвязи "Об утверждении Требований к качеству звука и (или) изображения обязательных общедоступных телеканалов и (или) радиоканалов" от 01.09.2015 года, который обязывал операторов связи обеспечить трансляцию цифровых сигналов первого и второго мультиплексов в цифровом формате не хуже, чем с использованием стандарта MPEG -4.

Отметим, что у оператора Триколор ТВ в 2015 году 2 млн абонентов поменяли свое оборудование на нов ое . В 2016 году уже 75% абонентов совершили обмен.

В мировом масштабе перехода с MPEG -2 на MPEG -4 ускорил процесс внедрения вещания HD – каналов. В 2016 году их составляло более сотни в сетке вещания.

Аналогично сложилась ситуация и у остальных спутниковых операторов. Для ускорения процесса обмена оборудования "Орион" и "НТВ плюс" ввели даже новые правила продаж приемного оборудования MPEG -4 в рассрочку на два года и по сниженной цене. Хотя, конечно, переход от одного стандарта к другому делался постепенно с сохранением параллельного вещания в формате MPEG -2, все новые каналы транслируются в настоящее время в формате MPEG -4.

Читайте также: