Скотт Морган

MPEG-4: стандарт интерактивного видео

Для тех, кто не в курсе, Moving Picture Experts Group (MPEG) — это рабочая группа, которая совместно с Международной организацией по стандартизации (International Standards Organization, ISO/IEC) трудится над стандартами кодирования цифрового аудио и видео.

Она занимается созданием и внедрением нескольких аудио- и видеостандартов, включая алгоритмы компрессии, схемы обработки данных и инструментальные платформы.

Больше всего эту группу знают, наверное, как разработчика схемы компрессии MPEG-1 Audio Layer 3 (MP3), но она создала и ряд других технологических стандартов, которыми мы, сами того не подозревая, ежедневно пользуемся, когда смотрим телевизор и работаем с компьютером.

MPEG движется поэтапно и к настоящему моменту выпустила стандарт хранения и воспроизведения видео и аудио MPEG-1; стандарт цифрового телевидения MPEG-2 и стандарт мультимедиа-приложений MPEG-4.

В стадии разработки находится стандарт представления контента MPEG-7, включающий в себя «интерфейс описания мультимедийного контента».

Стандарт MPEG-4

Работа над стандартом MPEG-4 «Кодирование аудиовизуальных объектов» началась в 1993 году, а первый набор стандартов (версия 1) был утвержден в октябре 1998 года. Значительное расширение этого стандарта (версия 2) было утверждено в 1999 году. В том же году MPEG-4 получил официальный статус стандарта ISO/IEC, несмотря на продолжающуюся разработку расширений по определенным разделам.

Целью MPEG-4 было создание стандарта кодирования на основе объектов, который обеспечил бы авторов, сервис-провайдеров и конечных пользователей гибкими средствами работы с мультимедийным контентом. Кроме натурального аудио- и видеоконтента (аудио- и видеозаписей), стандарт MPEG-4 работает с синтезированными (сгенерированными на компьютере) аудио- и видеообъектами.

MPEG-4 обеспечивает необходимые средства для описания взаимного расположения таких объектов в пространстве и времени с целью их интерактивной доставки. Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения таких объектов в различных условиях. Был разработан формат, допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях.

Стандарт MPEG-4 подразделяется на три главных раздела: видео, аудио и системы. Первоначально стандарт предназначался для решения нескольких задач, возникших в связи с быстрым развитием интерактивных технологий: универсальный доступ и распространение в ненадежной среде; широкие интерактивные функциональные возможности; кодирование натуральных и синтезированных данных; эффективная компрессия и др.

Системный раздел стандарта выполняет роль клея, на котором держится композиция MPEG-4; в него входят инструкции по воспроизведению интерактивного контента и взаимному размещению объектов. Это существенное развитие стандарта MPEG-4 по сравнению с предыдущими стандартами MPEG, представлявшими собой относительно линейные технологии, не решавшие проблем интерактивности, характерных для CD-ROM, DVD-ROM, интернета и т.п.

Видеофункции MPEG-4

В основу видеофункций стандарта MPEG-4 была положена технология Apple Quicktime; эти функции обслуживают широкий набор форматов и значений скорости передачи данных. Они охватывают методы прогрессивного и чересстрочного сканирования, произвольные значения пространственного разрешения в диапазоне от 8*8 до 2048*2048 и скорости передачи данных в диапазоне от 5 Кбит/с до 10 Мбит/с.

В MPEG-4 усовершенствована и компрессия, качество и эффективность которой повышены при всех поддерживаемых значениях скорости передачи данных.

В принципе, MPEG-4 осуществляет компрессию обычных и видеоизображений теми же методами, что и MPEG-1/2. Эти методы заключаются в том, что сначала осуществляется прогнозирование движения для следующего видеокадра, а затем выполняется кодирование текстуры.

При реализации традиционных методов кодирования в MPEG-4 поддерживается гораздо более широкий диапазон значений частоты кадров, а дальнейшие разработки направлены на полную замену методов, устанавливаемых стандартом MPEG-2.

Кроме традиционного кодирования, основанного на прямоугольных кадрах, MPEG-4 обеспечивает возможность индивидуально кодировать специфические медиаэлементы в рамках сюжета. Так как разные объекты, используемые в сюжете, могут иметь разную природу (текстурный фон, персонажи переднего плана), независимые инструменты компрессии, используемые для разных типов контента, позволяют добиться более высокой ее эффективности.

Индивидуальные объекты

Основная задача MPEG-4 — не компрессия прямоугольных видеокадров, как у предыдущих стандартов MPEG. В отличие от линейных механизмов кодирования кадров MPEG-1 и MPEG-2, стандарт MPEG-4 использует принцип кодирования индивидуальных объектов произвольной формы.

Кодирование формы, или альфа-канала, означает, что произвольная форма в сцене MPEG-4 может отслеживаться посредством двоичной альфа-карты, определяющей принадлежность данного пиксела к объекту. Это особенно полезно для разработчиков интерактивного контента по нескольким причинам.

Во-первых, видеоинформация необязательно должна быть оформлена в виде прямоугольных кадров.

Во-вторых, применяя раздел MPEG-4 Systems, индивидуально закодированные видеоформы можно интегрировать с другими объектами, такими как 2D-, 3D- или естественный видеофон, образуя сцены.

Наконец, особый интерес для разработчиков интерактивного контента представляет возможность использования отдельных объектов в качестве элементов интерактивного действия. Примерами могут служить простые взаимосвязи в рамках сюжета или смоделированные персонажи, реагирующие на действия пользователя.

Результатом такой объектной ориентации стала возможность интеграции естественных и синтетических видеоисточников.

Стандарт MPEG-4 содержит средства интеграции для кодирования растровых видеоизображений и средства создания и интеграции синтезированных 2D- и 3D-элементов, включая геометрические формы и объекты, текст и синтезированную графику. Стандартизованные в MPEG-4 параметры физиономической анимации позволяют маркировать и анимировать синтезированные персонажи.

Интерактивность — главное преимущество, которого добивались разработчики MPEG-4

Интерактивное взаимодействие медиаобъектов в видеопотоке подчиняется параметрам, устанавливаемым автором сюжета. Диапазон интерактивных возможностей в сюжете MPEG-4 охватывает такие действия, как навигация, зависящая от точки зрения (с соответствующим изменением аудио- и видеопотоков); движение объектов в пределах сюжета; выбор национального языка и т.п.


Версия ZDNET на русском языке издается по лицензии CNET Networks, Inc., San Francisco, CA, USA.
Статьи в "ZDNET Россия", источниками которых служат публикации американской редакции ZDNET, а также GameSpot и CNET, являются предметом авторского права CNET Networks, Inc. или ее партнеров.
Copyright ® 2001, 2002 CNET Networks, Inc. и Algorithm Online. Все права защищены.
ZDNET, GameSpot и CNET - торговые марки CNET Networks, Inc

www.pseudology.org