Способы кодирования видеоинформации реферат

Кодирование видеоинформации

1.Современные аудио и видео форматы

1.1 MPEG-4. Что это такое?

1.2 Основы MPEG-кодирования видео

1.3 Основы фрактального кодирования изображений

1.4 Индивидуальные объекты

1.5 Что такое DivX?

1.6 MPEG Layer 3, и не только

2. Кодирование видео

2.1 Источник DVD

2.2 Источник VHS и TV

3. Пишем битрейт-калькулятор

3.1 Постановка задачи

3.2 Реализация программы

Список используемой литературы

Приложение 1. файл BIT.cpp

Приложение 2. Файл resource.h

Приложение 3. Файл StdAfx.h

DVD медленно, но верно добивается признания: стремительное падение цен на проигрыватели этого формата позволяет устанавливать их в каждый новый компьютер. Притом, что большинство DVD плееров поддерживают Video CD и Super Video CD, на чистый компакт диск можно скопировать взятые напрокат фильмы на DVD, а также старые записи на кассетах VHS.

Кодирование видео дело непростое, для этого может потребоваться масса времени, так как оцифровка видео потребует много часов машинного времени, программного обеспечения, большая часть используемых программ бесплатна и требует тщательной настройки, также возможно не будет существовать программы, которая полностью смогла бы осуществить ваши нужды. В таком случае можно попытаться написать такую программу вручную. И, наконец, для кодирования видео необходим вместительный винчестер, потому что даже сильно сжатое видео будет занимать не менее 500 мегабайт.

В своей курсовой работе я рассмотрю некоторые современные форматы сжатия видео и аудио данных, расскажу о записи и кодировании видео с различных источников, а главное напишу программу необходимую для вычисления видео битрейта для кодеков DivX 3.1 и DivX 4 формата mpeg4.

1.Современные аудио и видео форматы

Основы разработки стандарта MPEG-4 заложены группой ученых из MPEG еще в 1993 году, и уже к концу 1998 года произошло утверждение первого стандарта. Впоследствии стандарт неоднократно дорабатывался, в 1999 году получил официальный статус и затем был стандартизован со стороны ISO/IEC.

Целью создания MPEG-4 была выработка стандарта кодирования, который обеспечил бы разработчиков универсальным средством сжатия видеоданных, позволяющим обрабатывать аудио- и видеоданные как естественного (снятого с помощью видеокамеры или записанного с помощью микрофона), так и искусственного (синтезированного или сгенерированного на компьютере) происхождения. Это обстоятельство кардинальным образом отличает MPEG-4 как видеостандартов предшественников MPEG-1 и MPEG-2, в которых эффективное сжатие данных достигается лишь применительно к естественному видео и аудио.

MPEG-4 обеспечивает необходимые средства для описания взаимного расположения объектов (элементов) сцены в пространстве и времени с целью их последующего представления потенциальным зрителям в ходе воспроизведения. Разумеется, такая трактовка предполагает разделение сцены на составляющие ее объекты, что само по себе является весьма трудоемкой задачей, к которой, по сути, и сводится MPEG-4 кодирование. Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения объектов сцены в различных условиях пропускной способности сетей передачи данных. Был разработан формат, допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях. Другими словами, один и тот же видеофрагмент может быть представлен с различным качеством для различных каналов в зависимости от их пропускной способности.

Кодирование в формате MPEG-4 раздельное. Это означает, что для кодирования видео составляющей применяются одни способы и алгоритмы сжатия, а для кодирования аудио составляющей – другие. Естественной издержкой такого специфичного подхода к сжатию является необходимость сопоставления двух потоков в ходе их последующего совместного воспроизведения в режиме реального времени.

В основу функций сжатия видео составляющей стандарта MPEG-4 была положена технология применения целого арсенала алгоритмов сжатия, применяемых как в зависимости от исходного качества и природы сжимаемого видеофрагмента, так и в совокупности и (или) последовательно обрабатывающих исходное видео с помощью различных по природе алгоритмов сжатия. Это методы прогрессивного и словарного кодирования, кодирования с использованием чересстрочного сканирования, технологии RLE (Run Length Encoding), технологии векторной квантизации (Vector Quantization), а также всевозможные преобразования (Фурье, Дискретное Косинусное, Wavelet).

Первоначальное кодирование видео в MPEG-4 осуществляется аналогично MPEG-1 и MPEG-2. В этом смысле основа кодирования у группы алгоритмов MPEG общая. Основные идеи, применяемые в ходе сжатия видеоданных с ее помощью, следующие:

· Устранение временной избыточности видео, учитывающее тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены оказываются неподвижными или незначительно смещаются по полю.

· Устранение пространственной избыточности изображений путем подавления мелких деталей сцены, несущественных для визуального восприятия человеком.

· Использование более низкого цветового разрешения при yuv-предеставлении изображений (y — яркость, u и v — цветоразностные сигналы) — установлено, что глаз менее чувствителен к пространственным изменениям оттенков цвета по сравнению с изменениями яркости.

· Повышение информационной плотности результирующего цифрового потока путем выбора оптимального математического кода для его описания (например, использование более коротких кодовых слов для наиболее часто повторяемых значений).

Кроме того, основная идея заключается в разделении кадров на опорные (I — intra), а также так называемые предсказанные (то есть строящиеся на основе опорных) — как однонаправленные (P – predicted), так и двунаправлено предсказываемые (B – bi-directionally predicted) кадры (под направлением здесь следует понимать временную последовательность представления кадров видео).

Однако MPEG-4, кроме рассмотренного традиционного MPEG-кодирования, основанного на прямоугольных кадрах, использует технологию так называемого фрактального или контурно-основанного кодирования изображений.

1.3 Основыфрактального кодирования изображений

Для понимания принципов контурно-основанного кодирования изображений, применяющегося в MPEG-4, уясним себе несколько простых идей.

Контур — это линия, очерчивающая границу фигуры на плоскости. Текстура – представление структуры поверхности изображения. Контурно-основанное кодирование изображений представляет изображения как контуры, огибающие текстурные области (области, заполненные текстурами). А так как контуры, как правило, совпадают с границами изображаемых объектов сцены, то задача контурно-основанного кодирования сводится к задаче объектно-основанного кодирования изображений, а именно: изображение представляется набором составляющих его объектов.

Источник

Принципы кодирования видеоинформации

Вы будете перенаправлены на Автор24

Общие сведения

Видеоинформация — достаточно новый вид информации, которая с каждым днем все интенсивнее проникает во все сферы человеческой деятельности. По официальной статистике, каждый пятый человек в России ежедневно воспринимает видеоинформацию либо посредством телевизора, либо посредством персонального компьютера.

Под видеоинформацией можно понимать:

Любой видеоряд можно разложить на две составляющие: звуковую и графическую.

Наверняка у вас появился вопрос: какое отношение графическая информация имеет к видео? Необходимо очень хорошо уяснить следующий факт: для создания на экране эффекта движения применяется дискретная технология, обеспечивающая быструю смену статических картинок.

Научные исследования доказали, что если в течение одной секунды сменить около $15$ статических изображений, которые похожи друг на друга, то человеческий глаз воспринимает подобные изменения на них как аналоговые, то есть как непрерывные. На данном эффекте и реализуется любое современное видео.

Поскольку видеоинформация состоит из звуковой и графической компоненты, то и для обработки видеоматериалов требуется очень мощный персональный компьютер. Под обработкой видеоматериалов понимается процесс оцифровки, то есть кодирования видеоинформации.

После кодирования видеоинформация будет находиться в двоичном формате, а, как известно, процессор персонального компьютера только и способен взаимодействовать с любой информацией, которая является двоичным кодом. Двоичный код — последовательность бит, состоящая из $0$ и $1$.

Готовые работы на аналогичную тему

Алгоритм кодирования видеоинформации

Итак, представим, что в нашем распоряжении есть какая-либо видеоинформация. Как было ранее сказано, любую видеоинформацию можно дифференцировать, то есть разложить на две ключевые составляющие: звуковую и графическую. Следовательно, операция кодирования видеоинформации будет заключаться в сочетании операций кодирования звуковой информации и кодирования графической информации.

Как мы ранее узнали, видео — быстрая смена, как правило, похожих друг на друга статических изображений, называемых кадрами. Но в современном мире данный процесс стандартизирован, и все поставщики видеоконтента придерживается данных стандартов.

Не будем приводить все существующие стандарты, касающиеся частоты смены кадров, а лишь опишем два ключевых эталона в этой области:

В процессе киносъемок используют частоту смены кадров, равную $25$ раз в секунду. Подобным стандартом пользуются при производстве телепрограмм, телешоу, телерепортажей.

В процессе создания широкоформатного видеоконтента прибегают к частоте смены кадров, равной $30$ раз в секунду.

В первую очередь происходит разложение аналогового видеосигнала на две дорожки: звуковую и графическую. Давайте в качестве эксперимента примем частоту смены кадров $25$ раз в секунду. Это означает, что одна секунда видеопотока состоит из $25$ быстросменяющих друг друга статических изображения.

По сути, нет как такового отдельного алгоритма

кодирования видеоинформации, а есть симбиоз алгоритмов кодирования отдельно звука и отдельно графики.

После проведения операции цифрования звука и изображений на выходе получается бинарный, двоичный код, который будет понятен процессору персонального компьютера. Именно в формате двоичного кода наша видеоинформация и будет храниться на электронных носителях.

Если мы захотим проиграть видеоконтент на нашем персональном компьютере или другом устройстве, то нам придется провести операцию восстановления информации, то есть осуществить преобразование информации, записанной в двоичном коде в формат понятный человеку.

Единственное, на чем хотелось бы акцентировать внимание, это на том, что при просмотре видеоинформации мы одновременно и видим «картинку» и слышим звук.

Чтобы добиться синхронного исполнения звука и смены графических изображений процессор персонального компьютера выполняет эти операции в различных потоках. За счет этого происходит запараллеливание двух сигналов: звукового и графического, которые в совокупности образуют видеопоток.

Как найти информационный объем видеофайла

После проведения операции кодирования видеоинформации получается двоичный поток битов. Следовательно, операционной системе необходимо выделить некое пространство для хранения данного двоичного кода (этот двоичный код является дискретным форматом нашего аналогового видеофайла).

Общая формула расчета объема памяти, необходимой для хранения закодированного видеофайла:

Рассмотрим конкретный пример. Дан видеофайл, который длится $52$ секунды. Известно также, что частота смены кадров составляет $25$ раз в секунду. Каждый кадр представляет собой изображение, имеющее разрешение $1280$ на $1024$ пикселя. Также известно, что цвет кодируется в $24$-х битной RGB-модели. Частота дискретизации звука составляет $44.1$ КГц, а разрядность звуковой карты равна $2$ байта. Необходимо найти информационный объем данного видеофайла.

Решение:

Определим информационный объем звукового сигнала.

$V_<зв>= [Время \ звучания] \cdot [Разрядность \ звука] \cdot [Частоту \ дискретизации] = 52 \cdot 16 \cdot 44100 = 36691200 [бит] = 4586400 [байт] = 4478.90 [Кбайт] = 4.37 [Мбайт]$.

Определим информационный объем одного кадра.

$V_k= [Количество \ пикселей \ изображения] \cdot [Глубину \ цвета] = 1280 \cdot 1024 \cdot 24 = 31457280 [бит] = 3932160 [байт] = 3840 [Кбайт] = 3.75 [Мбайт]$.

Определим информационный объем заданного видеофайла.

$V_в= [Память, \ занимаемая \ звуковым \ сигналом] \cdot [Память, \ занимаемая \ одним \ кадром] \cdot [Количество \ кадров] = 4.37 \cdot 3.75 \cdot 25 = 409.69 [Мбайт] = 0.4 [Гбайт].$

То есть информационный объем заданного видеофайла составляет около $0.4$ Гигабайта. Файлы с видеоконтентом всегда были и будут «тяжелыми», следовательно, необходимо предусматривать пространство для их хранения.

Кстати, сам процесс кодирования видеоинформации занимает значительное время и зависит от характеристик процессора персонального компьютера. Среди всех земных профессий можно выделить профессию видеомонтажера, который наиболее интенсивно из всех занимается обработкой и отвечает за правильность кодирования видеоинформации.

Источник

Кодирование видеоинформации.

Видеоинформация формируется в результате организации потокового видео – последовательности «движущихся изображений». Оцифровка видеофрагмента связана с проблемами обеспечения очень больших скорости обмена и объема данных. Проблема повышения скорости обмена решается путем разработки быстродействующих накопителей данных. Для уменьшения объема данных, содержащихся в видеопотоке (до 9 Мб/с), для записи информации в ЭВМ обычно применяют кодирование со сжатием потока данных. Размер файла сжатого дискретного неподвижного изображения зависит от четырех параметров: площади изображения, разрешения, числа битов, необходимых для представления пикселя, и коэффициента сжатия. В видеофильме к этому еще добавляется число образующих его неподвижных изображений. Выбор коэффициента сжатия – компромисс между пропускной способностью системы и качеством восстанавливаемого изображения. Чем выше коэффициент сжатия, тем ниже качество изображения. Поэтому выбор указанных параметров обосновывается технико-экономическим анализом и алгоритмом сжатия.

Существует немало технологий сжатия/восстановления изображений. Наиболее популярная предложена объединенной группой экспертов в области фотографии (Joint Photographic Experts Group, JPEG) и позволяет сократить размеры графического файла в 10–12 раз. Для сжатия видеоинформации применяют технологию стандарта MPEG

(Motion Picture Expert Group). Алгоритм MPEG преобразует изображение η поток сжатых данных, учитывая то, что человек, видящий движущийся объект, сосредоточивает внимание на нем, а неподвижный фон воспринимает в меньшей степени. Это позволяет выделять меняющиеся и «замороженные» фрагменты в кадре: актер движется, а декорация не меняется, что позволяет экономить на размере информации, основную картинку оцифровать один раз, а далее фиксировать и передавать только изменения. Видеоформат MPEG-1, созданный в конце 1980-х гг. и использовавшийся в Video-CD, уступил место более качественному MPEG-2, а новый стандарт MPEG-4, разработанный фирмой Microsoft в 1999 г., и его модификация DivX позволили размещать видеофильм хорошего качества на обычном компакт-диске.

Мультимедиаинформация – сочетание текстовой, звуковой, графической, видеоинформации, представляемой на экране компьютера или мультимедиапроектора. Мультимедиаинформация обладает огромными объемами, поэтому сжимается программами сжатия, а перед воспроизведением восстанавливается, как говорят, «на лету» по мере поступления потока данных. Мультимедийные компьютерные программы позволяют формировать параллельные потоки информации: текстовой, визуальной и звуковой.

Источник