- Кодирование звука
- Звук как колебания, в частности, воздуха, представляющие собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Оценка информационного объема моно- и стереоаудиофайла. Распространенные способы сжатия звуковых файлов, их эффективность.
- Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
- Подобные документы
- Кодирование звуковой информации
Кодирование звука
Звук как колебания, в частности, воздуха, представляющие собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Оценка информационного объема моно- и стереоаудиофайла. Распространенные способы сжатия звуковых файлов, их эффективность.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 27.09.2015 |
Размер файла | 15,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
звук кодирование колебание
Как известно, звук — это колебания, в частности, воздуха, представляющие собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем громче звук для человека; чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, такой непрерывный (аналоговый) звуковой сигнал должен быть преобразован в последовательность электрических импульсов (двоичных нулей и единиц). Для кодирования непрерывного звукового сигнала производится его дискретизация по времени (временная дискретизация, оцифровка). Непрерывная звуковая волна разбивается на отдельные короткие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Это выполняется устройством, называемым аналогово-цифровым преобразователем (АЦП), который измеряет напряжение поступающего с микрофона звукового сигнала через равные промежутки времени и записывает полученные значения (в виде многоразрядных двоичных чисел) в память компьютера. В результате, непрерывная зависимость амплитуды сигнала от времени заменяется на дискретную последовательность значений уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек». Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование, для которого служит цифро-аналоговый преобразователь (ЦАП), а затем сгладить получившийся ступенчатый сигнал (через аналоговый фильтр).
Каждой «ступеньке» присваивается значение уровня громкости (амплитуды) звука, его код (1, 2, 3, и т.д.). Таким образом, при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Уровни громкости звука можно рассматривать как набор возможных состояний. Соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание. Поэтому, как и в случае с графической информацией, при кодировании звука важное значение имеет «глубина» кодирования звука. Например, при 16—битной глубине кодирования (когда каждому значению амплитуды звукового сигнала присваивается 16—битный код) количество обеспечиваемых различных уровней сигнала (состояний) можно определить следующим образом: N = 216 = 65536.
Качество кодирования зависит также от количества измерений уровня сигнала в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования звуковой информации. Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц.
Оценить информационный объем моноаудиофайла (V) можно следующим образом:
где N — общая длительность звучания (секунд), f — частота дискретизации (Гц), k — глубина кодирования (бит). Например, при длительности звучания 1 минуту и среднем качестве звука (16 бит, 24 кГц).
V = 60*24000*16 бит = 23040000 бит = 2880000 байт = 2812,5 Кбайт = 2,75 Мбайт.
Оценить информационный объем стереоаудиофайла (V) можно следующим образом:
где N — общая длительность звучания (секунд), f — частота дискретизации (Гц), k — глубина кодирования (бит). Например, при длительности звучания 1 минуту и среднем качестве звука (32 бит, 48 кГц).
V = 60*48000*32 бит = 92160000 бит = 11520000 байт = 1250 Кбайт = 10,99 Мбайт.
При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объем звукового файла в два раза по сравнению с монозвуком.
Наиболее распространенным форматом закодированных описанным способом звуковых файлов является Wave-формат (расширение файлов — .wav). Такой способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами. Но существуют и другие способы кодирования звука. В 1983 г. ведущие производители компьютеров и музыкальных синтезаторов для кодирования инструментальной музыки разработали стандарт (систему кодов), получивший название MIDI (Musical Instrument Digital Interface — цифровой интерфейс для музыкальных инструментов). В основе этой системы кодирования лежит принцип нотной записи музыкальных произведений.
Нотная запись, прежде всего, описывает следующие свойства музыкальных звуков:
· высоту звучания (в физическом смысле — частоту колебаний звука), которая кодируется положением нотного значка на нотных линейках;
· длительность звучания, которая кодируется видом ноты (пустая / закрашенная, без штиля/со штилем, без флажка/с флажками и т.п.).
Система кодирования MIDI представляет собой набор всевозможных команд для различных музыкальных инструментов. Таким образом, запись музыкального произведения в формате MIDI — это программа игры на воображаемом музыкальном инструменте-синтезаторе, состоящая из последовательности закодированных сообщений, разделенных закодированными паузами. При таком кодировании нельзя записать вокальное произведение, так как звуки, издаваемые певцом или хором, не входят в систему команд исполнителя-синтезатора. Но имеются и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии. В исходном звуковом файле (например, в.wav-файле) хранится полная информация об оцифрованном звуке. При высоком качестве звука объем таких файлов чрезвычайно велик (около 15Мб на 1 минуту звучания). Поэтому разработаны различные способы сжатия звуковых файлов. Наиболее популярным форматом, обеспечивающим высокую степень сжатия звуковых файлов при сохранении высокого качества звучания является формат MP3 (MPEG Layer-3) (расширение файлов — .mp3), разработанный учеными из немецкого университета им. Фраугофера. Принципы сжатия основаны на удалении невоспринимаемых или плохо воспринимаемых человеком звуков. При использовании этого формата одна песня занимает в среднем 3,5 Мб и, например, на стандартный компакт-диск (CD-ROM) помещается около 200 музыкальных композиций.
Размещено на Allbest.ru
Подобные документы
Формат звукового файла wav, способ его кодирования. Реализация возможностей воспроизведения звука в среде программирования MATLAB. Составление функциональной схемы программы. Апробирование информационной технологии воспроизведения звуковых файлов.
курсовая работа [1,2 M], добавлен 13.02.2016
Основные сведения о звуковых волнах, их характеристики и спектральное представление звука. Виды искажений, помехи и шумы. Состав звуковых плат. Назначение и стандарты midi-систем. Запись и передача звука, формат mp3. Основные программные интерфейсы.
курс лекций [811,6 K], добавлен 08.07.2010
Восприятие звуковых раздражений. Частота, амплитуда, фаза как характеристики звука. Представление и способы передачи цифровой информации. Особенности дискретизации звука. Способы записи информации: бит в бит; сжатие; структура болванки CD-R; запись CD-R.
реферат [23,4 K], добавлен 10.11.2009
Понятие звука, физиологические и психологические основы его восприятия человеком. Основные критерии и параметры звука: громкость, частота, пространственное положение источника, гармонические колебания. Система пространственной обработки звука EAX.
презентация [952,3 K], добавлен 10.08.2013
Архивация и компрессия как методы сжатия изображений. Алгоритмы сжатия данных. Вспомогательные средства, которые используются для понижения объемов файлов: изменение цветовой модели изображения, изменение разрешения растрового файла, ресемплирование.
презентация [45,3 K], добавлен 06.01.2014
Понятие звуковой информации как кодирования звука, в основе которого лежит процесс колебания воздуха и электрического тока. Величина слухового ощущения (громкость). Временная дискретизация звука, ее частота. Глубина и качество звуковой информации.
презентация [545,6 K], добавлен 13.05.2015
Понятие процесса архивации файлов. Программы, осуществляющие упаковку и распаковку файлов. Защита информации от несанкционированного доступа. Самораспаковывающиеся архивы. Основные характеристики программ-архиваторов. Распространенные алгоритмы сжатия.
презентация [801,6 K], добавлен 23.10.2013
Источник
Кодирование звуковой информации
7. Кодирование звуковой информации
Развитие способов кодирования звуковой информации, а также движущихся изображений – анимации и видеозаписей – происходило с запаздыванием относительно рассмотренных выше разновидностей информации.
Компьютер – это цифровое устройство, то есть электронное устройство, в котором рабочим сигналом является дискретный сигнал. Сегодняшние компьютеры оперируют дискретными сигналами, несущими двоичные значения, условно обозначаемые как «да» и «нет» (на электрическом уровне: 0 вольт и V вольт, для некоторого ненулевого значения V). С помощью одного двоичного сигнала за один шаг можно передать информацию об одном из всего двух положений: 0 («да») или 1 («нет»). С помощью N двоичных сигналов за один шаг можно передать информацию об одном из 2 N положений (2 N – это число комбинаций нулей и единиц для N сигналов). Взаимодействие всех составляющих компьютер блоков происходит путем обмена и обработки одним или одновременно несколькими двоичными сигналами. Все – коды управления, а также сама обрабатываемая информация – все представляется в компьютере в виде чисел. По этой причине и аудио сигналы в цифровой аппаратуре представляют в виде чисел.
Итак, каким же образом можно описать аналоговый аудио сигнал в цифровой форме? Реальный аудио сигнал – это сложное по форме колебание, некая сложная зависимость амплитуды звуковой волны от времени. На рис. 2 представлен график реальной звуковой волны.
Рис.2. Изображение реальной звуковой волны
Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Поступим следующим образом. Будем измерять напряжение через равные промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой).
Преобразование аналогового звукового сигнала в цифровой вид называется аналогово-цифровым преобразованием или оцифровкой. Процесс такого преобразования заключается в:
· осуществлении замеров величины амплитуды аналогового сигнала с некоторым временным шагом – дискретизация,
· последующей записи полученных значений амплитуды в численном виде – квантование.
Процесс дискретизации по времени — это процесс получения мгновенных значений преобразуемого аналогового сигнала с определенным временным шагом, называемым шагом дискретизации.
Чем выше частота дискретизации (т. е. количество отсчетов за секунду) и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.
Количество осуществляемых в одну секунду замеров величины сигнала называют частотой дискретизации или частотой выборки, или частотой сэмплирования (от англ. « sampling» – «выборка»). Очевидно, что чем меньше шаг дискретизации, тем выше частота дискретизации (то есть, тем чаще регистрируются значения амплитуды), и, значит, тем более точное представление о сигнале мы получаем.
Ухо человека не замечает ступенчатость полученного сигнала. Тут можно провести следующую аналогию. Каждый человек смотрел в кинотеатре фильмы, и перед его глазами на экране шло непрерывное, плавное действие: Но ведь на самом-то деле кинолента представляет собой серию неподвижных, дискретных изображений, которые прокручиваются с высокой скоростью 24 кадра в секунду. Поскольку человеческим глазам свойственна некоторая инерционность, то их легко обмануть, чем необычайно ловко пользуются кинематографисты. Наши уши тоже в какой-то степени не идеальны, и их можно обмануть подобным образом, представляя непрерывный аналоговый сигнал в виде последовательности быстро сменяющихся мгновенных значений напряжения. Только в отличие от киноленты смена «звукового кадра» происходит в тысячи раз быстрее. Для полной маскировки ступенчатости сигнала применяются фильтры нижних частот, сглаживающие форму волны.
Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс называется квантованием по амплитуде. Говоря более формальным языком, квантование по амплитуде – это процесс замены реальных (измеренных) значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Квантование значений сигнала привносит в спектр сигнала дополнительную помеху, называемую шумом квантования или шумом дробления. Шумом (ошибкой) квантования называют сигнал, составляющий разницу между восстановленным цифровым и исходным аудио сигналами. Эта разница образуется в результате округления измеренных значений сигнала. При этом выполняется следующая закономерность: чем выше разрядность квантования, тем ниже уровень шума квантования (поскольку тем на меньшее значение требуется округлять каждое измеренное значение сигнала). Природа шума квантования такова, что ширина спектральной области, в которой он простирается, пропорциональна значению частоты дискретизации.
Рис. 3. Процесс оцифровки звукового сигнала
Устройство, выполняющее оцифровку называют аналого-цифровым преобразователем (АЦП). Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь (ЦАП), а затем сгладить получившийся ступенчатый сигнал.
Рис.4. Процесс кодирования и декодирования звуковой волны
Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами.
В современное время все упирается в вычислительную мощность современной цифровой техники. С возрастанием точности оцифровки одновременно возрастает скорость потока цифровых данных, увеличивается вычислительная нагрузка на процессор и требуется повышенный объем памяти для хранения цифровых отчетов. Имеются и серьезные схемотехнические трудности. Вместе со стремительным ростом компьютерных технологий становится возможным применять более высокие частоты дискретизации и разрядность. Цифровой звук широко применяется в современной звукозаписывающей индустрии благодаря хорошему качеству звучания, высокой помехозащищенности и удобству хранения и архивирования материала.
В настоящее время при записи звука в мультимедийных технологиях применяются частоты 8, 11, 22 и 44 кГц. Так, частота дискретизации 44 килогерца означает, что одна секунда непрерывного звучания заменяется набором из сорокачетырех тысяч отдельных отсчетов сигнала. Чем выше частота дискретизации, тем лучше качество оцифрованного звука.
Как отмечалось выше, каждый отдельный отсчет можно описать некоторой совокупностью чисел, которые затем можно представить в виде некоторого двоичного кода. Качество преобразования звука в цифровую форму определяется не только частотой дискретизации, но и количеством битов памяти, отводимых на запись кода одного отсчета. Этот параметр принято называть разрядностью преобразования.
Методов сжатия (форматов), а также программ реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3),MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA),TwinVQ (VQF), MPEGPlus, TAC, и прочие.
В настоящее время обычно используется разрядность 8,16 и 24 бит.
На описанных выше принципах основывается формат WAV (от WAVeform-audio – волновая форма аудио) кодирования звука. Получить запись звука в этом формате можно от подключаемых к компьютеру микрофона, проигрывателя, магнитофона, телевизора и других стандартно используемых устройств работы со звуком. Однако формат WAV требует очень много памяти. Так, при записи стереофонического звука с частотой дискретизации 44 килогерца и разрядностью 16 бит – параметрами, дающими хорошее качество звучания, – на одну минуту записи требуется около десяти миллионов байтов памяти.
Кроме волнового формата WAV, для записи звука широко применяется формат с названием MIDI (Musical Instruments Digital Interface – цифровой интерфейс музыкальных инструментов). Фактически этот формат представляет собой набор инструкций, команд так называемого музыкального синтезатора – устройства, которое имитирует звучание реальных музыкальных инструментов. Команды синтезатора фактически являются указаниями на высоту ноты, длительность ее звучания, тип имитируемого музыкального инструмента и т. д. Таким образом, последовательность команд синтезатора представляет собой нечто вроде нотной записи музыкальной мелодии. Получить запись звука в формате MIDI можно только от специальных электромузыкальных инструментов, которые поддерживают интерфейс MIDI. Формат MIDI обеспечивает высокое качество звука и требует значительно меньше памяти, чем формат WAV.
Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3). Формат завоевал свою популярность совершенно заслуженно – это был первый распространенный кодек, который достиг столь высокого уровня компрессии при отличном качестве звучания. Сегодня этому кодеку имеется множество альтернатив, но выбор остается за пользователем. Преимущества MP3 – широкая распространенность и достаточно высокое качество кодирования,
которое объективно улучшается благодаря разработкам различных кодеров MP3 энтузиастами. Мощная альтернатива MP3 – кодек Microsoft Windows Media Audio (Файлы .WMA и .ASF). По различным тестам этот кодек показывает себя от «как MP3» до «заметно хуже MP3» на средних битрейтах, и, «лучше MP3» на низких битрейтах.
На сегодня совершенно очевидно лишь одно – цифровые технологии находятся лишь в начале своего пути, и нам еще только предстоит понять, что значит их повсеместное внедрение совместно с миниатюризацией, наращиванием вычислительных мощностей и объемов памяти.
Совершенно ясно, что цифровые технологии очень скоро завоюют новые, еще не захваченные рубежи, и что от повсеместного применения этих технологий никуда не деться. Опасаться этого процесса можно, но сопротивляться ему бесполезно.
Цифровые же технологии пока еще очень молоды, и только это позволяет «аналогу» еще оставаться на плаву. Достаточно быстрое развитие и постоянное удешевление цифровых устройств дает основание утверждать, что совсем скоро «цифра» полностью вытеснит аналоговые методы записи и обработки информации. Только представьте себе, как развитие этих технологий может повлиять на окружающий нас мир! Все это лишь укрепляет мысли о том, что путь не близок, и что самое интересное нам еще только предстоит увидеть.
Список использованной литературы
3. Сергей Арзуманов. Секреты гитарного звука, Москва, 2003.
4. Симонович С.В. и др. Информатика. Базовый курс, «Питер», 2000.
Источник