АНАЛОГОВЫЙ ЗВУК
Аналоговый звук: погоня за совершенством
Аналоговый звук – священная корова аудиофилов. Это звук, записанный на носитель без цифровой трансформации электромеханическими способами и таким же образом воспроизводимый. Аналоговых источников существует всего два – магнитофон и виниловый проигрыватель. Люди, которые всю жизнь слушали компакт диски, и услышали однажды качественный аналоговый тракт, в первый момент теряют дар речи, а потом восклицают: «Как же нас обманули с этой цифрой! Это же небо и земля!» Довольный произведенным эффектом владелец аналогового тракта начинает объяснять неофиту, что «музыка в цифре порезана на кусочки и таким образом убита, и только аналог – это первозданный звук». Пресвященный неофит долго носится с этим открытием, потом случайно слышит где-нибудь цифровой тракт, который напрочь перебивает услышанный до этого аналог, и впадает в смятение. Где же истина?
Любая новая технология на первых порах недостаточно совершенна. Вспомните первые цифровые фотоаппараты, которые покупали редкие отважные смельчаки – сделанные с их помощью фотографии получились гораздо хуже пленочных. Формат компакт-диска начал активно продвигаться на рынок в начале девяностых годов. К этому времени почти все студии звукозаписи использовали цифровые рекордеры для записи и сведения музыки. Почти все виниловые пластинки, выпущенные после 1984 года, записаны при помощи цифровой техники, и ни о каком «аналоге» там уже не может быть речи. Звучат они при этом все равно лучше компакт дисков. Почему? Дело в том, что компакт-диск — достаточно ущербный формат. Объем информации, который на нем можно записать, требует сильной компрессии и урезания динамического диапазона. Музыка втискивается в прокрустово ложе серебристой болванки и лишается объема и послезвучий. Самое заметное отличие звука компакт-диска от виниловой пластинки (даже записанной с помощью цифры) – звучание тарелочек. На пластинке всегда слышно затухание звука, в то время как на компакт диске тарелочный «цик» получается подрезанным и звучит звонко, но не так приятно – слишком «металлически». Также из-за подрезания динамического диапазона на компакт диске, по сравнению с пластинкой, всегда недостает баса.
Сегодняшние технологии позволяют получать цифровые файлы очень высокого разрешения с очень большой частотой дискретизации. Файлы высокого разрешения hd-tracks гораздо полновеснее компакт дисков – там есть и послезвучия на верхах, и хороший бас, и объем, но… На виниловой пластинке музыкальной информации все равно больше, и звучит она лучше. В то же время запись, сделанная с помощью профессиональной цифровой техники без компрессии, звучит на хорошей аппаратуре настолько реалистично, что ее невозможно отличить на слух не только от «аналоговой записи», но даже от живого исполнения. Так что дело не в «нарезке музыки на кусочки», а в количестве кусочков, которые попадают на конечный носитель. Исходный студийный файл огромного объема – это 100% звука и полное соответствие реалистичному звучанию. Хорошая современная виниловая пластинка – это 70% от исходника. Файл hd-track – 50% Компакт диск – всего 25%. Про МP3 нечего говорить – там остаются жалкие 5-10%, которых, впрочем, многим достаточно.
Совершенно иначе обстоит дело с записями, сделанными в 60-70 и начале 80 годов. Аналоговые технологии в то время достигли расцвета, и возможности цифры приблизились к этому уровню только сейчас. По этой причине виниловые пластинки 70 годов звучат гораздо глубже, объемнее и естественнее виниловых пластинок середины восьмидесятых – цифровые технологии только появились и стали вытеснять аналоговые, но результат долгое время оставлял желать лучшего. При переводе записей 60-70 годов на компакт диски были использованы первые цифровые устройства, и музыка была просто убита. Именно этим объясняется шок, который испытывают большинство меломанов, впервые услышав аналоговое звучание любимой музыки. Что в 90% случаев ставят на аналоговый тракт? Led Zeppelin, Pink Floyd, Jethro Tull, Yes – музыку 70х Вся эта музыка прошла варварскую цифровую обработку на первобытных цифровых устройствах и буквально изуродована. Слушать ее на компакт дисках – значит не знать, как она может звучать. Дело не в том, что DEEP PURPLE на компакт диске «порезали на кусочки», а в том, что на кусочки для компакт диска резали отвратительно ремастированную и обрезанную по динамическому диапазону фонограмму. Достаточно послушать, как звучит, к примеру, оригинальный винил Machine Head, чтобы понять всю глубину потерь. Плохо звучит не цифра, а ПЛОХАЯ ЦИФРА. При этом, если тот же самый Machine Head воспроизвести с винила и записать на профессиональный цифровой рекордер с частотой 5.6 Мгц, то разница будет почти незаметна. Очень искушенное ухо услышит легкий «цифровой шум», выражающийся в чуть более резком звучании, но для большинства слушателей разницы не будет. Так что «священный аналоговый звук» ценен не тем, что музыка в нем «не порезана», а тем, что позволяет без потерь услышать оригинальную запись 60-70-80 годов. Разумеется, при условии, что вы ставите оригинальную пластинку на хороший виниловый тракт с качественным звукоснимателем и хорошим фонокорректором. Звучание виниловой пластинки на посредственном тракте не только не раскроет всех плюсов аналога, но, скорее всего, вчистую проиграет компакт диску.
Что касается новодельных виниловых пластинок – всех этих красивых глянцевых переизданий классических альбомов аналоговой эпохи – это абсолютно ненужные приобретения. Такие пластинки записаны с тех же уродливых цифровых фонограмм, что и компакт-диски, и по сути являются «виниловым вариантом компакт диска», разве что с чуть большим динамическим диапазоном. Только этим (чуть большим динамическим диапазоном) объясняется некоторое звуковое преимущество новодельных пластинок перед компактами, но оно настолько ничтожно, что городить ради этого виниловый тракт не имеет смысла. Разумнее скачивать файлы hd-tracks и слушать их через хороший ЦАП – такой звук значительно превзойдет и CD и новодельный винил.
Еще несколько слов про магнитофоны. Любители кассетных дек замечают, что цифровая музыка, записанная на кассету, звучит приятнее. Это правда. Дело в том, что очень мало кто может слушать профессиональные цифровые файлы, записанные с частотой 5.6 МГц, и на кассеты пишут или с компакт дисков, или с файлов 48000 Hz 24 bit. В такой музыке содержится сильный «цифровой шум», не слышимый ухом, но действующий на подсознание, которое не дает вам полностью расслабиться. Пленка этот шум сглаживает, и музыка как будто «вливается» в вас. Этот эффект отмечают все, кто слушал всю жизнь цифру и вдруг услышал звучание хорошей кассетной деки. Дело не в том, что вы услышали «аналог» — ведь запись сделана с цифры. Вы просто услышали музыку без «цифрового шума», и ваше подсознание перестало подспудно пребывать в напряжении. Чтобы услышать с кассеты настоящий аналоговый звук, запись должна быть сделана с виниловой пластинки аналоговой эпохи или с магнитофонной мастер ленты.
Источник
Цифровое представление аналогового аудиосигнала. Краткий ликбез
Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.
Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.
Чем отличается цифровой аудиосигнал от аналогового?
Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).
Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).
Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).
Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).
Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).
Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).
Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)
Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).
Данная формула позволяет вычислить количество уровней квантования:
Если N — количество уровней квантования,
n — разрядность, то
Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.
При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.
Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением и квантованным значением
(
)
Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).
Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).
Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).
Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.
50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.
Теперь о дискретизации.
Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).
Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.
Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?
Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.
Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.
Аудиопример 4: Линейно возрастающая частота от
100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.
Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг
Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.
Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.
Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):
Битрейт = Частота дискретизации * Разрядность * Количество каналов
Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s
При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.
При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.
Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.
При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.
ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.
Существуют 3 метода хранения цифрового аудиоматериала:
- Несжатые («сырые») данные
- Данные, сжатые без потерь
- Данные, сжатые с потерями
Несжатый (RAW) формат данных
содержит просто последовательность бинарных значений.
Именно в таком формате хранится аудиоматериал в Аудио-CD. Несжатый аудиофайл можно открыть, например, в программе Audacity. Они имеют расширение .raw, .pcm, .sam, или же вообще не имеют расширения. RAW не содержит заголовка файла (метаданных).
Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.
Аудиоформаты с сжатием без потерь
Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.
Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.
Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).
Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…
При сжатии с потерями
акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».
Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.
Этим и пользуется кодек: 2kHz-звук можно убрать.
Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…
Источник