Способы сжатия звуковой информации реферат

Содержание
  1. Формат сжатия звука MP3
  2. Принципы сжатия звуковой информации на основе алгоритмов MPEG
  3. Описание математических методов кодирования и сжатия звуковой информации. Характеристика различных форматов звуковых данных. Сравнительный анализ различных форматов звуковой информации. Характеристика преимуществ и недостатков формата MPEG Layer III.
  4. Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
  5. 1.1 Магнитная запись
  6. Магнитофон
  7. Кассетный формат
  8. 1.2 Оптическая запись звука
  9. Фотографическая запись
  10. Рис.1.2 Фонограмма переменной плотности (слева) и фонограмма переменной ширины (справа)
  11. Лазерная запись
  12. 1.3 Магнитооптическая запись
  13. Минидиск
  14. В январе 2004 года, Sony анонсировала формат медианосителя Hi-MD, как дальнейшее развитие формата MiniDisc. Новый диск вмещал уже один Гигабайт данных и мог исользоваться не только для звукозаписи, но и для хранения документов, видео и фотографии. Появилась возможность выбирать из трех режимов записи: высококачественного (PCM mode), позволяющего записывать 94 минуты (1 час 34 мин) звуковых данных CD-качества, 7 часов в стандартном режиме записи (Hi-SP) со сжатием ATRAC, и низкокачественного режима (Hi-LP) с записью на 34 часа, помещенной на одном диске.
  15. 1.4 Заключение по 1-й главе
  16. История звукозаписи очень древняя и её можно изучить как отдельный предмет. Веками звук, в частности музыка была основной развлекательной культурным видом произведений. Запись и хранение музыкальных (звуковых) произведений все усовершенствовалось. Создавались все новые виды звуконосителей. Развитием науки в частности техники воспроизводились новые методы звукозаписи, совершенствовались и минимизировались микрофоны, кассеты, лазерные диски. Также не мало важную роль в этом внес создание персонального компьютера и различных звуковых карт. Не только записывался звук с концерта или оркестра, стало возможным создавать звуки музыкальных инстриментов посредством компьютерных программ.
  17. В данной главе были рассмотрена иерархия истории создания звукозаписи, в том числе такие составляющие данной иерархии как магнитная, оптическая, магнито-оптическая, лазерная запись звука. Были приведены исторния создани, а также особенности и техническое построение данных видов звукозаписи. С уверенностью можно сказать, что записи методов звукозаписи рассмотренные в первой главе можно оцифровать, редактировать и переформировать в различные цифровые звуковые форматы.
  18. Глава 2. Теоритические аспекты цифровой обработки звука
  19. 2.1 Цифровое преобразование звука
  20. Преимущества битового кода используются при передаче кодированного сигнала на расстояние, криптовании сигнала, цифровой подписи сигнала, восстановлении потерь, вызванной помехами при передаче, а также в прочих приложениях.
  21. Цифровая звукозапись — технология преобразования аналогового звука в цифровой с целью сохранения его на физическом носителе для возможности последующего воспроизведения записанного сигнала.
  22. Принцип цифровой звукозаписи методом периодической дискретизации и квантования сигнала
  23. Рис.2.1 Преобразование аналогового сигнала в цифровой в АЦП и обратное восстановление его в ЦАП
  24. Рис.2.2Структурная схема цифровой звукозаписи и воспроизведения
  25. Принцип цифрового представления колебаний звукозаписи достаточно прост:
  26. · вначале нужно преобразовать аналоговый сигнал в цифровой, это осуществляет устройство — аналого-цифровой преобразователь (АЦП)
  27. · произвести сохранение полученных цифровых данных на носитель: магнитную ленту (DAT), жёсткий диск, оптический диск или флеш-память
  28. · для того чтобы прослушать сделанную запись, необходимо воспроизведение сделанной записи с носителя и обратное преобразование из цифрового сигнала в аналоговый, с помощью цифро-аналогового преобразователя (ЦАП).
  29. Принцип действия АЦП тоже достаточно прост: аналоговый сигнал, полученный от микрофонов и электро-музыкальных инструментов, преобразовывается в цифровой. Это преобразование включает в себя следующие операции:
  30. 1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
  31. 2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
  32. 3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
  33. 4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.
  34. Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для качественной записи звука в полосе частот 20-20 000 Гц применяется минимальная стандартная частота дискретизации от 44,1 кГц и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192,3 и даже 384,6 кГц). Для получения довольно качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.
  35. Дискретизация сигнала во времени
  36. Поскольку все реально существующие непрерывные сигналы связи представляют собой случайные процессы с бесконечно широким спектром, причем основная энергия сосредоточена в относительно узкой полосе частот, перед дискретизацией необходимо с помощью фильтра нижних частот ограничить спектр сигнала некоторой частотой FВ. Для телефонных сигналов необходимо использовать ФНЧ с частотой среза FВ=3,4 кГц. Частота дискретизации для телефонных сигналов выбрана равной 8 кГц.
  37. Устройство, выполняющие дискретизацию во времени, называют устройством выборки и хранения (УВХ) (Рис. 8.21). УВХ могут выпускаться в интегральном исполнении. Вид сигналов в точках 1, 2 и 3 УВХ показан, соответственно, на Рис. 8.22, Рис. 8.23 и Рис. 8.24.
  38. Рис. 2.3 Устройство выборки и хранения
  39. Рис. 2.4 Аналоговый сигнал
  40. Рис. 2.4 Сигнал АИМ1
  41. Рис. 2.5 Сигнал АИМ2
  42. Квантование (англ. quantization) — в информатике разбиение диапазона значений непрерывной или дискретной величины на конечное число интервалов. Существует также векторное квантование — разбиение пространства возможных значений векторной величины на конечное число областей. Простейшим видом квантования является деление целочисленного значения на натуральное число, называемое коэффициентом квантования.
  43. Не следует путать квантование с дискретизацией (и, соответственно, шаг квантования с частотой дискретизации). При дискретизации изменяющаяся во времени величина (сигнал) замеряется с заданной частотой (частотой дискретизации), таким образом, дискретизация разбивает сигнал по временной составляющей (на графике — по горизонтали). Квантование же приводит сигнал к заданным значениям, то есть, разбивает по уровню сигнала (на графике — по вертикали). Сигнал, к которому применены дискретизация и квантование, называется цифровым.
  44. Квантование часто используется при обработке сигналов, в том числе при сжатии звука и изображений.
  45. Рис.2.6 Неквантованный сигнал с дискретным временем
  46. Рис.2.7 Квантованный сигнал
  47. Рис.2.8 Цифровой сигнал
  48. При оцифровке сигнала уровень квантования называют также глубиной дискретизации или битностью. Глубина дискретизации измеряется в битах и обозначает количество бит, выражающих амплитуду сигнала. Чем больше глубина дискретизации, тем точнее цифровой сигнал соответствует аналоговому. В случае однородного квантования глубину дискретизации называют также динамическим диапазоном и измеряют в децибелах (1 бит ? 6 дБ).

Формат сжатия звука MP3

Методы сжатия звуковой информации

Сжатие звуковых данных

Сжатие аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Сжатие звуковых данных (сжатие аудио) — тип сжатия данных, кодирования, применяемая для уменьшения объема аудиофайлов или для возможности уменьшения полосы пропускания для потокового аудио. Алгоритмы сжатия звуковых файлов реализуются в компьютерных программах, называемых аудиокодеками. Изобретение специальных алгоритмов сжатия звуковых данных мотивировано тем, что общие алгоритмы сжатия неэффективны для работы со звуком и делают невозможным работу в реальном времени.

Как и в общем случае, различают сжатия звука без потерь, что делает возможным восстановление исходных данных без искажений, и сжатие с потерями, при котором такое восстановление невозможно. Алгоритмы сжатия с потерями дают большую степень сжатия, например audio CD может вместить не более часа «несжатой» музыки, при сжатии без потерь CD вместит почти 2 часа музыки, а при сжатии с потерями при среднем битрейте — 7-10 часов.

Сжатие без потерь

Сложность сжатия звука без потерь заключается в том, что записи звука являются чрезвычайно сложными в своей структуре. Одним из методов сжатия является поиск образцов и их повторений, однако этот метод не эффективен для более хаотических данных, которыми являются, например оцифрованный звук или фотографии. Интересно, что если сгенерированная компьютером графика значительно легче поддается сжатию без потерь, то синтезированный звук в этом отношении не имеет преимуществ. Это объясняется тем, что даже сгенерированный компьютером звук обычно имеет очень сложную форму, которая представляет сложную задачу для изобретения алгоритма.

Другая сложность заключается в том, что звучание обычно меняется очень быстро и это также является причиной того, что упорядоченные последовательности байтов появляются очень редко.

Наиболее распространенными форматами сжатия без потерь являются:
Free Lossless Audio Codec (FLAC), Apple Lossless , MPEG-4 ALS , Monkey’s Audio , и TTA .

Сжатие с потерями

Сжатие с потерями имеет чрезвычайно широкое применение. Кроме компьютерных программ, сжатие с потерями используется в потоковом аудио в DVD, цифровом телевидении и радио и потоковому медиа в интернете.

Новацией этого метода сжатия было использование психоакустики для обнаружения компонентов звучания, которые не воспринимаются слухом человека. Примером могут служить или высокие частоты, которые воспринимаются только при достаточной их мощности, или тихие звуки, возникающие одновременно или сразу после громких звуков и поэтому маскируются ними — такие компоненты звучания могут быть переданы менее точно, или и вообще не переданы.

Для осуществления маскировки сигнал из временной последовательности отсчетов амплитуды превращается в последовательность спектров звуков, в которых каждый компонент спектра кодируется отдельно. Для осуществления такого преобразования используются методы быстрого преобразования Фурье, МДКП, квадратурной-зеркальных фильтров или другие. Общий объем информации при таком перекодировании остается неизменным. Сжатие в определенной частотной области может заключаться в том, что замаскированные или нулевые компоненты не запоминаются вообще, или кодируются с меньшим разрешением. Например, частотные компоненты в до 200 Гц и более 14 кГц могут быть закодированы с 4-битной разрядностью, тогда как компоненты в среднем диапазоне — с 16 битной. Результатом такой операции станет кодирования со средней разрядностью 8-бит, однако результат будет значительно лучше, чем при кодировании всего диапазона частот с 8-битной разрядностью.

Однако очевидно, что перекодированные с низким разрешением фрагменты спектра уже не могут быть восстановлены в точности, и, таким образом, теряются безвозвратно.
Главным параметром сжатия с потерями является битрейт, определяющий степень сжатия файла и, соответственно, качество. Различают сжатия с постоянным битрейтом ( англ. Constant BitRate — CBR), переменным битрейтом ( англ. Variable BitRate — VBR) и усереденим битрейтом ( англ. Average BitRate — ABR).

Наиболее распространенными форматами сжатия с потерями являются: AAC, ADPCM, ATRAC, Dolby AC-3, MP2, MP3, Musepack Ogg Vorbis, WMA и другие.

Формат сжатия звука MP3

MPEG-1 Audio Layer 3 Расширение файла: .mp3 Тип MIME: audio/mpeg Тип формата: Audio

MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.

На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата.

Читайте также:  Самый простой способ приготовления холодца

Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.

MP3 разработан рабочей группой института Фраунгофера (нем. Fraunhofer-Institut f?r Integrierte Schaltungen) под руководством Карлхайнца Бранденбурга и университета Эрланген-Нюрнберг в сотрудничестве с AT&T Bell Labs и Thomson (Джонсон, Штолл, Деери и др.).

Основой разработки MP3 послужил экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding). Первым кодировщиком в формат MP3 стала программа L3Enc, выпущенная летом 1994 года. Спустя один год появился первый программный MP3-плеер — Winplay3.

При разработке алгоритма тесты проводились на вполне конкретных популярных композициях. Основной стала песня Сюзанны Веги «Tom’s Diner». Отсюда возникла шутка, что «MP3 был создан исключительно ради комфортного прослушивания любимой песни Бранденбурга», а Вегу стали называть «мамой MP3».

В этом формате звуки кодируются частотным образом (без дискретных партий); есть поддержка стерео, причём в двух форматах (подробности — ниже). MP3 является форматом сжатия с потерями, то есть часть звуковой информации, которую (согласно психоакустической модели) ухо человека воспринять не может или воспринимается не всеми людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компакт-диска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100 Гц.

MP3 и «качество Audio-CD»

В прошлом было распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека) (стандарт не устанавливает алгоритм кодирования, только описывает способ представления). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усредненный битрейт) и VBR (Variable Bitrate — переменный битрейт). В-третьих, граница 128 кбит/c является условной, так как она была «изобретена» в эпоху становления формата, когда качество воспроизведения звуковых плат и компьютерных колонок как правило было ниже, чем в настоящее время.

Дата добавления: 2017-01-29 ; просмотров: 7945 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Источник

Принципы сжатия звуковой информации на основе алгоритмов MPEG

Описание математических методов кодирования и сжатия звуковой информации. Характеристика различных форматов звуковых данных. Сравнительный анализ различных форматов звуковой информации. Характеристика преимуществ и недостатков формата MPEG Layer III.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 26.05.2018
Размер файла 1,0 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Государственной коммитет связи информатизации и телекоммуникационных технологий республики узбекистан

Ташкентский Университет Информационных Технологий

Выпускная квалификационная работа

Тема: Принципы сжатия звуковой информации на

Выпускник ________ Урунбаев Ш.Н.

Научный руководитель ________ Алимов Д.Б.

Рецензент ________ Абдурахманов Б. Э

ТАШКЕНТ — 2013 г.

Государственной коммитет связи, информатизации и телекоммуникационных технологий республики узбекистан

ТАШКЕНТСКИЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Факультет Телевизионных технологий, кафедра «Компьютерная графика и дизайн» Направление (специальность) 5525700 — «Технология звукозаписи»

Зав кафедрой Нуралиев Ф.М.

«____» _______________2013 г.

на выпускную квалификационную работу

Урунбаев Шарофиддин Низомиддинович

(фамилия, имя, отчество)

1.Тема работы: Принципы сжатия звуковой информации на основе_______ алгоритмов MPEG

2.Утверждена приказом по университету от « _4_» 02.2013 г. Б № 110

4.Исходные данные к работе Введение. Различные методы и способы звукозаписи. Теоритические аспекты цифровой обработки звука и форматы цифровых звуковых файлов. БЖД. Заключение. Список используемой литературы.

5. Содержание расчетно-пояснительной записи (перечень подлежащих разработке вопросов

6. Перечень графического материала презентация

7. Дата выдачи задания 5 февраль 2013 г.

8. Консультанты по отдельным разделам выпускной работы

2. Различные методы и способы звукозаписи

3. Теоретические аспекты цифровой обработки звука

4. Форматы цифровых звуковых файлов

5. Безопасность жизнедеятельности

9. График выполнения работы

Наименование раздела работы

Отметка руководителя о выполнении

Различные методы и способы звукозаписи

Теоретические аспекты цифровой обработки звука

Форматы цифровых звуковых файлов

Выпускник _____________ «____» _____________2013г.

Руководитель ___________ «____» _____________2013г.

Данная выпускная квалификационная работа посвящена принципам сжатия звуковой информации на основе алгоритмов MPEG.Также были описаны математические методы кодирования и сжатия звуковой информации. В данной работе были рассмотрены различные форматы звуковых данных. Был сделан сравнительный анализ форматов звуковой информации. Были выявлены преимущества и недостатки формата MPEG Layer III.

Ушбу битирув малакавий иши MPEG алгоритмлари асосида товушли ахбротни си?иш принципларига ба?ишланган. Шунингдек товушли ахборотнинг кодлаш ва си?ишнинг математик моделлари таърифланган. Ушбу ишда турли хил товуш ахборотлари форматлари келтирилган. Товушли ахборот форматларининг та??осий та?лили амалга оширилган. MPEG Layer III форматининг афзалликлари ва камчиликлари ани?ланган.

In given exhaust qualification work is dedicated to principle of the compression to sound information on base algorithm MPEG. Also, the mathematical methods of the coding were described and compressions to sound information is given. In given functioning were considered different formats sound data. There is made benchmark analysis format sound information. The advantage and defect of the format MPEG Layer III were revealled.

Изучить формирования звука в цифровом виде, алгоритмы и форматы цифровой звукозаписи

На сегодняшний день проблема избрания единого цифрового формата звукозаписи так и для озвучивания компьютерных игр и приложений так и для массового прислуживания имеет свой приоритет. Исходя из этого изучния алгоритмов и формирования формата MPEG и других форматов является актуальной

1. Рассмотреть принципы оцифровки звука

2. Изучить алгоритмы формирования звука формата MPEG и Ogg Vorbis

3. Произвести сравнительный анализ разных звуковых форматов

В наше время активного развития электронных технологий и внедрения их в бытовые изделия широкого потребления, в частности, в мультимедийную технику: цифровые плееры, фотоаппараты, камеры, остро встает вопрос об удобстве хранения цифровой информации, передачи по различным интерфейсам и протоколам и, естественно, о ее сжатии. Существует достаточно много форматов сжатия аудио сигнала. Среди них наиболее известные:

? MP3 (MPEG-1 layer 3);

? WMA (Windows Media);

Безусловно, MP3 сейчас является самым распространённым форматом сжатия аудио. Но вовсе не потому, что он — лучший по качеству звучания или компрессии. Просто исторически сложилось так, что он появился на рынке намного раньше других форматов. Еще одна весомая причина — это инертность производителей разнообразной мультимедийной техники, не желающих вводить новые аудиоформаты. Если судить по проведенным тестам независимых исследователей, то выявляется другой лидер — Ogg Vorbis [1,2].

И MP3 и Vorbis основаны на разбиении сигнала на сегменты и применении к каждому сегменту дискретного преобразования Фурье с использованием психоаккустического фильтра и алгоритмов кодирования (Huffman, VQ), но отличаются реализацией. В перспективе развития разработчики кодека Ogg Vorbis планируют привлечь вэйвлет-технологию сжатия цифровых аудиоданных.

Естественным образом возникла идея изучить вэйвлет-анализ (анализ всплесков), активно внедряющийся в сферы обработки одномерных и двумерных сигналов, научиться использовать его на практике, а также попробовать применить оптимизационный метод в целях решения поставленной задачи.

Для сжатия звука, можно использовать следующие методы или их комбинации.

1) Трешолдинг — отбрасывание близких к нулю коэффициентов в разложении сигнала.

2) Округление коэффициентов. Естественно, за сжатие надо оплатить потерей качества, которая возникает из-за округления. Желательно, чтобы восстановленный сигнал как можно меньше отличался от исходного. Поэтому, одной из главных задач становится оценка значимости того или иного коэффициента в разложении относительно остальных и, соответственно, определение точности его хранения.

3) Подбор преобразования, обеспечивающего наименьший суммарный объем хранимого числа разрядов.

4) Подбор разбиения сигнала, обеспечивающего наименьший суммарный объем хранимого числа разрядов. Есть гипотеза, о том, что можно сэкономить суммарное количество разрядов, подбирая сегменты разбиения так, чтобы сигнал совпадал по фазе с некоторыми базисными функциями. Следовательно, коэффициенты при других базисных функциях будут близкими к нулю. Для нахождения оптимального разбиения можно использовать подходящий оптимизационный метод, например, динамическое программирование.

Глава1.Различные методы и способы звукозаписи

1.1 Магнитная запись


Магнитофон

Рис.1.1 Студийный катушечный магнитофон

В 1927 году немецкий инженер Фриц Пфлеймер (Fritz Pfleumer), после ряда экспериментов с различными материалами, сделал напыление порошком оксида железа на тонкую бумагу с помощью клея. В 1928 году он получил патент за применение магнитного порошка на полоске бумаги или кинопленке. В этом же 1928-м году он демонстрирует свой прибор магнитной записи с бумажной лентой публике. Бумажная лента хорошо намагничивалась и размагничивалась, её можно было обрезать и склеивать. В 1936-м году Национальный суд Германии признал права по патенту Пфлеймера недействительными, так как покрытие бумажной ленты железным порошком было изложено ещё в патенте Паульсена от 1898-го года.

В 1932 году компания AEG, взяв на вооружение идею Пфлеймера, начала производство прибора для магнитной записи под названием «Магнетофон-К1». Носителем в «Магнетофоне-К1» была пленка, которую изготавливал немецкий химический концерн BASF. «Магнетофон-К1» был представлен публике в 1935-м году на радиовыставке в Берлине.

В 1939 году BASF представил публике плёнку, покрытую порошком оксида железа. Это было революционно. Параллельно этому инженер Уолтер Вебер работал над улучшением качества воспроизведения Магнитофонов, производимых AEG. Он проводил эксперименты с подмагничиванием пленки. Опытным путем было доказано, что высокочастотное подмагничивание переменным током намного улучшает качество воспроизведения. Весной 1940-го года Вебер получает патент на технологию высокочастотного подмагничивания переменным током, и уже в 1941-м году AEG выпускает новую модель Магнитофона: Magnetophon K4-HF. Технические характеристики этой модели аппарата магнитной записи превосходили все существовавшие тогда аппараты магнитной записи: благодаря открытой Вебером технологии, уровень сигнал-шум составил 60 Дб, а воспроизводить он уже мог частоты выше 10 кГц.

В 1942-м году AEG начала проводить эксперименты по записи звука в стерео формате.

В 30-40-х гг. XX века получили развитие бобинные магнитофоны, причём имелись уже и портативные модели, с конца 50-х гг. — картриджные, а с конца 60-х гг. — кассетные. Цифровые магнитофоны появились в конце 70-х гг.

Магнитная пленка открыла массу новых возможностей для манипулирования звуком музыкантам, композиторам, продюсерам и инженерам. Магнитная пленка была относительно дешевым и очень надежным звуконосителем. И звучала она лучше, чем любые другие звуконосители того времени. Но самое важное то, что магнитная пленка была так же удобна в работе как и кинопленка.

Кассетный формат

Первый кассетный формат, использовавший ленту, склеенную в бесконечную петлю, был запатентован в 1952 году.

Читайте также:  Стрибки у высоту способом переступания

В 1963 году компания Philips представила новый формат кассеты для звукозаписи, вышедший на рынок под названием «компакт-кассета» (англ. Compact Cassette). Опасаясь ответного хода конкурентов из Sony, Philips предпочёл отказаться от платы за лицензии на производство кассет, что и привело к массовому распространению нового формата.

В 1965 году фирма Grundig выпустила на рынок очень похожую кассету DC International и магнитофоны под нее. Конкуренции с компакт-кассетой этот формат не выдержал и через несколько лет сошел со сцены.

Принципиальным преимуществом компакт-кассеты перед 4- и 8-дорожечными картриджами была простота механизма магнитофона. Бытовые 8-дорожечные магнитофоны могли только воспроизводить ленты, а для записи требовались профессиональные аппараты. Поэтому, несмотря на теоретически худшее качество звучания (из-за вдвое меньшей скорости протяжки), на практике к середине 1970-х годов компакт-кассеты захватили рынок даже в США.

В 1971 году компания Advent Corporation впервые представила кассету c магнитной лентой на основе оксида хрома(IV). Появление этих кассет кардинально изменило судьбу этого вида носителей аудиоинформации. Качество звука на них было намного выше. Это привело к появлению кассет с записанной на них (в фабричных условиях) музыкой (фонограммой), кроме того, кассеты начали использоваться для самостоятельной записи музыки.

1.2 Оптическая запись звука


Фотографическая запись


Рис.1.2 Фонограмма переменной плотности (слева) и фонограмма переменной ширины (справа)

В 1919 году американский изобретатель Ли де Фомрест подал свой первый патент на процесс озвучивания фильмов, в котором усовершенствовал разработку финского изобретателя Эрика Тигерштедта и немецкой компании Tri-Ergon, и назвал этот процесс «Фонофильм Фореста». В «Фонофильме» звук записывается непосредственно на плёнку в виде параллельных линий различных оттенков серого цвета. Позже такой метод стал известен как метод «переменной плотности» в отличие от метода «переменной ширины» в системе «RCA Фотофон», разработанной в RCA. Эти линии кодируют электрические сигналы от микрофона и наносятся фотографическим способом на плёнку, а во время демонстрации фильма переводятся обратно в звуковые волны.

В ноябре 1922 года Форест организовал в Нью-Йорке свою компанию Фонофильм, но ни одна из голливудских студий не выразила никакого интереса к его изобретению. Тогда Форест создал 18 коротких звуковых фильмов, и 23 апреля 1923 года организовал их показ в театре Риволи в Нью-Йорке. Макс и Дэйв Флейшеры использовали процесс «Фонофильм» в своём музыкальном трюковом мультсериале «Вслед за грохочущим шаром», начиная с мая 1924 года. Форест работал вместе с Фриманом Оуэнсом и Теодором Кейсом, совершенствуя систему «Фонофильм». Однако, они потерпели неудачу. Кейс передал их патенты владельцу студии Fox Film Corporation Вильяму Фоксу, который затем усовершенствовал собственный процесс озвучивания «Мувитон». В сентябре 1926 г. компания Фонофильм подала документы на банкротство. Голливуд к тому времени внедрил новый метод озвучивания «Витафон», разработанный компанией Warner Brothers, и выпустил 6 августа 1926 г. звуковой фильм «Дон-Жуан» с Джоном Бэрримором в главной роли.

В 1927 -1928 годах, Голливуд начал использовать для озвучивания фильмов системы «Мувитон» Фокса и «Фотофон» RCA. Между тем, владелец сети кинотеатров Великобритании Шлезингер приобрёл права на «Фонофильм», и с сентября 1926 г. по май 1929 г. выпускал короткометражные музыкальные фильмы британских исполнителей.

Лазерная запись

При помощи лазерного луча на вращающийся оптический диск записываются цифровые сигналы. В результате записи на диске образуется спиральная дорожка, состоящая из впадин (питов) и гладких участков. В режиме воспроизведения лазерный луч, сфокусированный на дорожку, перемещается по поверхности вращающегося оптического диска и считывает записанную информацию. При этом впадины считываются как нули, а ровно отражающие свет участки — как единицы. Такой метод записи обеспечивает практически полное отсутствие помех и высокое качество звучания. По сравнению с механической и магнитной звукозаписью оптический диск имеет целый ряд преимуществ — очень высокую плотность записи и полное отсутствие механического контакта между носителем и считывающим устройством в процессе записи и воспроизведения.

В марте 1979 года на пресс-конференции компания Philips продемонстрировала качество звука прототипа системы компакт-диск. Через неделю в Японии заключило соглашение с фирмой Sony по созданию стандарта на аудиодиск. В 1980 году Philips и Sony после некоторых доработок выпускают их Red Book (красную книгу), которая была положена в основу стандарта на звуковой компакт-диск. В апреле 1982 года Philips представил свой первый компакт-диск проигрыватель. В этом же году на заводе в Германии началось массовое производство компакт-дисков. Совершенно новый носитель информации, заменивший грампластинки, стал основой для будущих поколений оптических дисков, применяемых не только для хранения звукозаписей, но и для видео, медиаинформации и в компьютерных системах.

1.3 Магнитооптическая запись


Минидиск

Минидиск был разработан и впервые представлен компанией Sony 12 января 1992 года. Позиционировался как замена компакт-кассетам, к тому времени уже полностью изжившим себя.

В январе 2004 года, Sony анонсировала формат медианосителя Hi-MD, как дальнейшее развитие формата MiniDisc. Новый диск вмещал уже один Гигабайт данных и мог исользоваться не только для звукозаписи, но и для хранения документов, видео и фотографии. Появилась возможность выбирать из трех режимов записи: высококачественного (PCM mode), позволяющего записывать 94 минуты (1 час 34 мин) звуковых данных CD-качества, 7 часов в стандартном режиме записи (Hi-SP) со сжатием ATRAC, и низкокачественного режима (Hi-LP) с записью на 34 часа, помещенной на одном диске.


1.4 Заключение по 1-й главе


История звукозаписи очень древняя и её можно изучить как отдельный предмет. Веками звук, в частности музыка была основной развлекательной культурным видом произведений. Запись и хранение музыкальных (звуковых) произведений все усовершенствовалось. Создавались все новые виды звуконосителей. Развитием науки в частности техники воспроизводились новые методы звукозаписи, совершенствовались и минимизировались микрофоны, кассеты, лазерные диски. Также не мало важную роль в этом внес создание персонального компьютера и различных звуковых карт. Не только записывался звук с концерта или оркестра, стало возможным создавать звуки музыкальных инстриментов посредством компьютерных программ.


В данной главе были рассмотрена иерархия истории создания звукозаписи, в том числе такие составляющие данной иерархии как магнитная, оптическая, магнито-оптическая, лазерная запись звука. Были приведены исторния создани, а также особенности и техническое построение данных видов звукозаписи. С уверенностью можно сказать, что записи методов звукозаписи рассмотренные в первой главе можно оцифровать, редактировать и переформировать в различные цифровые звуковые форматы.


Глава 2. Теоритические аспекты цифровой обработки звука


2.1 Цифровое преобразование звука


Преимущества битового кода используются при передаче кодированного сигнала на расстояние, криптовании сигнала, цифровой подписи сигнала, восстановлении потерь, вызванной помехами при передаче, а также в прочих приложениях.


Цифровая звукозапись — технология преобразования аналогового звука в цифровой с целью сохранения его на физическом носителе для возможности последующего воспроизведения записанного сигнала.


Принцип цифровой звукозаписи методом периодической дискретизации и квантования сигнала


Рис.2.1 Преобразование аналогового сигнала в цифровой в АЦП и обратное восстановление его в ЦАП


Рис.2.2Структурная схема цифровой звукозаписи и воспроизведения


Принцип цифрового представления колебаний звукозаписи достаточно прост:


· вначале нужно преобразовать аналоговый сигнал в цифровой, это осуществляет устройство — аналого-цифровой преобразователь (АЦП)


· произвести сохранение полученных цифровых данных на носитель: магнитную ленту (DAT), жёсткий диск, оптический диск или флеш-память


· для того чтобы прослушать сделанную запись, необходимо воспроизведение сделанной записи с носителя и обратное преобразование из цифрового сигнала в аналоговый, с помощью цифро-аналогового преобразователя (ЦАП).


Принцип действия АЦП тоже достаточно прост: аналоговый сигнал, полученный от микрофонов и электро-музыкальных инструментов, преобразовывается в цифровой. Это преобразование включает в себя следующие операции:


1. Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.


2. Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.


3. Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.


4. Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.


Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для качественной записи звука в полосе частот 20-20 000 Гц применяется минимальная стандартная частота дискретизации от 44,1 кГц и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192,3 и даже 384,6 кГц). Для получения довольно качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.


Дискретизация сигнала во времени


Поскольку все реально существующие непрерывные сигналы связи представляют собой случайные процессы с бесконечно широким спектром, причем основная энергия сосредоточена в относительно узкой полосе частот, перед дискретизацией необходимо с помощью фильтра нижних частот ограничить спектр сигнала некоторой частотой FВ. Для телефонных сигналов необходимо использовать ФНЧ с частотой среза FВ=3,4 кГц. Частота дискретизации для телефонных сигналов выбрана равной 8 кГц.


Устройство, выполняющие дискретизацию во времени, называют устройством выборки и хранения (УВХ) (Рис. 8.21). УВХ могут выпускаться в интегральном исполнении. Вид сигналов в точках 1, 2 и 3 УВХ показан, соответственно, на Рис. 8.22, Рис. 8.23 и Рис. 8.24.


Рис. 2.3 Устройство выборки и хранения


Рис. 2.4 Аналоговый сигнал


Рис. 2.4 Сигнал АИМ1


Рис. 2.5 Сигнал АИМ2


Квантование (англ. quantization) — в информатике разбиение диапазона значений непрерывной или дискретной величины на конечное число интервалов. Существует также векторное квантование — разбиение пространства возможных значений векторной величины на конечное число областей. Простейшим видом квантования является деление целочисленного значения на натуральное число, называемое коэффициентом квантования.


Не следует путать квантование с дискретизацией (и, соответственно, шаг квантования с частотой дискретизации). При дискретизации изменяющаяся во времени величина (сигнал) замеряется с заданной частотой (частотой дискретизации), таким образом, дискретизация разбивает сигнал по временной составляющей (на графике — по горизонтали). Квантование же приводит сигнал к заданным значениям, то есть, разбивает по уровню сигнала (на графике — по вертикали). Сигнал, к которому применены дискретизация и квантование, называется цифровым.


Квантование часто используется при обработке сигналов, в том числе при сжатии звука и изображений.


Рис.2.6 Неквантованный сигнал с дискретным временем


Рис.2.7 Квантованный сигнал


Рис.2.8 Цифровой сигнал


При оцифровке сигнала уровень квантования называют также глубиной дискретизации или битностью. Глубина дискретизации измеряется в битах и обозначает количество бит, выражающих амплитуду сигнала. Чем больше глубина дискретизации, тем точнее цифровой сигнал соответствует аналоговому. В случае однородного квантования глубину дискретизации называют также динамическим диапазоном и измеряют в децибелах (1 бит ? 6 дБ).

Сжатие (компрессия) аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения статистической и психоакустической избыточности цифрового звукового сигнала.

Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а, соответственно, методы сокращения психоакустической избыточности — сжатием с потерями.

Сжатие без потерь

Сокращение статистической избыточности основано на учете свойств самих звуковых сигналов. Она определяется наличием корреляционной связи между соседними отсчетами цифрового звукового сигнала, устранение которой позволяет сокращать объем передаваемых данных на 15. 25% по сравнению с их исходной величиной. Для передачи сигнала необходимо получить более компактное его представление, что возможно осуществить с помощью ортогонального преобразования. Важными условиями применения такого метода преобразования являются:

· возможность восстанавливать исходный сигнал без искажений

· способность обеспечивать наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования

· быстрый вычислительный алгоритмом

Этим требованиям отвечает модифицированное дискретно-косинусное преобразование (МДКП).

Уменьшить скорость цифрового потока позволяют методы кодирования, учитывающие статистику звуковых сигналов, например, вероятности появления уровней разной величины. Одним из таких методов является код Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются кодовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты звукового сигнала, а коэффициенты МДКП.

Подобные методы применяются при архивации файлов.

Структура кодера сжатия аудиоданных с потерями

Рис.2.9 Обобщенная структура кодера звукового сигнала с компрессией цифровых аудиоданных

· Исходный цифровой звуковой сигнал разделяется на частотные поддиапазоны и сегментируется по времени в блоке временной и частотной сегментации.

· Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется так называемая длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустической энтропии сигнала.

· После сегментации сигналы частотных поддиапазонов нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не сами отсчеты выборки звукового сигнала, а соответствующие им коэффициенты МДКП.

· Учет закономерностей слухового восприятия звукового сигнала выполняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого частотного поддиапазона рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данного поддиапазона.

· Блок динамического распределения бит в соответствии с требованиями психоакустической модели для каждого поддиапазона кодирования выделяет такое минимально возможное их количество при котором уровень искажений, вызванных квантованием, не превышал порога их слышимости, рассчитанного психоакустической моделью.

· Также могут использоваться:

o матрицирование стерео — сложение и вычитание левого и правого канала для устранения повторяющейся информации

o специальные процедуры итерационных циклов, позволяющие управлять величиной энергии искажений квантования в поддиапазонах при недостаточном числе доступных для кодирования бит

o процедуры линейного и обратного адаптивного предсказаний

o техника сглаживания переходных шумов во временной области (Temporal Noise Shaping — TNS), позволяющая управлять микроструктурой искажений квантования внутри каждого поддиапазона кодирования

Многие другие приёмы могут послужить способом сократить объём данных звуковой информации. Даже простое сужение полосы частот сигнала вместе с уменьшением динамического диапазона может уже называться сжатием аудиоданных. Например, в стандарте сжатия звука в сотовой связи используется и то и другое. Стремясь удалить избыточность из звука, кодек при плохом качестве сигнала становится избирателен к определённым словам, упорно проглатывая их.

Кодирование и обработка звуковой информации

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Рис. 2.10 Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10 14 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица «децибел» (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 2.1 Громкость звука

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 1.2).

Рис. 2.11 Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 I . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 I = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

2.3 Теория преобразования звука в стандартах MPEG и Orbis

Алгоритм сжатия сегмента сигнала

Рассмотрим процедуру сжатия одного сегмента сигнала. В зависимости от количества каналов в исходном звуковом файле, на вход подается один (моно) или два (стерео) массива чисел длины N. Эти числа будем называть сэмплами (от англ. sample). На выходе, после обработки, мы получаем Nb байтов закодированного сигнала. Сама же обработка массивов состоит из последовательности шагов, каждый из которых рассмотрим отдельно.

сигнал стерео битовой вэйвлет

Для понимания техники вэйвлет-разложения введем некоторые понятия. С более подробным изложением основных понятий вэйвлет-анализа можно ознакомиться в приложении или в [7]. Рассмотрим две функции f и y—из L2(R), удовлетворяющие некоторым свойствам, описанным в приложении, где fмасштабирующая функция, а yвэйвлет. Каждую функцию f из L2(R) можно приблизить функциями <f—(2—p—k—)—:—k—О—Z> с любой наперед заданной точностью, выбрав достаточно большое значение

Коэффициенты <A p> называются аппроксимирующими коэффициентами.

Будем называть функции f—(2—p—-1—x—k—)—, соответствующие фиксированному p функциями p-го уровня.

Функции f и y обладают таким свойством, что масштабирующие функции р-го уровня выражаются через масштабирующие функции и вэйвлет-функции р-1-го уровня и наоборот:

где последовательности <ak> и <bk> называются последовательностями разложения, а <pk> и <qk> — последовательности восстановления.

Следовательно, используя (1.1.2) мы можем переписать (1.1.1) как

где коэффициенты <D—p—-1> называются детализирующими коэффициентами. Отметим, что коэффициенты Ap-1 и коэффициенты Dp-1 можно получить из коэффициентов Ap, используя (1.1.5) и (1.1.6), причем применение (1.1.6) называется сгущающей выборкой, то есть, применив (1.1.5), мы оставляем лишь те коэффициенты, которые имеют четный индекс. Продолжая этот процесс, получаем следующую схему расчетов коэффициентов:

В итоге мы получили вэйвлет-разложение, то есть набор последовательностей коэффициентов Dp-1, Dp-2, …, Dp-q, Ap-q.

Используя обратные соотношения между функциями ? и ? (1.1.3) и (1.1.4) мы можем построить обратный процесс:

Условимся называть аппроксимирующие и детализирующие коэффициенты Aj и Dj коэффициентами j-го уровня. Следуя теории вэйвлетов, для вэйвлет-разложения, сначала необходимо аппроксимировать сигнал с требуемой точностью на верхнем уровне. Пусть этот уровень имеет индекс 0. Предположим, нам дано N сэмплов, и необходимо получить N аппроксимирующих коэффициентов для дальнейшего разложения по алгоритму, описанному выше. Аппроксимировав сигнал на нулевом уровне, мы получим аппроксимирующие сигнал коэффициенты нулевого уровня <A0 >. Предположим для простоты, что N = 2q, qОN. В соответствии с алгоритмом разложения, описанным выше, получаем A-1 и D-1. Заметим, что в алгоритме используется сгущающая выборка (берутся коэффициенты с четными номерами), поэтому в массивах A-1 и D-1 содержится по N/2 элементов. Аналогично, массивы A-2 и D-2 будут содержать по N/4 элементов. На последнем шаге A-q и D-q содержат по одному элементу. Таким образом, мы получили вэйвлет-разложение A-q, D-q, D-q+1, …, D2, D1, в котором по-прежнему N элементов (1+1+2+4+8+…+2q-1 = 2q = N).

Заметим, что последовательности разложения <ak> и <bk> могут иметь более двух элементов, и в процессе вычисления коэффициентов нижестоящего уровня соответственно (1.1.5) и (1.1.6) они могут евыходитьъ за пределы массива A-j j = 0, 1, …, q-1 (рис 1.1):

Рис. 2.12 Алгоритм разложения

Один из способов разрешения ситуации — это замыкание массива A? j в кольцо. Для этого достаточно взять остаток от деления индекса на длину массива. Так, для получения последнего элемента массива Aj—-1 будут использованы два последних и два первых элемента массива Aj . Этот метод позволяет взаимно-однозначно преобразовывать j = 0, 1, …, j-1. Aj в Aj—-1—и—Dj—-1—, и обратно, Мы рассмотрели тот случай, когда N = 2q. Если же N нечетное, то на первом же шаге у нас не будет взаимно-однозначного соответствия между A0 , где N элементов и ( A-1—,—D-1 ) где N-1 элемент. Решение следующее: Если на каком-то шаге j массив Aj имеет нечетное число элементов, то расширим массив путем добавления в конец одного элемента с произвольным значением, например, равным значению последнего элемента A? j для обеспечения непрерывного расширения. Здесь возникает избыточность информации, но она минимальна, так как число дополнительных коэффициентов не превышает log2(N).

Отметим также, что трудоемкость алгоритмов вэйвлет-разложения и вэйвлет-восстановления равна O(N). Даже по сравнению с быстрым преобразованием Фурье (БПФ), трудоемкость которого равна O(Nlog2N), описанный алгоритм работает значительно быстрее.

Дискретное преобразование Фурье

Определение 1.1. Дана конечная последовательность x0, x1, x2, . xN-1 комплексных чисел. Дискретное преобразование Фурье (ДПФ) заключается в поиске последовательности X0, X1, X2, . XN-1, элементы которой вычисляются по формуле:

Определение 1.2. Дана конечная последовательность X0, X1, X2, . XN-1 комплексных чисел. Обратное дискретное преобразование Фурье заключается в поиске последовательности x0, x1, x2, . xN-1, элементы которой вычисляются по формуле:

При помощи дискретного преобразования Фурье можно получить спектр сигнала, то есть коэффициенты при синусах и косинусах в разложении Фурье. Основным свойством преобразования Фурье (см., например, [7]) является обратимость, то есть если из последовательности <xk> при прямом преобразовании получается последовательность <Xk>, то при обратном преобразовании из <Xk> получится исходная последовательность <xk>.

Отметим, что данное преобразование имеет трудоемкость O(N2) для набора чисел длины N, однако его можно оптимизировать так, что трудоемкость составит M22T + NT, где N = M2T (см. [8]).

Преобразование и оценка коэффициентов

Пусть мы имеем массив коэффициентов <ck>, k = 0, 1, …, N-1, и этот массив нормализован, в том смысле, что |ck|

Источник

Оцените статью
Разные способы