- Лекция 14. Архивирование и методы сжатия информации
- 14.1. Что такое архивирование
- 14.2. Какие существуют методы архивирования
- 14.3. Какими возможностями обладают архиваторы
- 14.4. Как сжать звуковые файлы
- 14.5. Как сжать графические файлы
- Что такое архив, архивация файлов/данных, и архиваторы
- Что такое архив
- Подвиды архивов
- Что такое архивация файлов и данных
- Что такое архиватор
- Виды архиваторов — лучшие программы
- WinRAR
- WinZip
- HaoZip
- В заключение
- 1. Архивация данных
Лекция 14. Архивирование и методы сжатия информации
14.1. Что такое архивирование
Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Архивация необходима не только для экономии памяти, но и для надежного хранения копий ценной информации, для быстрой передачи информации по сети.
Архивирование (упаковка, сжатие) это процесс записи файла в архивный файл, разархивирование (распаковка) — процесс извлечения файла из архива. Архив — упакованный (сжатый) файл. |
Архивация информации это такое преобразование информации, при котором объем информации уменьшается, а количество информации остается прежним. |
Степень сжатия информации зависит от типа файла и от выбранного метода упаковки. Степень (качество) сжатия файлов характеризуется коэффициентом сжатия:
Vc — объем сжатого файла, Vи — объем исходного файла.
Проблемы архивации тесно связаны с проблемами кодирования (замена символов текста двоичными кодами с помощью кодовой таблицы), шифрования (криптография), компрессией звуковых и видео-сигналов.
14.2. Какие существуют методы архивирования
Все используемые методы сжатия информации можно разделить на два класса:
- упаковка без потерь — исходную информацию можно точно восстановить по имеющейся упакованной информации;
- упаковка с потерей информации — распакованное сообщение будет отличаться от исходного сообщения.
В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, две простые идеи.
Первая идея основана на учете частот символов , она разработана Д. А. Хаффманом а 1952 году. Эта идея базируется на том факте, что в обычном тексте частоты появления различных символов неодинаковы. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие — длинными. К каждому сжатому архиву прикладывается таблица соответствия символов и кодов.
Вторая идея упаковки состоит в использовании того факта, что в сообщениях часто встречаются несколько подряд идущих одинаковых байтов , а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида «повторить данный байт n раз» (при упаковке графической информации) или «взять часть текста длиной k байтов, которая встречалась m байтов назад» (при упаковке текстовой информации). Такой алгоритм архивации называется RLE (кодирование путем учета повторений) .
14.3. Какими возможностями обладают архиваторы
Средства архивации-разархивации, как правило, обеспечивают:
- создание архива;
- обслуживание архива (добавление файлов, удаление файлов из архива, замену файлов в архиве и т.п.);
- извлечение файлов из архива;
- автоматическую архивацию и разархивацию поддерева файловой структуры;
- тестирование целостности архивов;
- создание многотомных архивов с возможностью задания произвольного размера тома;
- создание самораспаковывающихся архивов;
- создание пароля для доступа к архиву;
- работу с частично разрушенными архивами.
Каждый архиватор обычно реализует свой собственный уникальный алгоритм сжатия.
14.4. Как сжать звуковые файлы
Для уменьшения размеров мультимедийных файлов используют процедуру сжатия .
Cжатие (уплотнение, компрессия) это такое преобразование информации, в результате которого исходный файл уменьшается в объеме, а количество информации в сжатом файле уменьшается на такую небольшую величину, которой практически можно пренебречь. |
Компрессия без потерь используется, например, архиваторами ZIP, RAR, ARJ. Применение подобных алгоритмов для сжатия файлов, содержащих оцифрованный звук, не позволяет получить сжатие более чем в 2 раза.
Звуковой сигнал, преобразованный с помощью АЦП, обычно не повторяет сам себя и по этой причине плохо сжимается с помощью алгоритмов сжатия без потерь. Многие приемы сжатия аудиоинформации основываются на обмане органов чувств человека путем исключения избыточной и нформации, которую человек не способен воспринять (в силу своих физиологических особенностей).
Такие методы относятся к классу компрессии с потерями . Они не ставят цель абсолютно точного восстановления формы исходных колебаний. Их главная задача — достижение максимального сжатия звукового сигнала при минимальных слышимых искажениях восстановленного после с жатия сигнала.
Звуковой файл можно сжать с помощью компадирования , которое заключается в сжатии по амплитуде исходного звукового сигнала и последующем его восстановлении с помощью расширителя. Значение амплитуды звука заменяется логарифмом этого значения. Полученные числа округляются, и для их записи требуется меньшее число разрядов. Для воспроизведения сжатого сигнала, его подвергают потенцированию (преобразование, обратное логарифмированию).
Еще один способ сжатия звукового сигнала заключается в том, что исходный звуковой сигнал очищается с помощью фильтров от неслышимых компонент (например, низкие басовые шумы). Затем производится более сложный анализ сигнала: вычисляются и удаляются замаскированные частоты, заглушенные другими мощными сигналами. Таким образом можно исключить до 70% информации из сигнала, практически не изменив качество его звучания.
Есть и другие способы, так же основанные на свойствах человеческого слуха.
Если звуковой сигнал представляет собой однотонные звуки с постоянным уровнем громкости, то биоакустические свойства слуха не позволяют его сжать. В этом случае дают эффект традиционные методы архивации информации, например, алгоритм Хаффмана.
14.5. Как сжать графические файлы
Методы сжатия видеоинформации разделяются на две группы, в зависимости от скорости упаковки изображения:
- сжатие неподвижных изображений может выполняться с любой скоростью, т.к. этот процесс не регламентирован во времени, в силу статичности изображения.
- сжатие движущихся изображений должно выполняться, как правило, в режиме реального времени по мере ввода данных.
Стандарт JPEG позволяет сократить размеры графического файла с неподвижным изображением в 10-20 раз. Этим методом удается при специальных действиях сжимать и движущиеся изображения.
Источник
Что такое архив, архивация файлов/данных, и архиваторы
Практически все начинающие пользователи компьютера в определенный момент задаются вопросом, «что такое архив и архивация?» и, что это за такие программы, «архиваторы», которые позволяют с ними работать.
Если вы хотите узнать, что же это на самом деле такое, то эта статья вам несомненно поможет. После ее прочтения, вы станете хоть немного, да лучше, разбираться в компьютерных технологиях.
Сегодня мы детально рассмотрим, что такое архив, какие бывают архиваторы и зачем вообще нужна архивация файлов и данных.
Что такое архив
Архив по своей сути — это файл-контейнер, в котором можно хранить другие различные виды файлов, которые, попадая в него, благодаря сжатию, еще и уменьшаются в размере.
Как выглядит изнутри
Архивы используют для удобной организации хранения файлов и папок, для уменьшения их размера, для создания различных резервных копий, а также, для передачи файлов через интернет. Все это — благодаря тому, что в архивах полностью сохраняется вся структура каталогов и файлов, что позволяет с комфортом с ними работать.
Подвиды архивов
1. Самораспаковывающийся архив. По своей сути — это исполняемый файл в формате «.EXE». Достаточно запустить его, и он сам распакуется там, где вы укажете.
2. Многотомный архив. Состоит из нескольких частей, т.е. разбит на несколько частей-файлов. Его удобно использовать на файлах большого размера, например, чтобы поместить на нескольких носителях меньшего размера.
3. Запароленный архив. Как ясно из названия, чтобы открыть его, потребуется ввести пароль. Очень удобен для защиты своей информации.
4. Непрерывный архив. Все элементы в нем рассматриваются как одно целое, что дает увеличение в степени сжатия. Но есть и минусы — чтобы извлечь из него какой-то один элемент, придется ждать пока распакуются все остальные, соответственно, и при добавлении нового, время также будет дольше.
Что такое архивация файлов и данных
Архивация (архивирование) — это процесс создания архива путем упаковывания в него файлов, может происходить как со сжатием данных, так и без. Сами заархивированные данные при разархивировании никак не меняются от их первоначального состояния.
Архивация делается посредством специальных программ «Архиваторов», но также присутствует в ОС Windows по умолчанию. Но, к сожалению в Windows, вы сможете создать архив только в формате «.ZIP», что не всегда удобно, т.к., большинство архивов делается в другом популярном формате «.RAR».
Архивирование идеально поможет вам увеличить место на вашем винчестере, привести в порядок множество файлов и организовать рабочее пространство на компьютере.
Что такое архиватор
Архиватор — это специальная программа предназначенная, чтобы упаковывать файлы в архив при этом сжимая их в размере или наоборот распаковать их оттуда.
Программа, чтобы безопасно и без всяких потерь восстановить все файлы из архива, при его создании сохраняет метаданные файлов, такие как: название, время создания, права доступа и т.д. Также, хорошие архиваторы используют только сжатие без потерь для уменьшения веса архива, что в дальнейшем позволяет распаковывать данные с точностью до бита без потери качества.
В зависимости от типа файлов, программа будет по разному их сжимать, некоторые будут сжиматься, как текстовые, что даст значительное уменьшение их размера, а некоторые, как бинарные. Бинарные, сжимаются всегда по разному, все зависит от их характера, так, некоторые могут быть сильно уменьшены в размере, а некоторые в силу своих особенностей практически не уменьшаться.
Виды архиваторов — лучшие программы
WinRAR
Наверное самый известный и популярный архиватор из всех. Славится в первую очередь своим интерфейсом и функционалом, но так же имеет высокую скорость работы с хорошей степенью сжатия. Распространяется полностью на русском языке и включает в себя поддержку практически всех известных типов архивов, например таких как: «.RAR», «.ZIP», «.7z» и т.д.
Благодаря интуитивно понятному интерфейсу, ВинРАР идеально подойдет для новичков.
WinZip
Софт не менее известный, чем WinRAR, но имеющий при этом просто ошеломляющий функционал. Позволяет работать практически со всеми популярными форматами архивов и имеет русский интерфейс. По своим характеристикам сжатия, можно сказать так — если у вас есть 1 ГБ фото, то с помощью ВинЗип вы сможете уменьшить их вес с выгодой до 100мб, в конечном счете получив 900мб.
Также, отличительной особенностью данного софта, является синхронизация с облачными сервисами, что достаточно удобно. Но, к сожалению, бесплатный период использования ограничен.
Достаточно популярный софт такого рода, к тому же еще и бесплатный. Обладает довольно внушительным функционалом и собственным форматом сжатия — «.7z». Кроме своего формата, имеется поддержка и других «.RAR», «.ZIP» и т.д. Обладает довольно простым и лаконичным интерфейсом, но это не делает его менее привлекательным, благодаря простоте использования.
Как и все обозреваемые в этой статье программы работает на русском языке и с хорошей скоростью работы.
HaoZip
Практически полная копия ВинРАР, как по внешнему виду, так и по функционалу. Поддерживает множество типов архивов и имеет превосходную степень сжатия. Единственный минус этого софта — невозможность запаковать файл в формат «.RAR» (только распаковка), но мы надеемся, что данное упущение скоро будет исправлено. Русский язык идет в комплекте.
В заключение
Надеюсь вам понравилась эта статья, в дальнейшем мы продолжим серию публикаций по этой теме. Будет еще много чего интересного -оставайтесь вместе с нами — увидимся на страницах данного сайта!
Источник
1. Архивация данных
Архивация — это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных — это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.
Архивация проводится в следующих случаях:
- когда необходимо создать резервные копии наиболее ценных файлов;
- когда необходимо освободить место на диске;
- когда необходимо передать файлы по E-mail.
Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.
В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:
- имя файла;
- размер файла на диске и в архиве;
- сведения о местонахождения файла на диске;
- дата и время последней модификации файла;
- код циклического контроля для файла, используемый для проверки целостности архива;
- степень сжатия.
Любой из архивов имеет свою шкалу степени сжатия. Чаще всего можно встретить следующую градацию методов сжатия:
- Без сжатия (соответствует обычному копированию файлов в архив без сжатия).
- Скоростной.
- Быстрый (характеризуется самым быстрым, но наименее плотным сжатием).
- Обычный.
- Хороший.
- Максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).
Лучше всего архивируются графические файлы в формате .bmp, документы MS Office и Web-страницы.
Что такое архиваторы?
Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием. Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).
Другие названия архиваторов: утилиты — упаковщики, программы — упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.
В ОС MS DOS существуют архиваторы, но они работают только в режиме командной строки. Это программы PKZIP и PKUNZIP, программа архиватора ARJ. Современные архиваторы обеспечивают графический пользовательский интерфейс и сохранили командную строку. В настоящее время лучшим архиватором для Windows является архиватор WinRAR.
WinRAR – это 32 разрядная версия архиватора RAR для Windows. Это — мощное средство создания архивов и управления ими. Есть несколько версий RAR, для разных операционных систем: Windows, Linux, UNIX, DOS, OS/2 и т.д.
Существует две версии RAR для Windows:
- версия с графическим пользовательским интерфейсом — WinRAR.EXE;
- Консольная версия RAR.EXE пульт линии команды (способ текста) версия — Rar.exe.
- Позволяет распаковывать архивы CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, JAR, ISO, и обеспечивает архивирование данных в форматы ZIP и RAR.
- Обеспечивает полную поддержку архивов ZIP и RAR.
- Имеет специальные алгоритмы, оптимизированные для текста и графики. Для мультимедиа сжатие можно использовать только с форматами RAR.
- Поддерживает технологию перетаскивания (drag & drop).
- Имеет интерфейс командной строки.
- Может осуществлять непрерывное архивирование, что обеспечивает более высокую степень сжатия по сравнению с обычными методами сжатия, особенно при упаковке большого количества небольших файлов однотипного содержания.
- Обеспечивает поддержку многотомных архивов, то есть осуществляет разбивку архива на несколько томов (например, для записи большого архива на диски). Расширение томов: RAR, R01, R02 и т.д. При самораспаковывающемся архиве первый том имеет расширение EXE.
- Создает самораспаковывающиеся архивы (SFX) обычные и многотомные архивы, обеспечивает защиту их паролями.
- Обеспечивает восстановление физически поврежденных архивов.
- Имеет средства восстановления, позволяющие восстанавливать отсутствующие части многотомного архива.
- Поддерживает UNICODE в именах файлов.
- Для новичков предназначен режим Мастер (Wizard), с помощью которого можно легко осуществить все операции над архивами.
WinRAR имеет и другие дополнительные функции. WinRAR способен создать архив в двух различных форматах: RAR иZIP.
Рассмотрим преимущества каждого формата.
Архив в формате ZIP
Основное преимущество формата ZIP — его популярность. Например, большинство архивов в Internet – это архивы ZIP. Поэтому приложение к электронной почте лучше всего направлять в формате ZIP. Можно также направить самораспаковывающийся архив. Такой архив является немного большим, но может быть извлечен без внешних программ. Другое преимущество ZIP — скорость. Архив ZIP обычно создается быстрее, чем RAR.
Архив в формате RAR
формат RAR в большинстве случаев обеспечивает значительно лучшее сжатие, чем ZIP. Кроме того, формат RAR обеспечивает поддержку многотомных архивов, имеет средства восстановления поврежденных файлов, архивирует файлы практически неограниченных размеров. Необходимо отметить, что при работе в файловой системе FAT32 архивы могу достигать только 4 гигабайт. Работа с большими размерами архива поддерживается только в файловой системе NTFS.
Программа архивации Microsoft Backup (резервная копия)
Запуск программы осуществляется: Пуск – программы – стандартные – служебные – архивация данных. Откроется мастер архивации и восстановления в обычном режиме. Из этого режима можно перейти в расширенный режим для работы с мастером архивации, мастером восстановления и мастером аварийного восстановления ОС.
Программа архивации позволяет защитить данные от случайной утери в случае, если в системе возникает сбой оборудования или носителя информации. С помощью Backup можно создать резервную копию данных на жестком диске, а затем создать архив на другом носителе данных. Носителем архива может быть логический диск или отдельное устройство (съемный диск).
Программа архивации создает снимок состояния тома, представляющий собой точную копию содержимого диска на определенный момент времени, в том числе открытых файлов, используемых системой. Во время выполнения программы архивации пользователь может продолжать работать с ОС без риска потери данных.
Программа архивации предоставляет следующие возможности:
- Архивация выбранных файлов и папок на случай сбоя жесткого диска или случайного удаления файлов (архивировать можно на жесткий диск или съемный диск и т.д.). Backup восстанавливает архивированные файлы и папки на жесткий диск.
Архивация данных состояния системы. Программа позволяет архивировать копии важных системных компонентов, таких как реестр, загрузочные файлы и база данных службы каталогов. Программа архивации позволяет восстанавливать копии важных системных компонентов, таких, как реестр, загрузочные файлы и база данных службы каталогов.
Источник