Способы архивации данных методы архивации

Лекция 14. Архивирование и методы сжатия информации


14.1. Что такое архивирование

Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Архивация необходима не только для экономии памяти, но и для надежного хранения копий ценной информации, для быстрой передачи информации по сети.

Архивирование (упаковка, сжатие) это процесс записи файла в архивный файл, разархивирование (распаковка) — процесс извлечения файла из архива. Архив — упакованный (сжатый) файл.

Архивация информации это такое преобразование информации, при котором объем информации уменьшается, а количество информации остается прежним.

Степень сжатия информации зависит от типа файла и от выбранного метода упаковки. Степень (качество) сжатия файлов характеризуется коэффициентом сжатия:

Vc — объем сжатого файла, Vи — объем исходного файла.

Проблемы архивации тесно связаны с проблемами кодирования (замена символов текста двоичными кодами с помощью кодовой таблицы), шифрования (криптография), компрессией звуковых и видео-сигналов.

14.2. Какие существуют методы архивирования

Все используемые методы сжатия информации можно разделить на два класса:

  • упаковка без потерь — исходную информацию можно точно восстановить по имеющейся упакованной информации;
  • упаковка с потерей информации — распакованное сообщение будет отличаться от исходного сообщения.

В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, две простые идеи.

Первая идея основана на учете частот символов , она разработана Д. А. Хаффманом а 1952 году. Эта идея базируется на том факте, что в обычном тексте частоты появления различных символов неодинаковы. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие — длинными. К каждому сжатому архиву прикладывается таблица соответствия символов и кодов.

Вторая идея упаковки состоит в использовании того факта, что в сообщениях часто встречаются несколько подряд идущих одинаковых байтов , а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида «повторить данный байт n раз» (при упаковке графической информации) или «взять часть текста длиной k байтов, которая встречалась m байтов назад» (при упаковке текстовой информации). Такой алгоритм архивации называется RLE (кодирование путем учета повторений) .

14.3. Какими возможностями обладают архиваторы

Средства архивации-разархивации, как правило, обеспечивают:

  • создание архива;
  • обслуживание архива (добавление файлов, удаление файлов из архива, замену файлов в архиве и т.п.);
  • извлечение файлов из архива;
  • автоматическую архивацию и разархивацию поддерева файловой структуры;
  • тестирование целостности архивов;
  • создание многотомных архивов с возможностью задания произвольного размера тома;
  • создание самораспаковывающихся архивов;
  • создание пароля для доступа к архиву;
  • работу с частично разрушенными архивами.

Каждый архиватор обычно реализует свой собственный уникальный алгоритм сжатия.

14.4. Как сжать звуковые файлы

Для уменьшения размеров мультимедийных файлов используют процедуру сжатия .

Cжатие (уплотнение, компрессия) это такое преобразование информации, в результате которого исходный файл уменьшается в объеме, а количество информации в сжатом файле уменьшается на такую небольшую величину, которой практически можно пренебречь.

Компрессия без потерь используется, например, архиваторами ZIP, RAR, ARJ. Применение подобных алгоритмов для сжатия файлов, содержащих оцифрованный звук, не позволяет получить сжатие более чем в 2 раза.

Звуковой сигнал, преобразованный с помощью АЦП, обычно не повторяет сам себя и по этой причине плохо сжимается с помощью алгоритмов сжатия без потерь. Многие приемы сжатия аудиоинформации основываются на обмане органов чувств человека путем исключения избыточной и нформации, которую человек не способен воспринять (в силу своих физиологических особенностей).

Такие методы относятся к классу компрессии с потерями . Они не ставят цель абсолютно точного восстановления формы исходных колебаний. Их главная задача — достижение максимального сжатия звукового сигнала при минимальных слышимых искажениях восстановленного после с жатия сигнала.

Звуковой файл можно сжать с помощью компадирования , которое заключается в сжатии по амплитуде исходного звукового сигнала и последующем его восстановлении с помощью расширителя. Значение амплитуды звука заменяется логарифмом этого значения. Полученные числа округляются, и для их записи требуется меньшее число разрядов. Для воспроизведения сжатого сигнала, его подвергают потенцированию (преобразование, обратное логарифмированию).

Еще один способ сжатия звукового сигнала заключается в том, что исходный звуковой сигнал очищается с помощью фильтров от неслышимых компонент (например, низкие басовые шумы). Затем производится более сложный анализ сигнала: вычисляются и удаляются замаскированные частоты, заглушенные другими мощными сигналами. Таким образом можно исключить до 70% информации из сигнала, практически не изменив качество его звучания.

Есть и другие способы, так же основанные на свойствах человеческого слуха.

Если звуковой сигнал представляет собой однотонные звуки с постоянным уровнем громкости, то биоакустические свойства слуха не позволяют его сжать. В этом случае дают эффект традиционные методы архивации информации, например, алгоритм Хаффмана.

14.5. Как сжать графические файлы

Методы сжатия видеоинформации разделяются на две группы, в зависимости от скорости упаковки изображения:

  • сжатие неподвижных изображений может выполняться с любой скоростью, т.к. этот процесс не регламентирован во времени, в силу статичности изображения.
  • сжатие движущихся изображений должно выполняться, как правило, в режиме реального времени по мере ввода данных.

Стандарт JPEG позволяет сократить размеры графического файла с неподвижным изображением в 10-20 раз. Этим методом удается при специальных действиях сжимать и движущиеся изображения.

Источник

Основные методы архивации

Важной частью настройки как архивации, так и системы резервного копирования является выбор — каким образом сохранять файлы и с какой периодичностью. Именно от него зависит, сколько места необходимо для хранения нужной Вам информации в нужном периоде. Какие методы архивации (на сленге админов бекапа) существуют? Основных всего три: полная, инкрементальная, дифференциальная архивация.

Полная архивация

Данные сохраняются полностью с заданной Вами периодичностью. Этот тип бекапа применяется, если объем данных небольшой, либо они редко меняются. Например, мы знаем, что данные по ключам ЭЦП меняются раз в год. Следовательно, после их изменения делается полный бекап. Следующий бекап (также полный) делается через полгода и т. д.

Плюсы Минусы
  • легкое и быстрое восстановление файлов.
  • большой архив в случае большого объема данных (это влечет за собой покупку жестких дисков для хранения скопившейся информации);
  • медленная скорость создания.

В зависимости от объема архивируемой информации и скорости компьютера, на котором запущена архивация, скорость создания может сильно растянуться. Пока архив создается, сервер, отвечающий за создание этого архива, будет сильно нагружен (особенно это актуально для бюджетных компаний, в которых все задачи выполняет 1 рабочий сервер).

Инкрементальная архивация

Используется, когда возникает необходимость архивировать постоянно обновляемый файл. Такой способ архивации создает архив файла, измененного с момента последней архивации (не важно какого типа данный файл). Решение о хранении предыдущего файла зависит от потребностей пользователя.

Плюсы Минусы
  • можно значительно сэкономить место на жестком диске.
  • если полный архив создается редко, процесс восстановления папки может занять некоторое время.

Инкрементальную архивацию используют редко из-за того, что при необходимости восстановить содержимое папки на конкретное число, сначала восстанавливают последний полный архив. А потом «накатываются» последующие инкрементные, добавляя в последний полный те файлы, которые были изменены за промежуток между полным архивом и требуемой датой.

Внимание! В случае внесения изменения в программы наподобие 1С, полный и инкрементный архивы будут одинаковые (изменив один документ в базе, для компьютера пользователь меняет содержимое файла всей базы).

Дифференциальная архивация

Данный способ делает архивы тех файлов, которые менялись с момента последней полной архивации. Например, в понедельник сделали полный архив. Во вторник сотрудники поменяли файл А — в этот же день сделался архив файла А. В среду поменяли файл Б — в этот же день сделался архив файлов А и Б. В четверг поменяли файлы А и С – в в этот же день сделался архив файлов А, Б, С и т. д.

Плюсы Минусы
  • по сравнению с инкрементным типом скорость восстановления архива происходит в разы быстрее, поскольку достаточно восстановить последний полный архив, «накатив» сверху всего один дифферентный на нужную Вам дату.
  • достаточно большой объем архивируемых данных может привести к необходимости покупки жестких дисков.

Говоря о типах архивации, нельзя сказать, что какой-то из них хуже или лучше. Все зависит от преследуемых целей и возможностей Вашего оборудования. Постоянная полная архивация позволяет быстро восстанавливать файлы, но медленно создает сам архив, при этом хранение данных требует много места. «Микс» постоянного и инкрементного архивов позволят освободить место, но увеличивает скорость восстановления данных. В связи с этим наши сотрудники индивидуально подходят к выбору способа архивации, учитывая все имеющиеся нюансы. Для получения более подробной консультации свяжитесь с нами по телефону (посмотреть) или закажите обратный звонок.

Источник

1. Архивация данных

Архивация — это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных — это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архивация проводится в следующих случаях:

  • когда необходимо создать резервные копии наиболее ценных файлов;
  • когда необходимо освободить место на диске;
  • когда необходимо передать файлы по E-mail.

Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

  • имя файла;
  • размер файла на диске и в архиве;
  • сведения о местонахождения файла на диске;
  • дата и время последней модификации файла;
  • код циклического контроля для файла, используемый для проверки целостности архива;
  • степень сжатия.

Любой из архивов имеет свою шкалу степени сжатия. Чаще всего можно встретить следующую градацию методов сжатия:

  1. Без сжатия (соответствует обычному копированию файлов в архив без сжатия).
  2. Скоростной.
  3. Быстрый (характеризуется самым быстрым, но наименее плотным сжатием).
  4. Обычный.
  5. Хороший.
  6. Максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).

Лучше всего архивируются графические файлы в формате .bmp, документы MS Office и Web-страницы.

Что такое архиваторы?

Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием. Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).

Другие названия архиваторов: утилиты — упаковщики, программы — упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.

В ОС MS DOS существуют архиваторы, но они работают только в режиме командной строки. Это программы PKZIP и PKUNZIP, программа архиватора ARJ. Современные архиваторы обеспечивают графический пользовательский интерфейс и сохранили командную строку. В настоящее время лучшим архиватором для Windows является архиватор WinRAR.

WinRAR – это 32 разрядная версия архиватора RAR для Windows. Это — мощное средство создания архивов и управления ими. Есть несколько версий RAR, для разных операционных систем: Windows, Linux, UNIX, DOS, OS/2 и т.д.

Существует две версии RAR для Windows:

  • версия с графическим пользовательским интерфейсом — WinRAR.EXE;
  • Консольная версия RAR.EXE пульт линии команды (способ текста) версия — Rar.exe.

  1. Позволяет распаковывать архивы CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, JAR, ISO, и обеспечивает архивирование данных в форматы ZIP и RAR.
  2. Обеспечивает полную поддержку архивов ZIP и RAR.
  3. Имеет специальные алгоритмы, оптимизированные для текста и графики. Для мультимедиа сжатие можно использовать только с форматами RAR.
  4. Поддерживает технологию перетаскивания (drag & drop).
  5. Имеет интерфейс командной строки.
  6. Может осуществлять непрерывное архивирование, что обеспечивает более высокую степень сжатия по сравнению с обычными методами сжатия, особенно при упаковке большого количества небольших файлов однотипного содержания.
  7. Обеспечивает поддержку многотомных архивов, то есть осуществляет разбивку архива на несколько томов (например, для записи большого архива на диски). Расширение томов: RAR, R01, R02 и т.д. При самораспаковывающемся архиве первый том имеет расширение EXE.
  8. Создает самораспаковывающиеся архивы (SFX) обычные и многотомные архивы, обеспечивает защиту их паролями.
  9. Обеспечивает восстановление физически поврежденных архивов.
  10. Имеет средства восстановления, позволяющие восстанавливать отсутствующие части многотомного архива.
  11. Поддерживает UNICODE в именах файлов.
  12. Для новичков предназначен режим Мастер (Wizard), с помощью которого можно легко осуществить все операции над архивами.

WinRAR имеет и другие дополнительные функции. WinRAR способен создать архив в двух различных форматах: RAR иZIP.

Рассмотрим преимущества каждого формата.

Архив в формате ZIP

Основное преимущество формата ZIP — его популярность. Например, большинство архивов в Internet – это архивы ZIP. Поэтому приложение к электронной почте лучше всего направлять в формате ZIP. Можно также направить самораспаковывающийся архив. Такой архив является немного большим, но может быть извлечен без внешних программ. Другое преимущество ZIP — скорость. Архив ZIP обычно создается быстрее, чем RAR.

Архив в формате RAR

формат RAR в большинстве случаев обеспечивает значительно лучшее сжатие, чем ZIP. Кроме того, формат RAR обеспечивает поддержку многотомных архивов, имеет средства восстановления поврежденных файлов, архивирует файлы практически неограниченных размеров. Необходимо отметить, что при работе в файловой системе FAT32 архивы могу достигать только 4 гигабайт. Работа с большими размерами архива поддерживается только в файловой системе NTFS.

Программа архивации Microsoft Backup (резервная копия)

Запуск программы осуществляется: Пуск – программы – стандартные – служебные – архивация данных. Откроется мастер архивации и восстановления в обычном режиме. Из этого режима можно перейти в расширенный режим для работы с мастером архивации, мастером восстановления и мастером аварийного восстановления ОС.

Программа архивации позволяет защитить данные от случайной утери в случае, если в системе возникает сбой оборудования или носителя информации. С помощью Backup можно создать резервную копию данных на жестком диске, а затем создать архив на другом носителе данных. Носителем архива может быть логический диск или отдельное устройство (съемный диск).

Программа архивации создает снимок состояния тома, представляющий собой точную копию содержимого диска на определенный момент времени, в том числе открытых файлов, используемых системой. Во время выполнения программы архивации пользователь может продолжать работать с ОС без риска потери данных.

Программа архивации предоставляет следующие возможности:

  1. Архивация выбранных файлов и папок на случай сбоя жесткого диска или случайного удаления файлов (архивировать можно на жесткий диск или съемный диск и т.д.). Backup восстанавливает архивированные файлы и папки на жесткий диск.

Архивация данных состояния системы. Программа позволяет архивировать копии важных системных компонентов, таких как реестр, загрузочные файлы и база данных службы каталогов. Программа архивации позволяет восстанавливать копии важных системных компонентов, таких, как реестр, загрузочные файлы и база данных службы каталогов.

Источник

Читайте также:  Как классифицируются скреперы по способу разгрузки ковша
Оцените статью
Разные способы