Способы сохранения цифровой информации

Как и где хранить данные в течение долгого времени

Многие задумываются о том, как сохранить данные на долгие годы, а те, кто нет, могут просто не знать, что компакт диск с фотографиями со свадьбы, видео с детского утренника или другой семейной и рабочей информацией с большой вероятностью нельзя будет прочитать лет через 5-10. Я задумываюсь. Как же в таком случае хранить эти данные?

В этой статье постараюсь рассказать максимально подробно о том, на каких накопителях хранение информации является надежным, а на каких — нет и каков срок хранения при разных условиях, где хранить данные, фотографии, документы и в каком виде это делать. Итак, наша цель — обеспечить сохранность и доступность данных в течение максимально возможного промежутка времени, хотя бы 100 лет.

Общие принципы хранения информации, продлевающие срок её жизни

Существуют наиболее общие принципы, которые применимы к любому типу информации, будь то фотографии, текст или файлы и способные увеличить вероятность успешного доступа к ней в будущем, среди них:

  • Чем больше количество копий, тем вероятнее, что данные проживут дольше: книга, напечатанная миллионным тиражом, фотография, распечатанная в нескольких экземплярах для каждого родственника и сохраненная в цифровом виде на разных накопителях, скорее всего будут храниться и быть доступными долго.
  • Следует избегать нестандартных способов хранения (во всяком случае, как единственного способа), экзотических и проприетарных форматов, языков (например, для документов лучше использовать ODF и TXT, а не DOCX и DOC).
  • Хранить информацию следует в несжатых форматах и в незашифрованном виде — в противном случае, даже незначительное повреждение целостности данных может сделать всю информацию недоступной. Например, если требуется надолго сохранить медиа файлы, то для звука лучше будет WAV, для фотографий — несжатые RAW, TIFF и BMP, для видео — кадры без сжатия, DV, хотя это не вполне возможно в быту, учитывая объемы видео в данных форматах.
  • Регулярная проверка целостности и доступности данных, повторное их сохранение с использованием новых появившихся способов и устройств.

Итак, с основными идеями, которые помогут нам оставить фото с телефона правнукам, разобрались, переходим к информации о различных накопителях.

Традиционные накопители и сроки сохранности информации на них

Наиболее распространенные способы хранения различного рода информации на сегодня — жесткие диски, Flash-накопители (SSD, USB флешки, карты памяти), оптические диски (CD, DVD, Blu-Ray) и не относящиеся к накопителям, но также служащие той же цели облачные хранилища (Dropbox, Яндекс Диск, Google Drive, OneDrive).

Какой из перечисленных способов является надежным способом сохранить данные? Предлагаю рассмотреть их по порядку (я веду речь лишь о бытовых способах: стримеры, например, учитывать не буду):

  • Жесткие диски — традиционные HDD наиболее часто используются для хранения самых разных данных. При обычном использовании их средний срок службы 3-10 лет (такая разница обусловлена как внешними факторами, так и качеством устройства). При этом: если вы запишите информацию на жесткий диск, отключите его от компьютера и положите в ящик стола, то данные можно будет считать без ошибок в течение примерно того же промежутка времени. Сохранность данных на жестком диске в значительной степени зависит от внешних воздействий: любые, даже не сильные удары и встряхивания, в меньшей степени — магнитные поля, могут послужить причиной преждевременного выхода накопителя из строя.
  • USBFlash,SSD — срок службы Flash накопителей в среднем около 5 лет. При этом, обычные флешки очень часто выходят из строя значительно раньше этого срока: достаточно одного статического разряда при подключении к компьютеру, чтобы данные стали недоступны. При условии записи важной информации и последующего отключения SSD или флешки для хранения, срок доступности данных составляет около 7-8 лет.
  • CD,DVD,Blu-Ray — из всех перечисленных, оптические диски обеспечивает наибольший срок хранения данных, способный превышать 100 лет, однако с данным типом накопителей связано и наибольше количество нюансов (например, записанная вами DVD болванка, скорее всего проживет лишь пару лет), а потому он будет рассмотрен отдельно далее в этой статье.
  • Облачные хранилища — срок хранения данных в облаках Google, Microsoft, Яндекс и других неизвестен. Скорее всего, будут храниться в течение долгого времени и пока это коммерчески оправдано для компании, предоставляющей услугу. Согласно лицензионным соглашениям (я прочитал два, для самых популярных хранилищ), ответственности за утрату данных эти компании не несут. Не стоит забывать о возможности потери своего аккаунта из-за действий злоумышленников и других непредвиденных обстоятельств (а их перечень действительно широк).

Итак, самым надежным и долговечным бытовым накопителем на данный момент времени является оптический компакт-диск (о чем я напишу подробно ниже). Однако, самые дешевые и удобные — это жесткие диски и облачные хранилища. Не следует пренебрегать какими-либо из этих способов, ведь их совместное использование повышает сохранность важных данных.

Хранение данных на оптических дисках CD, DVD, Blu-ray

Наверное, многие из вас сталкивались с информацией о том, что данные на CD-R или DVD может храниться десятки, если не сотни лет. А еще, думаю, среди читателей есть такие, кто что-то записал на диск, а когда захотел его посмотреть через год-три, этого сделать не удалось, хотя привод для чтения был исправен. В чем же дело?

Читайте также:  Бинарные отношения способы задания бинарного отношения

Обычные причины быстрой потери данных заключаются в низком качестве записываемого диска и выборе не того типа диска, неправильных условиях его хранения и неправильном режиме записи:

  • Перезаписываемые диски CD-RW, DVD-RW не предназначены для хранения данных, срок сохранности мал (в сравнении с дисками для однократной записи). В среднем, на CD-R информация хранится дольше, чем на DVD-R. По независимым тестам, почти все CD-R показали ожидаемый срок хранения более 15 лет. Такой же результат был только у 47 процентов проверенных DVD-R (тесты Библиотеки Конгресса и Национального Института Стандартов). Другие тесты показали средний срок службы CD-R в районе 30 лет. Про Blu-ray проверенной информации нет.
  • Дешевые болванки, продающиеся чуть ли не в продуктовом магазине по три рубля за штуку не предназначены для хранения данных. Использовать их для записи сколько-нибудь значимой информации без сохранения ее дубликата не следует вообще.
  • Не следует использовать запись в несколько сессий, рекомендуется использовать минимальную скорость записи, доступную для диска (с помощью соответствующих программ записи дисков).
  • Следует избегать нахождения дисков на солнечном свете, в других неблагоприятных условиях (перепады температуры, механические воздействия, повышенная влажность).
  • Качество записывающего привода также может влиять на сохранность записанных данных.

Выбор диска для записи информации

Записываемые диски отличаются материалом, на который производится запись, типом отражающей поверхности, твердостью поликарбонатной основы и, собственно, качеством изготовления. Говоря о последнем пункте, можно отметить, что один и тот же диск одной марки, произведенный в разных странах может сильно отличаться качеством.

В качестве записываемой поверхности оптических дисков в настоящее время используется цианин, фталоцианин или металлизированный Azo, в качестве отражающего слоя — золото, серебро или сплав серебра. В общем случае, оптимальным должно быть сочетание фталоцианина для записи (как самого устойчивого из перечисленных) и золотого отражающего слоя (золото — самый инертный материал, другие подвержены окислению). Однако, качественные диски могут иметь и другие сочетания этих характеристик.

К сожалению, в России диски для архивного хранения данных практически не продаются, в Интернете удалось найти лишь по одному магазину, продающему отличные DVD-R Mitsui MAM-A Gold Archival и JVC Taiyo Yuden по баснословной цене, а также Verbatim UltraLife Gold Archival, который, насколько я понял, Интернет-магазин привозит из США. Все перечисленные являются лидерами в сфере архивного хранения и обещают сохранность данных в районе 100 лет (а Mitsui заявляет о 300 годах для своих CD-R).

В список лучших записываемых дисков, помимо указанных выше можно включить диски Delkin Archival Gold, которые в России я не обнаружил вообще. Впрочем, вы всегда можете купить все перечисленные диски на Amazon.com или в другом иностранном интернет-магазине.

Из более распространенных дисков, которые можно найти в России и которые могут сохранить информацию десять и более лет, к качественным относятся:

  • Verbatim, производства Индии, Сингапура, ОАЭ или Тайваня.
  • Sony, произведенные в Тайване.

«Могут сохранить» относится и ко всем перечисленным дискам Archival Gold — все-таки, это не гарантия сохранности, а потому не стоит забывать о перечисленных в начале статьи принципах.

А теперь, обратите внимание на диаграмму внизу, на которой отражено увеличение количества ошибок чтения оптических дисков в зависимости от срока их нахождения в камере с агрессивной средой. График носит маркетинговый характер, да и шкала времени не размечена, но заставляет задать вопрос: а что это за марка — Millenniata, на дисках которой ошибки не появляются. Сейчас расскажу.

Millenniata M-Disk

Компания Millenniata предлагает диски однократной записи M-Disk DVD-R и M-Disk Blu-Ray, со сроком хранения видео, фотографий, документов и другой информации до 1000 лет. Главное отличие M-Disk от других записываемых компакт-дисков в использовании неорганического слоя из стеклоуглерода для записи (в других дисках используется органика): материал устойчив к коррозии, воздействиям температуры и света, влаги, кислот, щелочей и растворителей, по твердости сравним с кварцем.

При этом, если на обычных дисках под воздействием лазера меняется пигментация органической пленки, то в M-Disk в буквальном смысле выжигаются дырки в материале (правда не ясно, куда деваются продукты горения). В качестве основы, похоже, тоже используется не самый обычный поликарбонат. В одном из рекламных видео диск кипятят в воде, потом кладут в сухой лед, даже запекают в пицце и после этого он продолжает работать.

В России таких дисков я не обнаружил, но на том же Amazon они присутствуют в достаточном количестве и не так уж и дороги (примерно 100 рублей за диск M-Disk DVD-R и 200 за Blu-Ray). При этом, диски совместимы для чтения со всеми современными приводами. С октября 2014 компания Millenniata начинает сотрудничество с Verbatim, так что не исключаю, что скоро эти диски будут более популярны. Хотя, не уверен, что на нашем рынке.

Что касается записи, то чтобы записать M-Disk DVD-R требуется сертифицированный привод с эмблемой M-Disk, так как в них используется более мощный лазер (опять же, у нас таких не нашел, но на Amazon есть, от 2.5 тысяч рублей). Для записи M-Disk Blu-Ray подойдет любой современный привод для записи данного типа дисков.

Я планирую обзавестись таким приводом и набором чистых M-Disk в ближайшие месяц-два и, если вдруг тема интересна (отметьтесь в комментариях, да и статьей поделитесь в соцсетях), могу поэкспериментировать с их кипячением, выкладыванием на мороз и другими воздействиями, сравнить с обычными дисками и написать об этом (а может не поленюсь снять и видео).

Читайте также:  Способы словообразования сложение сокращенных основ

Ну а пока закончу свою статью о том, где хранить данные: все, что знал, рассказал.

Источник

Новые технологии хранения данных: ждет ли нас прорыв в 2020 году?

В течение нескольких десятилетий прогресс в технологиях хранения информации измерялся, прежде всего, с точки зрения емкости накопителей и скорости чтения/записи данных. Со временем к этим параметрам оценки прибавились технологии и методологии, которые делают HDD- и SSD-накопители умнее, гибче и проще в управлении. Каждый год производители накопителей традиционно намекают на то, что рынок больших данных изменится, и 2020 год — не исключение. IT-лидеры усиленно ищут эффективные способы хранения огромных потоков данных и управления ими, а, следовательно, вновь обещают изменить прежний курс развития систем хранения. В данной статье мы собрали самые передовые технологии размещения информации, а также расскажем о концепциях футуристических накопителей, которым еще только предстоит обрести свою физическую реализацию.

Программно-определяемые сети хранения данных

Если говорить о процессах автоматизации, гибкости и увеличения емкости хранения информации вкупе с повышением эффективности работы персонала, все больше предприятий рассматривает возможность перехода на так называемые программно-определяемые сети хранения или SDS (Software-Defined Storage).

Ключевая фишка технологии SDS заключается в отделении аппаратной части от софтверной: то есть подразумевается виртуализация функций хранения данных. К тому же, в отличие от обычных систем хранения с сетевым подключением (NAS) или сетей хранения данных (SAN), SDS предназначен для работы в любой стандартной системе x86. Довольно часто цель разворачивания SDS состоит в том, чтобы улучшить операционные расходы (OpEx), требуя меньше административных усилий.

Емкость HDD-накопителей вырастет до 32 Тбайт

Традиционные магнитные накопители вовсе не умерли, а всего лишь переживают технологический ренессанс. Современные HDD уже могут предложить пользователям до 16 Тбайт для хранения данных. В течение следующих пяти лет — эта емкость вырастет вдвое. При этом накопители на жестких магнитных дисках по-прежнему останутся самым доступным хранилищем произвольного доступа и сохранят за собой первенство в цене за гигабайт дискового пространства еще на много лет.

Наращивание емкости будет происходить на основе уже известных технологий:

  • Гелиевые накопители (гелий снижает аэродинамическое сопротивление и турбулентность, позволяя установить в накопитель больше магнитных пластин; при этом тепловыделение и энергопотребление не увеличивается);
  • Термомагнитные накопители (или HAMR HDD, появление которых ожидается в 2021 году и построено на принципе микроволновой записи данных, когда участок диска нагревается лазером и перемагничивается);
  • HDD на базе черепичной записи (или SMR-накопители, где размещение дорожек с данными происходит друг над другом, в формате черепичной кладки; это и обеспечивает высокую плотность записи информации).

Гелиевые накопители особенно востребованы в облачных дата-центрах, а SMR HDD оптимальны для хранения больших архивов и библиотек данных, доступ и обновление данных, в которых требуются не особо часто. Также они идеально подходят для создания резервных копий.

NVMe-накопители станут еще быстрее

Первые SSD-накопители подключались к системным платам через интерфейс SATA или SAS, но разработаны эти интерфейсы уже более 10 лет назад для магнитных HDD-дисков. Современный же протокол NVMe является гораздо более мощным протоколом связи, предназначенным для систем, обеспечивающих высокую скорость обработки данных. Как итог, на рубеже 2019-2020 года мы видим серьезное падение цен на NVMe SSD, которые становятся доступными для любого класса пользователей. В корпоративном сегменте NVMe-решения особенно ценятся теми предприятиями, которым необходимо осуществление анализа больших данных в реальном времени.

Такие компании, как Kingston и Samsung уже показали, на что могут рассчитывать корпоративные пользователи в 2020 году: мы все ждем появления NVMe SSD с поддержкой PCIe 4.0, которые позволяют добавить ЦОД еще больше скорости при работе с данными. Заявленная производительность новинок составляет 4,8 Гбайт/с, и это далеко не предел. Следующие поколения Kingston NVMe SSD PCIe gen 4.0 смогут обеспечить пропускную способность на уровне 7 Гбайт/с.

Вместе со спецификацией NVMe-oF (или NVMe over Fabrics) организации смогут создавать высокопроизводительные сети хранения данных с минимальными задержками, которые составят весомую конкуренцию ЦОД с прямым подключением DAS (или Direct-attached storage). При этом с использованием NVMe-oF операции ввода/вывода обрабатываются эффективнее, в то время как задержка сравнима с DAS-системами. Аналитики предсказывают, что развертывание систем, работающих по протоколу NVMe-oF стремительно ускорится в 2020 году.

QLC-память наконец-то “выстрелит”?

Флеш-память NAND Quad Level Cell (QLC), также будет демонстрировать растущую популярность на рынке. QLC была введена в 2019 году и поэтому имела минимальное распространение на рынке. Это изменится в 2020 году, особенно среди компаний, которые внедрили технологию LightOS Global Flash Translation Layer (GFTL) для преодоления присущих QLC проблем.

Согласно прогнозам аналитиков, рост продаж SSD-накопителей на базе QLC-ячеек увеличится на 10%, в то время как TLC-решения “захватят” 85% рынка. Как ни крути, а QLC SSD все еще сильно отстает в производительности по сравнению с TLC SSD и не станет основой для ЦОД в ближайшие лет пять.


В то же время, ожидается, что стоимость флеш-памяти NAND в 2020 году вырастет, поэтому поставщик контроллеров SSD Phison, например, делает ставку на то, что повышение цен, в конечном итоге, подтолкнет потребительский рынок твердотельных накопителей к использованию 4-битной флэш-памяти QLC NAND. Кстати, Intel планирует запустить в продажу 144-слойные QLC-решения (вместо 96-слойных продуктов). Что ж…, кажется, нас ждет дальнейшая маргинализация HDD.

SCM-память: скорость, близка к DRAM

Широкое распространение SCM-памяти (Storage Class Memory) предсказывалось несколько лет, и 2020 год может стать отправной точкой, в которой эти предсказания, наконец, сбудутся. В то время как модули памяти Intel Optane, Toshiba XL-Flash и Samsung Z-SSD уже вышли на корпоративный рынок, их появление не вызвало ошеломляющей реакции.

Читайте также:  Креатин для чего он нужен мужчинам способ применения

Устройство Intel сочетает в себе характеристики быстрой, но нестабильной DRAM с более медленным, но постоянным хранилищем NAND. Эта комбинация направлена на повышение способности пользователей работать с большими массивами данных, обеспечивая как скорость DRAM, так и емкость NAND. SCM-память не просто быстрее, чем альтернативы на базе NAND: она в десятки раз быстрее. Задержка составляет микросекунды, а не миллисекунды.

Эксперты рынка отмечают, что центры обработки данных, планирующие использовать SCM будут ограничены тем, что данная технология будет работать лишь на серверах с использованием процессоров Intel поколения Cascade Lake. Однако, по их мнению, это не станет камнем преткновения, чтобы остановить волну обновлений существующих ЦОД в целях обеспечить высокие скорости обработки информации.

От обозримой реальности к далекому будущему

Для большинства пользователей хранение данных не сопряжено с ощущением “емкостного Армагеддона”. Но только задумайтесь: 3,7 миллиарда человек, которые в настоящее время пользуются Интернетом, ежедневно генерируют около 2,5 квинтиллиона байтов данных. Для удовлетворения этой потребности необходимо все больше центров обработки данных.

Если верить статистике, к 2025 году мир готов к обработке 160 Зетабайт данных в год (это больше байтов, чем звезд в обозримой Вселенной). Вероятно, что дальше нам придется покрыть каждый квадратный метр планеты Земля ЦОД’ами, иначе корпорации просто не смогут подстроиться под столь высокий рост информации. Или же… придется отказываться от некоторых данных. Впрочем, есть несколько потенциально интересных технологий, которые могли бы решить нарастающую проблему информационного переполнения.

Структура ДНК, как основа для будущих хранилищ данных

Не только IT-корпорации ищут новые способы хранения и обработки информации, но и многие научные деятели. Глобальная задача — обеспечить сохранение информации в течение тысячелетий. Исследователи из Швейцарской высшей технической школы Цюриха (ETH Zurich, Швейцария) полагают, что решение нужно искать в органической системе хранения данных, которая существует в каждой живой клетке: в ДНК. И главное — “придумана” эта система задолго до появления компьютера.

Нити ДНК очень сложны, компактны и невероятно плотны, как носители информации: по мнению ученых, в грамм ДНК можно записать 455 Эксабайт данных, где 1 Эбайт эквивалентен миллиарду гигабайт. Первые эксперименты уже позволили осуществить запись 83 Кбайт информации в ДНК, после чего преподаватель кафедры химии и биологических наук, Роберт Грасс, высказал идею о том, что в новом десятилетии медицинской сфере нужно плотнее объединиться с IT-структурой для совместных разработок в области технологий записи и хранения данных.

По мнению ученых, органические накопители данных на базе цепей ДНК смогли бы хранить информацию до миллиона лет и безошибочно предоставлять ее по первому запросу. Не исключено, что через несколько десятилетий большинство накопителей будут бороться именно за эту возможность: умение надежно и емко хранить данные в течение длительного времени.

Швейцарцы не единственные, кто работает над созданием систем хранения на основе ДНК. Этот вопрос поднимался еще с 1953 года, когда Фрэнсис Крик открыл двойную спираль ДНК. Но в тот момент человечеству попросту не хватало знаний для подобных экспериментов. Традиционное мышление в области хранения данных на основе ДНК сфокусировано на синтезе новых молекул ДНК; сопоставление последовательности битов с последовательностью четырех пар оснований ДНК и создание достаточного количества молекул для представления всех чисел, которые необходимо сохранить. Так, летом 2019 года инженерам из компании CATALOG удалось записать 16 Гбайт англоязычной “Википедии” в ДНК, созданную из синтетических полимеров. Проблема заключается в том, что этот процесс медленный и дорогой, что является существенным узким местом, когда речь идет о хранении данных.

Не ДНК единым…: молекулярные накопители

Исследователи из Университета Брауна (Brown University, США) заявляют, что молекула ДНК — не единственный вариант молекулярного хранения данных сроком до миллиона лет. В качестве органического хранилища могут выступать и низкомолекулярные метаболиты. При записи информации в набор метаболитов, молекулы начинают взаимодействовать друг с другом и производить новые электрически нейтральные частицы, которые содержат записанные в них данные.

К слову, исследователи не остановились на этом и расширили набор органических молекул, что позволило увеличить плотность записываемых данных. Считывание же такой информации возможно посредством химического анализа. Единственный минус — реализация такого органического накопителя пока не представляется возможной на практике, вне лабораторных условий. Это всего лишь наработка на будущее.

5D-оптическая память: революция в хранении данных

Еще одно экспериментальное хранилище принадлежит разработчикам из Саутгемптонского университета (University of Southampton, Англия). В стремлении создать инновационную цифровую систему хранения информации, которая сможет существовать миллионы лет, научные деятели разработали процесс записи данных на крошечный кварцевый диск, который основан на фемтосекундной импульсной записи. Система хранения предназначена для архивирования и холодного хранения больших объемов данных и описывается, как пятимерное хранилище.

Почему пятимерное? Дело в том, что информация кодируется в нескольких слоях, включая обычные три измерения. К этим измерениям добавляются еще два — размер и ориентация по наноточкам. Емкость данных, которые можно записать на такой мини-накопитель, составляет до 100 Петабайт, а срок хранения — 13,8 млрд. лет при температуре до 190°C. Максимальная же температура нагрева, которую может выдержать диск составляет 982 °C. Короче…, он практически вечный!

Недавно работа сотрудников Саутгемптонского университета привлекла внимание компании Microsoft, чья программа облачного хранения данных Project Silica направлена на переосмысление нынешних технологий хранения данных. По прогнозам “мелкомягких” к 2023 году в облаках будет храниться более 100 Зетабайт информации, так что сложности возникнут даже у крупномасштабных систем хранения.

Для получения дополнительной информации о продуктах Kingston Technology обращайтесь на официальный сайт компании.

Источник

Оцените статью
Разные способы