Информация виды свойства способы хранения

Хранение данных. Или что такое NAS, SAN и прочие умные сокращения простыми словами

TL;DR: Вводная статья с описанием разных вариантов хранения данных. Будут рассмотрены принципы, описаны преимущества и недостатки, а также предпочтительные варианты использования.

Зачем это все?

Хранение данных — одно из важнейших направлений развития компьютеров, возникшее после появления энергонезависимых запоминающих устройств. Системы хранения данных разных масштабов применяются повсеместно: в банках, магазинах, предприятиях. По мере роста требований к хранимым данным растет сложность хранилищ данных.

Надежно хранить данные в больших объемах, а также выдерживать отказы физических носителей — весьма интересная и сложная инженерная задача.

Хранение данных

Под хранением обычно понимают запись данных на некоторые накопители данных, с целью их (данных) дальнейшего использования. Опустим исторические варианты организации хранения, рассмотрим подробнее классификацию систем хранения по разным критериям. Я выбрал следующие критерии для классификации: по способу подключения, по типу используемых носителей, по форме хранения данных, по реализации.

По способу подключения есть следующие варианты:

  • Внутреннее. Сюда относятся классическое подключение дисков в компьютерах, накопители данных устанавливаются непосредственно в том же корпусе, где и будут использоваться. Типовые шины для подключения — SATA, SAS, из устаревших — IDE, SCSI.


подключение дисков в сервере

  • Внешнее. Подразумевается подключение накопителей с использованием некоторой внешней шины, например FC, SAS, IB, либо с использованием высокоскоростных сетевых карт.


дисковая полка, подключаемая по FC

По типу используемых накопителей возможно выделить:

  • Дисковые. Предельно простой и вероятно наиболее распространенный вариант до сих пор, в качестве накопителей используются жесткие диски
  • Ленточные. В качестве накопителей используются запоминающие устройства с носителем на магнитной ленте. Наиболее частое применение — организация резервного копирования.
  • Flash. В качестве накопителей применяются твердотельные диски, они же SSD. Наиболее перспективный и быстрый способ организации хранилищ, по емкости SSD уже фактически сравнялись с жесткими дисками (местами и более емкие). Однако по стоимости хранения они все еще дороже.
  • Гибридные. Совмещающие в одной системе как жесткие диски, так и SSD. Являются промежуточным вариантом, совмещающим достоинства и недостатки дисковых и flash хранилищ.

Если рассматривать форму хранения данных, то явно выделяются следующие:

  • Файлы (именованные области данных). Наиболее популярный тип хранения данных — структура подразумевает хранение данных, одинаковое для пользователя и для накопителя.
  • Блоки. Одинаковые по размеру области, при этом структура данных задается пользователем. Характерной особенностью является оптимизация скорости доступа за счет отсутствия слоя преобразования блоки-файлы, присутствующего в предыдущем способе.
  • Объекты. Данные хранятся в плоской файловой структуре в виде объектов с метаданными.

По реализации достаточно сложно провести четкие границы, однако можно отметить:

  • аппаратные, например RAID и HBA контроллеры, специализированные СХД.


RAID контроллер от компании Fujitsu

  • Программные. Например реализации RAID, включая файловые системы (например, BtrFS), специализированные сетевые файловые системы (NFS) и протоколы (iSCSI), а также SDS


пример организации LVM с шифрованием и избыточностью в виртуальной машине Linux в облаке Azure

Давайте рассмотрим более детально некоторые технологии, их достоинства и недостатки.

Direct Attached Storage — это исторически первый вариант подключения носителей, применяемый до сих пор. Накопитель, с точки зрения компьютера, в котором он установлен, используется монопольно, обращение с накопителем происходит поблочно, обеспечивая максимальную скорость обмена данными с накопителем с минимальными задержками. Также это наиболее дешевый вариант организации системы хранения данных, однако не лишенный своих недостатков. К примеру если нужно организовать хранение данных предприятия на нескольких серверах, то такой способ организации не позволяет совместное использование дисков разных серверов между собой, так что система хранения данных будет не оптимальной: некоторые сервера будут испытывать недостаток дискового пространства, другие же — не будут полностью его утилизировать:

Конфигурации систем с единственным накопителем применяются чаще всего для нетребовательных нагрузок, обычно для домашнего применения. Для профессиональных целей, а также промышленного применения чаще всего используется несколько накопителей, объединенных в RAID-массив программно, либо с помощью аппаратной карты RAID для достижения отказоустойчивости и\или более высокой скорости работы, чем единичный накопитель. Также есть возможность организации кэширования наиболее часто используемых данных на более быстром, но менее емком твердотельном накопителе для достижения и большой емкости и большой скорости работы дисковой подсистемы компьютера.

Storage area network, она же сеть хранения данных, является технологией организации системы хранения данных с использованием выделенной сети, позволяя таким образом подключать диски к серверам с использованием специализированного оборудования. Так решается вопрос с утилизацией дискового пространства серверами, а также устраняются точки отказа, неизбежно присутствующие в системах хранения данных на основе DAS. Сеть хранения данных чаще всего использует технологию Fibre Channel, однако явной привязки к технологии передачи данных — нет. Накопители используются в блочном режиме, для общения с накопителями используются протоколы SCSI и NVMe, инкапсулируемые в кадры FC, либо в стандартные пакеты TCP, например в случае использования SAN на основе iSCSI.

Читайте также:  Способ снижения текучести кадров

Давайте разберем более детально устройство SAN, для этого логически разделим ее на две важных части, сервера с HBA и дисковые полки, как оконечные устройства, а также коммутаторы (в больших системах — маршрутизаторы) и кабели, как средства построения сети. HBA — специализированный контроллер, размещаемый в сервере, подключаемом к SAN. Через этот контроллер сервер будет «видеть» диски, размещаемые в дисковых полках. Сервера и дисковые полки не обязательно должны размещаться рядом, хотя для достижения высокой производительности и малых задержек это рекомендуется. Сервера и полки подключаются к коммутатору, который организует общую среду передачи данных. Коммутаторы могут также соединяться с собой с помощью межкоммутаторных соединений, совокупность всех коммутаторов и их соединений называется фабрикой. Есть разные варианты реализации фабрики, я не буду тут останавливаться подробно. Для отказоустойчивости рекомендуется подключать минимум две фабрики к каждому HBA в сервере (иногда ставят несколько HBA) и к каждой дисковой полке, чтобы коммутаторы не стали точкой отказа SAN.

Недостатками такой системы являются большая стоимость и сложность, поскольку для обеспечения отказоустойчивости требуется обеспечить несколько путей доступа (multipath) серверов к дисковым полкам, а значит, как минимум, задублировать фабрики. Также в силу физических ограничений (скорость света в общем и емкость передачи данных в информационной матрице коммутаторов в частности) хоть и существует возможность неограниченного подключения устройств между собой, на практике чаще всего есть ограничения по числу соединений (в том числе и между коммутаторами), числу дисковых полок и тому подобное.

Network attached storage, или сетевое файловое хранилище, представляет дисковые ресурсы в виде файлов (или объектов) с использованием сетевых протоколов, например NFS, SMB и прочих. Принципиально базируется на DAS, но ключевым отличием является предоставление общего файлового доступа. Так как работа ведется по сети — сама система хранения может быть сколько угодно далеко от потребителей (в разумных пределах разумеется), но это же является и недостатком в случае организации на предприятиях или в датацентрах, поскольку для работы утилизируется полоса пропускания основной сети — что, однако, может быть нивелировано с использованием выделенных сетевых карт для доступа к NAS. Также по сравнению с SAN упрощается работа клиентов, поскольку сервер NAS берет на себя все вопросы по общему доступу и т.п.

Unified storage

Универсальные системы, позволяющие совмещать в себе как функции NAS так и SAN. Чаще всего по реализации это SAN, в которой есть возможность активировать файловый доступ к дисковому пространству. Для этого устанавливаются дополнительные сетевые карты (или используются уже существующие, если SAN построена на их основе), после чего создается файловая система на некотором блочном устройстве — и уже она раздается по сети клиентам через некоторый файловый протокол, например NFS.

Software-defined storage — программно определяемое хранилище данных, основанное на DAS, при котором дисковые подсистемы нескольких серверов логически объединяются между собой в кластер, который дает своим клиентам доступ к общему дисковому пространству.

Наиболее яркими представителями являются GlusterFS и Ceph, но также подобные вещи можно сделать и традиционными средствами (например на основе LVM2, программной реализации iSCSI и NFS).

N.B. редактора: У вас есть возможность изучить технологию сетевого хранилища Ceph, чтобы использовать в своих проектах для повышения отказоустойчивости, на нашем практическим курсе по Ceph. В начале курса вы получите системные знания по базовым понятиям и терминам, а по окончании научитесь полноценно устанавливать, настраивать и управлять Ceph. Детали и полная программа курса здесь.


Пример SDS на основе GlusterFS

Из преимуществ SDS — можно построить отказоустойчивую производительную реплицируемую систему хранения данных с использованием обычного, возможно даже устаревшего оборудования. Если убрать зависимость от основной сети, то есть добавить выделенные сетевые карты для работы SDS, то получается решение с преимуществами больших SAN\NAS, но без присущих им недостатков. Я считаю, что за подобными системами — будущее, особенно с учетом того, что быстрая сетевая инфраструктура более универсальная (ее можно использовать и для других целей), а также дешевеет гораздо быстрее, чем специализированное оборудование для построения SAN. Недостатком можно назвать увеличение сложности по сравнению с обычным NAS, а также излишней перегруженностью (нужно больше оборудования) в условиях малых систем хранения данных.

Читайте также:  Способы получения углекислого газа лаборатории

Гиперконвергентные системы

Подавляющее большинство систем хранения данных используется для организации дисков виртуальных машин, при использовании SAN неизбежно происходит удорожание инфраструктуры. Но если объединить дисковые системы серверов с помощью SDS, а процессорные ресурсы и оперативную память с помощью гипервизоров отдавать виртуальным машинам, использующим дисковые ресурсы этой SDS — получится неплохо сэкономить. Такой подход с тесной интеграцией хранилища совместно с другими ресурсами называется гиперконвергентностью. Ключевой особенностью тут является способность почти бесконечного роста при нехватке ресурсов, поскольку если не хватает ресурсов, достаточно добавить еще один сервер с дисками к общей системе, чтобы нарастить ее. На практике обычно есть ограничения, но в целом наращивать получается гораздо проще, чем чистую SAN. Недостатком является обычно достаточно высокая стоимость подобных решений, но в целом совокупная стоимость владения обычно снижается.

Облака и эфемерные хранилища

Логическим продолжением перехода на виртуализацию является запуск сервисов в облаках. В предельном случае сервисы разбиваются на функции, запускаемые по требованию (бессерверные вычисления, serverless). Важной особенностью тут является отсутствие состояния, то есть сервисы запускаются по требованию и потенциально могут быть запущены столько экземпляров приложения, сколько требуется для текущей нагрузки. Большинство поставщиков (GCP, Azure, Amazon и прочие) облачных решений предлагают также и доступ к хранилищам, включая файловые и блочные, а также объектные. Некоторые предлагают дополнительно облачные базы, так что приложение, рассчитанное на запуск в таком облаке, легко может работать с подобными системами хранения данных. Для того, чтобы все работало, достаточно оплатить вовремя эти услуги, для небольших приложений поставщики вообще предлагают бесплатное использование ресурсов в течение некоторого срока, либо вообще навсегда.

Из недостатков: могут заблокировать аккаунт, на котором все работает, что может привести к простоям в работе. Также могут быть проблемы со связностью и\или доступностью таких сервисов по сети, поскольку такие хранилища полностью зависят от корректной и правильной работы глобальной сети.

Заключение

Надеюсь, статья была полезной не только новичкам. Предлагаю обсудить в комментариях дополнительные возможности систем хранения данных, написать о своем опыте построения систем хранения данных.

Источник

Хранение информации — способы, виды и свойства

В современном мире информация считается одним из ключевых элементов развития общества. Она имеет смысл как на глобальном уровне, так и более локализованно. Благодаря информации человечество развивается, становится богаче в материальном и духовном плане. Но любые сведения быстро накапливаются, и человеческая память просто не может выдержать такого количества. Существуют разные способы хранения информации запоминающего типа. Благодаря им возможно быстрое воспроизведение и сортировка данных, размещение по категориям.

История развития

С древних времён человечество пыталось запомнить данные и передать их будущим поколениям. Сначала впечатления об окружающем мире первобытные люди рисовали на камнях в пещерах, где жили, потом в процессе эволюции появилась письменность. Этот фактор стал прототипом современных информационных хранилищ.

Количество исписанных листов становилось всё больше, информация накапливалась с каждым днём, проводились исследования, открытия, человечество пыталось найти ответы на главные вопросы. Это привело к научно-техническому прогрессу и развитию информационных технологий. Вместо исписанных тетрадей и потёртых зачитанных книг появились первые электронные носители, позволяющие хранить ведомости, фотографии и видеофайлы в виде цифрового кода, записанного на носитель.

Для считывания данных использовалось специальное устройство, которое со временем только совершенствовалось, увеличивая возможности и место хранения.

Если раньше данные хранились на дискетах, дисках, в памяти компьютера, то сейчас облачное хранение позволяет избавить от ненужных элементов и держать всю информацию на специальных серверах, доступ к которым возможен в любую секунду. Цифровой вид не только уменьшает место хранения, но и помогает быстро провести категоризацию, разместить нужные файлы по отдельным папкам.

Если говорит кратко, то, благодаря развитию информационных технологий, стало возможным хранение большого объёма данных без использования материальных носителей. Конечно, это не отменяет блокноты и тетради, но качественно уменьшает их количество и сужает сферу использования.

Благодаря новым способам хранения данных увеличивается и срок размещения информации на разных платформах.

Магнитные и оптические носители

Магнитная запись была изобретена в XIX веке и первоначально использовалась только для хранения аудиофайлов. Первым носителем была стальная проволока диаметром около 1 мм. Позже стала использоваться стальная катаная лента.

К сожалению, качественные характеристики были недостаточными для частого использования, поэтому учёные начали искать альтернативу. Для записи 14-часовой беседы пришлось использовать примерно 100 кг проволоки, которая имела довольно большую протяжность.

Магнитные носители не только были неудобными в использовании, но и создавали дополнительные трудности в процессе хранения, ведь окружающие факторы могли нарушить качество или даже испортить ленты. В 20-х годах появилась магнитная лента на двух основах:

  • Бумажная.
  • Лавсановая. На поверхность наносится тонкий слой специального порошка, что защищает ленту и делает качество записи намного лучше.
Читайте также:  Способы укрепить волосы от выпадения

Вторая половина ХХ века принесла много изменений. Теперь, кроме звука, на ленту стало можно переносить изображения. Это было первым шагом на пути к появлению видео. Дальше технологии развивались быстро, начали выпускаться видеокамеры и видеомагнитофоны, благодаря которым можно было пересматривать первые фильмы — сначала чёрно-белые, а потом и в цветном формате. В рефератах хранение информации описывается как технический процесс, который начал формироваться в ХІХ веке и продолжает совершенствоваться по сегодняшний день.

На смену магнитному пришёл лазерный тип нанесения информации на поверхность носителя. Был изобретён квантовый генератор, с помощью которого и происходила обработка информации для записи. Этот метод повысил плотность записи, благодаря чему диски имеют больший информационный объем, чем другие носители.

Во второй половине 1990-х годов появились универсальные цифровые DVD-диски, благодаря которым повысился объем записи.

Диски занимали немного места, но из-за чувствительной поверхности, которая могла повредиться или поцарапаться, их использование перестало быть практичным. Современные информационные технологии предложили новый метод хранения, без носителя.

Виды цифровой памяти

Способы хранения информации в информатике постоянно совершенствуются, открывая для пользователей новые возможности. Запоминающие устройства для хранения используют разные методы. Стандартным вариантом ещё несколько лет назад были архивы, благодаря которым можно было не только скрыть нужные файлы, но и сжать их обычный размер, тем самым увеличив общее место хранения. Что касается цифровой памяти, то она может быть двух видов:

  • Внешняя. К этому типу относятся винчестер, карта памяти и компакт-диск. Последний сейчас практически не используется, его альтернативой стали флеш-карты. Благодаря такой замене резко уменьшилось количество использования дисков, что благоприятно повлияло на экологию. А также код информации часто нарушался из-за повреждений на дисках, поэтому флеш формат более подходящий.
  • Внутренняя. Сюда входят оперативные варианты и память кэша.

До конца XX века эти типы хранения считались единственными. Позже появился способ получше, благодаря которому доступ к данным стал возможным в любое время и с любого подходящего для этого цифрового устройства. В рефератах на тему хранения информации отдельная тема посвящена интернету. Во Всемирной паутине можно хранить любое количество данных, используя при этом разные варианты облачных хранилищ.

В последние годы учёные активно работают над созданием специальных дисков, которые смогут хранить на себе достаточное количество информации. Используемые в процессе нанотехнологии работают на уровне атомов и молекул. Одно средство для записи данных, созданное по такой технологии, сможет заменить тысячи дисков, а места на нём должно хватить, чтобы записать каждую секунду человеческой жизни.

Хотя это и звучит как фрагмент фантастического фильма, на самом деле человечество стремительно движется к тому, чтобы создать универсальное хранилище для всей информации.

Использование интернета

Максимально комфортный и доступный для всех способ хранения информации, предоставляющий бесплатные хранилища для данных, используется во всём мире. Использовать интернет можно на любых устройствах, поддерживающих подключение к сети. В докладах и рефератах хранение информации представлено несколькими способами, наиболее эффективный из которых именно интернет.

Чтобы важные ведомости были всегда в зоне доступа, специалисты советуют сделать несколько копий и разместить их в хранилищах и на материальных носителях. Сбои программ, поломки могут навредить информации, поэтому, чтобы не потерять самое важное, необходимо придерживаться простых советов:

  • Создание нескольких аккаунтов на разных облачных ресурсах поможет уберечь нужные данные от потерь. Желательно скопировать папку с информацией и разместить данные на компьютере. Если доступ к интернету будет ограничен, можно будет воспользоваться хранилищем на винчестере.
  • Использование дополнительных внешних устройств поможет сохранить необходимую информацию. Свой выбор лучше остановить на флеш-картах, так как поверхность дисков может поцарапаться, а тогда считать информацию с носителя будет тяжело.
  • «Облачные» сервисы предлагают премиум-аккаунты. Хотя эта опция платная, но, как показывает практика, помогает надёжно защитить информацию и увеличивает свободное пространство.

Благодаря возможности хранения информации люди могут делиться данными и передавать полезные сведения своим детям. Информацию можно использовать многократно без потери качества именно благодаря хранению на облачных ресурсах, передавать в сообщениях через социальные сети или пересылать по электронной почте. Интернет даёт возможность выбора не только в плане вариантов хранения, но и в отношении дальнейшего использования полученных данных.

Развитие информационных технологий в последнее время занимает основную часть работы учёных. Создаются новые варианты хранения информации, проводятся исследования разных нанотехнологических устройств, способных записывать и передавать большие объёмы данных.

Источник

Оцените статью
Разные способы