Сетевой способ хранения информации

Содержание

Новые технологии хранения данных: ждет ли нас прорыв в 2020 году?
Программно-определяемые сети хранения данных
Емкость HDD-накопителей вырастет до 32 Тбайт
NVMe-накопители станут еще быстрее
QLC-память наконец-то “выстрелит”?
SCM-память: скорость, близка к DRAM
От обозримой реальности к далекому будущему
Структура ДНК, как основа для будущих хранилищ данных
Не ДНК единым…: молекулярные накопители
5D-оптическая память: революция в хранении данных
Современные технологии дисковых систем хранения данных
Автономные дисковые подсистемы
Коротко о SAS, NAS, SAN
Fibre Channel в сетях хранения данных
Тенденции развития систем хранения данных
IDE RAID
Что нам принесёт Serial ATA
Куда идет параллельный SCSI
Массовое увлечение NAS
NAS на основе PC за 30 минут
Файловые протоколы в современных NAS
Все дороги ведут к IP Storage
iSCSI — новый стандарт
Виртуализация в сетях хранения данных

Новые технологии хранения данных: ждет ли нас прорыв в 2020 году?

В течение нескольких десятилетий прогресс в технологиях хранения информации измерялся, прежде всего, с точки зрения емкости накопителей и скорости чтения/записи данных. Со временем к этим параметрам оценки прибавились технологии и методологии, которые делают HDD- и SSD-накопители умнее, гибче и проще в управлении. Каждый год производители накопителей традиционно намекают на то, что рынок больших данных изменится, и 2020 год — не исключение. IT-лидеры усиленно ищут эффективные способы хранения огромных потоков данных и управления ими, а, следовательно, вновь обещают изменить прежний курс развития систем хранения. В данной статье мы собрали самые передовые технологии размещения информации, а также расскажем о концепциях футуристических накопителей, которым еще только предстоит обрести свою физическую реализацию.

Программно-определяемые сети хранения данных

Если говорить о процессах автоматизации, гибкости и увеличения емкости хранения информации вкупе с повышением эффективности работы персонала, все больше предприятий рассматривает возможность перехода на так называемые программно-определяемые сети хранения или SDS (Software-Defined Storage).

Ключевая фишка технологии SDS заключается в отделении аппаратной части от софтверной: то есть подразумевается виртуализация функций хранения данных. К тому же, в отличие от обычных систем хранения с сетевым подключением (NAS) или сетей хранения данных (SAN), SDS предназначен для работы в любой стандартной системе x86. Довольно часто цель разворачивания SDS состоит в том, чтобы улучшить операционные расходы (OpEx), требуя меньше административных усилий.

Емкость HDD-накопителей вырастет до 32 Тбайт

Традиционные магнитные накопители вовсе не умерли, а всего лишь переживают технологический ренессанс. Современные HDD уже могут предложить пользователям до 16 Тбайт для хранения данных. В течение следующих пяти лет — эта емкость вырастет вдвое. При этом накопители на жестких магнитных дисках по-прежнему останутся самым доступным хранилищем произвольного доступа и сохранят за собой первенство в цене за гигабайт дискового пространства еще на много лет.

Наращивание емкости будет происходить на основе уже известных технологий:

Гелиевые накопители (гелий снижает аэродинамическое сопротивление и турбулентность, позволяя установить в накопитель больше магнитных пластин; при этом тепловыделение и энергопотребление не увеличивается);
Термомагнитные накопители (или HAMR HDD, появление которых ожидается в 2021 году и построено на принципе микроволновой записи данных, когда участок диска нагревается лазером и перемагничивается);
HDD на базе черепичной записи (или SMR-накопители, где размещение дорожек с данными происходит друг над другом, в формате черепичной кладки; это и обеспечивает высокую плотность записи информации).

Гелиевые накопители особенно востребованы в облачных дата-центрах, а SMR HDD оптимальны для хранения больших архивов и библиотек данных, доступ и обновление данных, в которых требуются не особо часто. Также они идеально подходят для создания резервных копий.

NVMe-накопители станут еще быстрее

Первые SSD-накопители подключались к системным платам через интерфейс SATA или SAS, но разработаны эти интерфейсы уже более 10 лет назад для магнитных HDD-дисков. Современный же протокол NVMe является гораздо более мощным протоколом связи, предназначенным для систем, обеспечивающих высокую скорость обработки данных. Как итог, на рубеже 2019-2020 года мы видим серьезное падение цен на NVMe SSD, которые становятся доступными для любого класса пользователей. В корпоративном сегменте NVMe-решения особенно ценятся теми предприятиями, которым необходимо осуществление анализа больших данных в реальном времени.

Такие компании, как Kingston и Samsung уже показали, на что могут рассчитывать корпоративные пользователи в 2020 году: мы все ждем появления NVMe SSD с поддержкой PCIe 4.0, которые позволяют добавить ЦОД еще больше скорости при работе с данными. Заявленная производительность новинок составляет 4,8 Гбайт/с, и это далеко не предел. Следующие поколения Kingston NVMe SSD PCIe gen 4.0 смогут обеспечить пропускную способность на уровне 7 Гбайт/с.

Вместе со спецификацией NVMe-oF (или NVMe over Fabrics) организации смогут создавать высокопроизводительные сети хранения данных с минимальными задержками, которые составят весомую конкуренцию ЦОД с прямым подключением DAS (или Direct-attached storage). При этом с использованием NVMe-oF операции ввода/вывода обрабатываются эффективнее, в то время как задержка сравнима с DAS-системами. Аналитики предсказывают, что развертывание систем, работающих по протоколу NVMe-oF стремительно ускорится в 2020 году.

QLC-память наконец-то “выстрелит”?

Флеш-память NAND Quad Level Cell (QLC), также будет демонстрировать растущую популярность на рынке. QLC была введена в 2019 году и поэтому имела минимальное распространение на рынке. Это изменится в 2020 году, особенно среди компаний, которые внедрили технологию LightOS Global Flash Translation Layer (GFTL) для преодоления присущих QLC проблем.

Согласно прогнозам аналитиков, рост продаж SSD-накопителей на базе QLC-ячеек увеличится на 10%, в то время как TLC-решения “захватят” 85% рынка. Как ни крути, а QLC SSD все еще сильно отстает в производительности по сравнению с TLC SSD и не станет основой для ЦОД в ближайшие лет пять.

В то же время, ожидается, что стоимость флеш-памяти NAND в 2020 году вырастет, поэтому поставщик контроллеров SSD Phison, например, делает ставку на то, что повышение цен, в конечном итоге, подтолкнет потребительский рынок твердотельных накопителей к использованию 4-битной флэш-памяти QLC NAND. Кстати, Intel планирует запустить в продажу 144-слойные QLC-решения (вместо 96-слойных продуктов). Что ж…, кажется, нас ждет дальнейшая маргинализация HDD.

SCM-память: скорость, близка к DRAM

Широкое распространение SCM-памяти (Storage Class Memory) предсказывалось несколько лет, и 2020 год может стать отправной точкой, в которой эти предсказания, наконец, сбудутся. В то время как модули памяти Intel Optane, Toshiba XL-Flash и Samsung Z-SSD уже вышли на корпоративный рынок, их появление не вызвало ошеломляющей реакции.

Устройство Intel сочетает в себе характеристики быстрой, но нестабильной DRAM с более медленным, но постоянным хранилищем NAND. Эта комбинация направлена на повышение способности пользователей работать с большими массивами данных, обеспечивая как скорость DRAM, так и емкость NAND. SCM-память не просто быстрее, чем альтернативы на базе NAND: она в десятки раз быстрее. Задержка составляет микросекунды, а не миллисекунды.

Эксперты рынка отмечают, что центры обработки данных, планирующие использовать SCM будут ограничены тем, что данная технология будет работать лишь на серверах с использованием процессоров Intel поколения Cascade Lake. Однако, по их мнению, это не станет камнем преткновения, чтобы остановить волну обновлений существующих ЦОД в целях обеспечить высокие скорости обработки информации.

От обозримой реальности к далекому будущему

Для большинства пользователей хранение данных не сопряжено с ощущением “емкостного Армагеддона”. Но только задумайтесь: 3,7 миллиарда человек, которые в настоящее время пользуются Интернетом, ежедневно генерируют около 2,5 квинтиллиона байтов данных. Для удовлетворения этой потребности необходимо все больше центров обработки данных.

Если верить статистике, к 2025 году мир готов к обработке 160 Зетабайт данных в год (это больше байтов, чем звезд в обозримой Вселенной). Вероятно, что дальше нам придется покрыть каждый квадратный метр планеты Земля ЦОД’ами, иначе корпорации просто не смогут подстроиться под столь высокий рост информации. Или же… придется отказываться от некоторых данных. Впрочем, есть несколько потенциально интересных технологий, которые могли бы решить нарастающую проблему информационного переполнения.

Структура ДНК, как основа для будущих хранилищ данных

Не только IT-корпорации ищут новые способы хранения и обработки информации, но и многие научные деятели. Глобальная задача — обеспечить сохранение информации в течение тысячелетий. Исследователи из Швейцарской высшей технической школы Цюриха (ETH Zurich, Швейцария) полагают, что решение нужно искать в органической системе хранения данных, которая существует в каждой живой клетке: в ДНК. И главное — “придумана” эта система задолго до появления компьютера.

Нити ДНК очень сложны, компактны и невероятно плотны, как носители информации: по мнению ученых, в грамм ДНК можно записать 455 Эксабайт данных, где 1 Эбайт эквивалентен миллиарду гигабайт. Первые эксперименты уже позволили осуществить запись 83 Кбайт информации в ДНК, после чего преподаватель кафедры химии и биологических наук, Роберт Грасс, высказал идею о том, что в новом десятилетии медицинской сфере нужно плотнее объединиться с IT-структурой для совместных разработок в области технологий записи и хранения данных.

По мнению ученых, органические накопители данных на базе цепей ДНК смогли бы хранить информацию до миллиона лет и безошибочно предоставлять ее по первому запросу. Не исключено, что через несколько десятилетий большинство накопителей будут бороться именно за эту возможность: умение надежно и емко хранить данные в течение длительного времени.

Швейцарцы не единственные, кто работает над созданием систем хранения на основе ДНК. Этот вопрос поднимался еще с 1953 года, когда Фрэнсис Крик открыл двойную спираль ДНК. Но в тот момент человечеству попросту не хватало знаний для подобных экспериментов. Традиционное мышление в области хранения данных на основе ДНК сфокусировано на синтезе новых молекул ДНК; сопоставление последовательности битов с последовательностью четырех пар оснований ДНК и создание достаточного количества молекул для представления всех чисел, которые необходимо сохранить. Так, летом 2019 года инженерам из компании CATALOG удалось записать 16 Гбайт англоязычной “Википедии” в ДНК, созданную из синтетических полимеров. Проблема заключается в том, что этот процесс медленный и дорогой, что является существенным узким местом, когда речь идет о хранении данных.

Не ДНК единым…: молекулярные накопители

Исследователи из Университета Брауна (Brown University, США) заявляют, что молекула ДНК — не единственный вариант молекулярного хранения данных сроком до миллиона лет. В качестве органического хранилища могут выступать и низкомолекулярные метаболиты. При записи информации в набор метаболитов, молекулы начинают взаимодействовать друг с другом и производить новые электрически нейтральные частицы, которые содержат записанные в них данные.

К слову, исследователи не остановились на этом и расширили набор органических молекул, что позволило увеличить плотность записываемых данных. Считывание же такой информации возможно посредством химического анализа. Единственный минус — реализация такого органического накопителя пока не представляется возможной на практике, вне лабораторных условий. Это всего лишь наработка на будущее.

5D-оптическая память: революция в хранении данных

Еще одно экспериментальное хранилище принадлежит разработчикам из Саутгемптонского университета (University of Southampton, Англия). В стремлении создать инновационную цифровую систему хранения информации, которая сможет существовать миллионы лет, научные деятели разработали процесс записи данных на крошечный кварцевый диск, который основан на фемтосекундной импульсной записи. Система хранения предназначена для архивирования и холодного хранения больших объемов данных и описывается, как пятимерное хранилище.

Почему пятимерное? Дело в том, что информация кодируется в нескольких слоях, включая обычные три измерения. К этим измерениям добавляются еще два — размер и ориентация по наноточкам. Емкость данных, которые можно записать на такой мини-накопитель, составляет до 100 Петабайт, а срок хранения — 13,8 млрд. лет при температуре до 190°C. Максимальная же температура нагрева, которую может выдержать диск составляет 982 °C. Короче…, он практически вечный!

Недавно работа сотрудников Саутгемптонского университета привлекла внимание компании Microsoft, чья программа облачного хранения данных Project Silica направлена на переосмысление нынешних технологий хранения данных. По прогнозам “мелкомягких” к 2023 году в облаках будет храниться более 100 Зетабайт информации, так что сложности возникнут даже у крупномасштабных систем хранения.

Для получения дополнительной информации о продуктах Kingston Technology обращайтесь на официальный сайт компании.

Источник

Современные технологии дисковых систем хранения данных

В этой статье речь пойдет о системах хранения данных начального и среднего уровня, а также тех тенденциях, которые сегодня ярко выделяются в этой отрасли. Для удобства будем называть системы хранения данных накопителями.

Сначала мы немного остановимся на терминологии и технологических основах автономных накопителей, а потом перейдём к новинкам и обсуждению современных достижений в разных технологических и маркетинговых группах. Мы также обязательно расскажем о том, зачем нужны системы того или иного вида и насколько эффективным является их использование в разных ситуациях.

Автономные дисковые подсистемы

Для того, чтобы лучше понять особенности автономных накопителей, остановимся немного на одной из более простых технологий построения систем хранения данных — шинно-ориентированной технологии. Она предусматривает использование корпуса для дисковых накопителей и контроллера PCI RAID.

Рисунок 1. Шинно-ориентированная технология постоения систем хранения данных

Таким образом, между дисками и PCI-шиной хоста (от англ. Host — в данном случае автономный компьютер, например сервер или рабочая станция) есть только один контроллер, который в значительной мере и задает быстродействие системы. Накопители, построенные по этому принципу, являются наиболее производительными. Но в связи с архитектурными особенностями практическое их использование, за исключением редких случаев, ограничивается конфигурациями с одним хостом.

К недостаткам шинно-ориентированной архитектуры накопителей следует отнести:

эффективное использование только в конфигурациях с одним хостом;
зависимость от операционной системы и платформы;
ограниченную масштабируемость;
ограниченные возможности по организации отказоустойчивых систем.

Естественно, всё это неважно, если данные нужны для одного сервера или рабочей станции. Наоборот, в такой конфигурации вы получите максимальное быстродействие за минимальные деньги. Но если вам нужна система хранения данных для большого вычислительного центра или даже для двух серверов, которым нужны одни и те же данные, шинно-ориентированная архитектура совершенно не подходит. Недостатков этой архитектуры позволяет избежать архитектура автономных дисковых подсистем. Основной принцип ее построения достаточно прост. Контроллер, который управляет системой, переносится из хост-компьютера в корпус накопителя, обеспечивая независимое от хост-систем функционирование. Следует отметить, что такая система может иметь большое количество внешних каналов ввода/вывода, что обеспечивает возможность подключения к системе нескольких, или даже многих компьютеров.

Рисунок 2. Автономная система хранения данных

Любая интеллектуальная система хранения данных состоит из аппаратной части и программного кода. В автономной системе всегда есть память, в которой хранится программа алгоритмов работы самой системы и процессорные элементы, которые этот код обрабатывают. Такая система функционирует независимо от того, с какими хост-системами она связана. Благодаря своей интеллектуальности автономные накопители зачастую самостоятельно реализуют множество функций по обеспечению сохранности и управлению данными. Одна из самых важных базовых и практически повсеместно используемых функций — это RAID (Redundant Array of Independent Disks). Другая, принадлежащая уже системам среднего и высокого уровня — это виртуализация. Она обеспечивает такие возможности как мгновенная копия или удаленное резервирование, а также другие, достаточно изощрённые алгоритмы.

Коротко о SAS, NAS, SAN

В рамках рассмотрения автономных систем хранения данных обязательно следует остановиться на том, каким образом осуществляется доступ хост-систем к накопителям. Это в значительной мере определяет сферы их использования и внутреннюю архитектуру.

Различают три основных варианта организации доступа к накопителям:

SAS (Server Attached Storage) — накопитель, подсоединенный к серверу [ второе название DAS (Direct Attached Storage) — напрямую подсоединённый накопитель ];
NAS (Network Attached Storage) — накопитель, подсоединенный к сети;
SAN (Storage Area Network) — сеть хранения данных.

Мы уже писали о технологиях SAS/DAS, NAS и SAN в статье посвященной SAN, если кого эта информация заинтересует, рекомендуем обратиться к страницам iXBT. Но всё же позволим себе немножко освежить материал с акцентом на практическое использование.

SAS/DAS — это достаточно простой традиционный способ подключения, который подразумевает прямое (отсюда и DAS) подсоединение системы хранения к одной или нескольким хост-системам через высокоскоростной канальный интерфейс. Часто в таких системах, для подсоединения накопителя к хосту используется такой же интерфейс, который используется для доступа к внутренним дискам хост-системы, что в общем случае обеспечивает высокое быстродействие и простое подключение.

SAS-систему можно рекомендовать к использованию в случае, если имеется потребность в высокоскоростной обработке данных больших объемов на одной или нескольких хост-системах. Это, например, может быть файл-сервер, графическая станция или отказоустойчивая кластерная система, состоящая из двух узлов.

NAS — накопитель, который подсоединен к сети и обеспечивает файловый (обратите внимание — файловый, а не блочный) доступ к данным для хост-систем в сети LAN/WAN. Клиенты, которые работает с NAS, для доступа к данным обычно используют протоколы NSF (Network File System) или CIFS (Common Internet File System). NAS интерпретирует команды файловых протоколов и исполняет запрос к дисковым накопителям в соответствии с используемым в нём канальным протоколом. Фактически, архитектура NAS — это эволюция файловых серверов. Главным преимуществом такого решения является быстрота развёртывания и качество организации доступа к файлам, благодаря специализации и узкой направленности.

Исходя из сказанного, NAS можно рекомендовать для использования в случае, если нужен сетевой доступ к файлам и достаточно важными факторами являются: простота решения (что обычно является неким гарантом качества) и простота его сопровождения и установки. Прекрасным примером является использование NAS в качестве файл-сервера в офисе небольшой компании, для которой важна простота установки и администрирования. Но в то же время, если вам нужен доступ к файлам с большого количества хост-систем, мощный NAS-накопитель, благодаря отточенному специализированному решению, способен обеспечить интенсивный обмен трафиком с огромным пулом серверов и рабочих станций при достаточно низкой стоимости используемой коммуникационной инфраструктуры (например, коммутаторов Gigabit Ethernet и медной витой пары).

SAN — сеть хранения данных. Обычно в SAN используется блочный доступ к данным, хотя возможно подключение к сетям хранения данных устройств, предоставляющих файловые сервисы, например NAS. В современных реализациях сети хранения данных чаще всего используют протокол Fibre Channel, но в общем случае это не является обязательным, в связи с чем, принято выделять отдельный класс Fibre Channel SAN (сети хранения данных на основе Fibre Channel).

Основой SAN является отдельная от LAN/WAN сеть, которая служит для организации доступа к данным серверов и рабочих станций, непосредственно занимающихся обработкой. Такая структура делает построение систем с высокой готовностью и высокой интенсивностью запросов относительно простой задачей. Несмотря на то, что SAN сегодня остается дорогим удовольствием, TCO (общая стоимость владения) для средних и больших систем, построенных с использованием технологии сетей хранения данных, является довольно низкой. Описание способов снижения TCO корпоративных систем хранения данных благодаря SAN можно найти на страницах ресурса techTarget: http://searchstorage.techtarget.com.

Сегодня стоимость дисковых накопителей с поддержкой Fibre Channel, как наиболее распространенного интерфейса для построения SAN, близка к стоимости систем с традиционными недорогими канальными интерфейсами (такими как параллельный SCSI). Главными стоимостными составляющими в SAN остается коммуникационная инфрастуктура, а также стоимость ее развёртывания и сопровождения. В связи с чем, в рамках SNIA и многих коммерческих организациях ведётся активная работа над технологиями IP Storage, что позволяет использовать значительно более недорогую аппаратуру и инфраструктуру IP-сетей, а также колоссальный опыт специалистов в этой сфере.

Примеров по эффективному использованию SAN можно привести достаточно много. Практически везде, где имеется необходимость использования нескольких серверов с совместной системой хранения данных, можно использовать SAN. Например, для организации коллективной работы над видеоданными или предварительной обработки печатной продукции. В такой сети каждый участник процесса обработки цифрового контента получает возможность практически одновременно работать над Терабайтами данных. Или, например, организация резервирования больших объемов данных, которыми пользуется множество серверов. При построении SAN и использовании независимого от LAN/WAN алгоритма резервирования данных и технологий «моментальной копии», можно резервировать почти любые объёмы информации без ущерба функциональности и производительности всего информационного комплекса.

Fibre Channel в сетях хранения данных

Безусловным фактом является то, что сегодня именно FC (Fibre Channel) доминирует в сетях хранения данных. И именно развитие этого интерфейса привело к развитию самой концепции SAN.

В проектировании FC принимали участие специалисты со значительным опытом в разработке как канальных, так и сетевых интерфейсов, и им удалось объединить все важные положительные черты обоих направлений. Одним из важнейших преимуществ Fibre Channel наряду со скоростными параметрами (которые, кстати, не всегда являются главными для пользователей SAN, и могут быть реализованы с помощью других технологий) является возможность работы на больших расстояниях и гибкость топологии, которая пришла в новый стандарт из сетевых технологий. Таким образом, концепция построения топологии сети хранения данных базируется на тех же принципах, что и традиционные локальные сети, на основе концентраторов, коммутаторов и маршрутизаторов, что значительно упрощает построение многоузловых конфигураций систем, в том числе без единой точки отказов.

Стоит также отметить, что в рамках Fibre Channel для передачи данных используются как оптоволоконные, так и медные среды. При организации доступа к территориально удаленным узлам на расстоянии до 10 киллометров используется стандартная аппаратура и одномодовое оптоволокно для передачи сигнала. Если же узлы разнесены на 10-ки или даже 100-ни километров используются специальные усилители. При построении таких SAN учитываются достаточно нетрадиционные для систем хранения данных параметры, например, скорость распространения сигнала в оптоволокне.

Тенденции развития систем хранения данных

Мир систем хранения данных чрезвычайно разнообразен. Возможности систем хранения данных, так и стоимость решений достаточно дифференцирована. Существуют решения, объединяющие в себе возможности обслуживания сотен тысяч запросов в секунду к десяткам и даже сотням Терабайт данных, а также решения для одного компьютера с недорогими дисками с IDE-интерфейсом.

IDE RAID

В последнее время максимальный объем дисков с IDE-интерфейсом колоссально увеличился и опережает SCSI-диски примерно в два раза, а если говорить о соотношении цена на единицу объёма, то IDE-диски лидируют с разрывом более чем в 6 раз. Это, к сожалению, не повлияло положительно на надежность IDE-дисков, но всё же сфера их применения в автономных системах хранения данных неумолимо увеличивается. Главным фактором в этом процессе является то, что потребность в больших объёмах данных растёт быстрее, чем объем одиночных дисков.

Еще несколько лет назад редкие производители решались выпускать автономные подсистемы, ориентированные на использование IDE-дисков. Сегодня их выпускает практически каждый производитель, ориентированный на рынок систем начального уровня. Наибольшее распространение в классе автономных подсистем с IDE-дисками наблюдается в NAS-системах начального уровня. Ведь если вы используете NAS в качестве файлового сервера с интерфейсом Fast Ethernet или даже Gigabit Ethernet, то в большинстве случаев быстродействия таких дисков является более чем достаточным, а их низкая надёжность компенсируется использованием технологии RAID.

Там, где необходим блочный доступ к данным при минимальной цене за единицу хранимой информации, сегодня активно используются системы с IDE-дисками внутри и с внешним SCSI-интерфейсом. Например, на системе JetStor IDE производства американской компании AC&NC для построения отказоустойчивого архива с объёмом хранимых данных в 10 Терабайт и возможностью быстрого блочного доступа к данным стоимость хранения одного Мегабайта будет составлять меньше 0,3 цента.

Ещё одной интересной и достаточно оригинальной технологией, с которой пришлось познакомиться совсем недавно, была система Raidsonic SR-2000 с внешним параллельным IDE-интерфейсом.

Рисунок 4. Автономный IDE RAID начального уровня

Это автономная дисковая система, рассчитанная на использование двух IDE дисков и ориентированная на монтаж внутри корпуса хост-системы. Она абсолютно независима от операционной системы на хост-машине. Система позволяет организовать RAID 1 (зеркало) или просто копирование данных с одного диска на другой с возможностью горячей замены дисков, без какого-либо ущерба или неудобства со стороны пользователя компьютера, чего не скажешь о шинно-ориентированых подсистемах, построенных на контроллерах PCI IDE RAID.

Следует заметить, что ведущие производители IDE-дисков анонсировали выпуск дисков среднего класса с интерфейсом Serial ATA, в которых будут использоваться высокоуровневые технологии. Это должно благоприятно повлиять на их надежность и увеличить долю ATA-решений в системах хранения данных.

Что нам принесёт Serial ATA

Первое и самое приятное, что можно найти в Serial ATA — это кабель. В связи с тем, что интерфейс ATA стал последовательным, кабель стал круглым, а коннектор — узким. Если вам приходилось укладывать кабели параллельного IDE-интерфейса в системе на восемь IDE-каналов, я уверен, что вам понравится эта особенность. Конечно, уже давно существовали круглые IDE-кабели, но коннектор у них всё же оставался широким и плоским, да и максимально допустимая длина параллельного ATA-кабеля не радует. При построении систем с большим количеством дисков, наличие стандартного кабеля вообще не сильно помогает, так как кабели приходится делать самостоятельно, и при этом их укладка становится едва ли не главной по времени задачей при сборке.

Кроме особенности кабельной системы, в Serial ATA есть другие нововведения, которые для параллельной версии интерфейса реализовать самостоятельно с помощью канцелярского ножа и другого подручного инструмента не удастся. В дисках с новым интерфейсом скоро должна появиться поддержка набора инструкций Native Command Queuing (конвейеризации команд). При использовании Native Command Queuing, контроллер Serial ATA анализирует запросы ввода-вывода и оптимизирует очередность их выполнения таким образом, чтобы минимизировать время поиска. Достаточно очевидна схожесть идеи Serial ATA Native Command Queuing с организацией очереди команд в SCSI, правда, для Serial ATA будет поддерживаться очередь до 32 команд, а не традиционных для SCSI — 256. Появилась также родная поддержка горячей замены устройств. Конечно, такая возможность существовала и ранее, но её реализация была за рамками стандарта и, соответственно, не могла получить широкое распространение. Говоря о новых скоростных возможностях Serial ATA, следует заметить, что сейчас от них радости пока большой нет, но главное здесь то, что на будущее есть хороший Roadmap, реализовать который в рамках параллельного ATA было бы очень не просто.

Учитывая сказанное, можно не сомневаться, что доля ATA-решений в системах хранения начального уровня должна увеличиться именно за счёт новых дисков Serial ATA и систем хранения данных, ориентированных на использование таких устройств.

Куда идет параллельный SCSI

Все, кто работает с системами хранения данных, даже начального уровня, вряд ли могут сказать, что им нравятся системы с IDE-дисками. Главное преимущество ATA дисков — их низкая цена, по сравнению со SCSI-устройствами ну и еще, наверное, более низкий уровень шума. И происходит всё это по простой причине, так как SCSI-интерфейс лучше подходит для использования в системах хранения данных и пока значительно дешевле, чем еще более функциональный интерфейс — Fibre Channel, то и диски со SCSI-интерфейсом производятся более качественные, надёжные и быстрые, чем с дешёвым IDE-интерфейсом.

Сегодня многие производители при проектировании систем хранения с параллельным SCSI используют Ultra 320 SCSI, самый новый интерфейс в семействе. Некогда во многих Roadmap были планы по выпуску устройств с интерфейсом Ultra 640 и даже Ultra 1280 SCSI, но всё шло к тому, что в интерфейсе нужно что-то менять кардинальным образом. Параллельный SCSI уже сейчас, на этапе использования Ultra 320, многих не устраивает, главным образом по причине неудобства использования классических кабелей.

К счастью, недавно появился новый интерфейс Serial Attached SCSI (SAS). У нового стандарта будут интересные особенности. Он объединяет в себе некоторые возможности Serial ATA и Fibre Channel. Несмотря на эту странность, следует сказать, что в таком переплетении есть некий здравый смысл. Стандарт возник на основе физических и электрических спецификаций последовательного ATA с такими усовершенствованиями, как увеличение уровня сигнала для соответствующего увеличения длинны кабеля, увеличение максимальной адресуемости устройств. А самое интересное то, что технологи обещают обеспечить совместимость устройств Serial ATA и SAS, но только в следующих версиях стандартов.

К наиболее важным особенностям SAS можно отнести:

интерфейс точка-точка;
двухканальный интерфейс;
поддержка 4096 устройств в домене;
стандартный набор команд SCSI;
кабель длинной до 10 метров;
кабель 4-жильный;
полный дуплекс.

Благодаря тому, что новый интерфейс предлагает использовать такой же миниатюрный коннектор, как и Serial ATA, у разработчиков появляется новая возможность по построению более компактных устройств с высокой производительностью. Стандарт SAS также предусматривает использование расширителей. Каждый расширитель будет поддерживать адресацию 64-х устройств с возможностью каскадирования до 4096 устройств в рамках домена. Это конечно значительно меньше, чем возможности Fibre Channel, но в рамках систем хранения начального и среднего уровней, с накопителями, напрямую подсоединенными к серверу, этого вполне достаточно.

Несмотря на все прелести, интерфейс Serial Attached SCSI вряд ли быстро заместит обычный параллельный интерфейс. В мире решений для предприятий разработки обычно ведутся более тщательно и, естественно, в течение большего времени, чем для настольных систем. Да и уходят старые технологии не очень быстро, так как период, за который они отрабатывают себя, тоже немаленький. Но всё же, в году 2004 устройства с интерфейсом SAS должны выйти на рынок. Естественно, сначала это будут в основном диски и PCI-контролеры, но ещё через годик подтянутся и системы хранения данных.

Для лучшего обобщения информации предлагаем ознакомиться со сравнением современных и новых интерфейсов для систем хранения данных в виде таблицы.

Параметры	Serial ATA	SCSI	SAS	FC
Число адресуемых устройств	16	16	4096	2 24
Расстояние, м	1м	12м	10м	медь: 30м оптика: 104м 1
Топология соединения устройств	точка-точка	шина	точка-точка	кольцо 2 , точка-точка
Скорость, Мбайт/с	150; 300	320;	150; 300;	100; 200; 400;
Полный дуплекс	Нет	Нет	Да	Да
Протоколы	ATA, SCSI 4	SCSI	ATA, SCSI	независимый 3
Поддержка двухпортовых устройств	Нет	Нет	Да	Да

1 — Стандарт регламентирует расстояние до 10 км для одномодового оптоволокна, существуют реализации устройств для передачи данных на расстояние больше чем, 105 м.

2 — В рамках внутренней виртуальной топологии кольца работают концентраторы и некоторые коммутаторы FC, также существует много реализаций коммутаторов, которые обеспечивают соединение точка-точка любых устройств, подсоединенных к ним.

3 — Cуществуют реализации устройств со SCSI, FICON, ESCON, TCP/I, HIPPI, VI протоколами.

4 — Дело в том, что устройства будут взаимно совместимы (так обещают сделать в ближайшем будущем производители). То есть SATA-контроллеры будут поддерживать SAS-диски, а SAS-контроллеры — диски SATA.

Массовое увлечение NAS

Последнее время за рубежом отмечается просто-таки массовое увлечение NAS-накопителями. Дело в том, что с увеличением актуальности ориентированного на данные подхода к построению информационных систем увеличилась привлекательность специализации классических файл-серверов и формирование новой маркетинговой единицы — NAS. При этом опыт в построении подобных систем был достаточным для быстрого старта технологии накопителей, подсоединенных к сети, а стоимость их аппаратной реализации была предельно низкой. Сегодня NAS-накопители производят фактически все производители систем хранения данных, среди них и системы начального уровня за очень маленькие деньги, и среднего, и даже системы, отвечающие за хранение десятков Терабайт информации, способные обработать колоссальное количество запросов. В каждом классе NAS-систем есть свои интересные оригинальные решения.

NAS на основе PC за 30 минут

Мы хотим немного описать одно оригинальное решение начального уровня. О практической ценности его реализации можно спорить, но в оригинальности ему не откажешь.

По сути дела, NAS-накопитель начального уровня, да и не только начального, является достаточно простым персональным компьютером с неким количеством дисков и программной частью, которая обеспечивает доступ других участников сети к данным на файловом уровне. Таким образом, для построения NAS устройства достаточно взять указанные компоненты и соединить их между собой. Все дело в том, насколько качественно вы это сделаете, настолько же надежный и качественный доступ к данным получит рабочая группа, работающая с данными, доступ к которым обеспечивает ваше устройство. Именно учитывая эти факторы, а также время развёртывания решения, плюс некоторые дизайнерские изыскания строится NAS-накопитель начального уровня.

Разница между хорошим NAS-решением начального уровня с самостоятельно собранной и настроенной в рамках выбранной ОС персоналкой, если опять-таки опустить конструктивное исполнение, будет в том:

насколько быстро вы это сделаете;
насколько просто сможет обслуживаться эта система неквалифицированным персоналом;
насколько качественно это решение будет работать и поддерживаться.

Другими словами, в случае профессионального подбора комплектующих и существования некого изначально настроенного набора программного обеспечения, можно достичь хорошего результата. Истина вроде банальная, это же можно сказать о любой задаче, которая решается по схеме готовых компонентных решений: «hardware» плюс «software».

Что предлагает сделать компания «X»? Формируется достаточно ограниченый список совместимых комплектующих: материнских плат со всем интегрированным хозяйством, нужных NAS-серверу начального уровня жёстких дисков. Вы покупаете устанавливаемый в IDE-разъём на материнской плате FLASH диск с записанным программным обеспечением и получаете готовый NAS накопитель. Операционная система и утилиты, записанные на этот диск, загружаясь, конфигурируют нужные модули адекватным образом. И в результате пользователь получает устройство, которое может управляться как локально, так и удаленно через HTML-интерфейс и предоставлять доступ к дисковым накопителям, подключённым к нему.

Файловые протоколы в современных NAS

CIFS (Common Internet File System) — это стандартный протокол, который обеспечивает доступ к файлам и сервисам на удаленных компьютерах (в том числе и в Интернет). Протокол использует клиент-серверную модель взаимодействия. Клиент создает запрос к серверу на доступ к файлам или передачу сообщения программе, которая находится на сервере. Сервер выполняет запрос клиента и возвращает результат своей работы. CIFS — это открытый стандарт, который возник на основе SMB-протокола (Server Message Block Protocol), разработанного Microsoft, но, в отличие от последнего, CIFS учитывает возможность возникновения больших таймаутов, так как ориентирован на использование в том числе и в распределённых сетях. SMB-протокол традиционно использовался в локальных сетях с ОС Windows для доступа к файлам и печати. Для транспортировки данных CIFS использует TCP/IP протокол. CIFS обеспечивает функциональность похожую на FTP (File Transfer Protocol), но предоставляет клиентам улучшенный (похожий на прямой) контроль над файлами. Он также позволяет разделять доступ к файлам между клиентами, используя блокирование и автоматическое восстановление связи с сервером в случае сбоя сети.

NFS (Network File System) — это стандарт IETF, который включает в себя распределенную файловую систему и сетевой протокол. NFS был разработан компанией Sun Microsystem Computer Corporation. Он первоначально использовался только в UNIX-системах, позже реализации клиентской и серверной чатей стали распространенными и в других системах.

NFS, как и CIFS, использует клиент-серверную модель взаимодействия. Он обеспечивает доступ к файлам на удаленном компьютере (сервере) для записи и считывания так, как если бы они находились на компьютере пользователя. В ранних версиях NFS для транспортирования данных использовался UDP-протокол, в современных — используется TCP/IP. Для работы NFS в интерент компанией Sun был разработан протокол WebNFS, который использует расширения функциональности NFS для его корректной работы во всемирной сети.

DAFS (Direct Access File System) — это стандартный протокол файлового доступа, который базируется на NFSv4. Он позволяет прикладным задачам передавать данные в обход операционной системы и ее буферного пространства напрямую к транспортным ресурсам, сохраняя семантику, свойственную файловым системам. DAFS использует преимущества новейших технологий передачи данных по схеме память-память. Его использование обеспечивает высокие скорости файлового ввода-вывода, минимальную загрузку CPU и всей системы, благодаря значительному уменьшению количества операций и прерываний, которые обычно необходимы при обработке сетевых протоколов. Особенно эффективным является использование аппаратных средств поддержки VI (Virtual Interface).

DAFS проектировался с ориентацией на использование в кластерном и серверном окружении для баз данных и разнообразных интернет-приложений, ориентированных на непрерывную работу. Он обеспечивает наименьшие задержки доступа к общим файловым ресурсам и данным, а также поддерживает интеллектуальные механизмы восстановления работоспособности системы и данных, что делает его очень привлекательным для использования в High-End NAS-накопителях.

Все дороги ведут к IP Storage

В системах хранения данных высокого и среднего уровня за последние несколько лет появилось очень много новых интересных технологий.

Fibre Channel сети хранения данных сегодня уже достаточно известная и популярная технология. В то же время, их массовое распространение сегодня является проблематичным из-за ряда особенностей. К ним можно отнести высокую стоимость реализации и сложность построения географически распределённых систем. С одной стороны — это всего лишь особенности технологии уровня предприятия, но с другой, если SAN станет дешевле, и построение распределённых систем упростится, это должно дать просто-таки колоссальный прорыв в развитии сетей хранения данных.

Рассказывая о новых технологиях в сетях хранения данных, мне хотелось бы остановиться на так называемых IP Storage решениях, накопителях, доступ к которым осуществляется с использованием IP-технологий. Более детально о iSCSI можно прочитать здесь — http://www.ixbt.com/storage/iscsi.shtml.

В рамках работы над сетевыми технологиями хранения данных в Internet Engineering Task Force (IETF) была создана рабочая группа и форум IP Storage (IPS) по направлениям:

FCIP — Fibre Channel over TCP/IP, созданный на базе TCP/IP туннельный протокол, функцией которого является соединение географически удаленных FC SAN без какого либо воздействия на FC и IP протоколы.

iFCP — Internet Fibre Channel Protocol, созданный на базе TCP/IP протокол для соединения FC систем хранения данных ли FC сетей хранение данных, используя IP инфраструктуру совместно или вместо FC коммутационных и маршрутизирующих элементов.

iSNS — Internet Storage Name Service, протокол поддержке имён накопителей в сети Интернет.

iSCSI — Internet Small Computer Systems Interface, это протокол, который базируется на TCP/IP и разработан для установления взаимодействия и управления системами хранения данных, серверами и клиентами (Определение SNIA — IP Storage Forum: www.snia.org).

Самым бурно развивающимся и самым интересным из перечисленных направлений является iSCSI.

iSCSI — новый стандарт

11 февраля 2003 года iSCSI стал официальным стандартом. Ратификация iSCSI обязательно повлияет на более широкий интерес к стандарту, который уже развивается достаточно активно. Быстрее всего развитие iSCSI послужит толчком к распространению SAN в малом и среднем бизнесе, так как использование соответствующего стандарту оборудования и подхода к обслуживанию (в том числе распространённого в рамках стандартных Ethernet сетей) позволит сделать сети хранения данных значительно дешевле. Что же касается использования iSCSI в Интернет, то сегодня здесь уже неплохо прижился FCIP, и конкуренция с ним будет трудной.

Новый стандарт охотно поддержали известные IT-компании. Есть, конечно, и противники, но всё же, практически все компании, которые активно участвуют в рынке систем начального и среднего уровня, уже работают над устройствами с поддержкой iSCSI. В Windows и Linux iSCSI драйверы уже включены, системы хранения данных iSCSI производит IBM, адаптеры — Intel, в ближайшее время подключиться к процессу освоения нового стандарта обещают HP, Dell, EMC.

Одной из очень интересных особенностей iSCSI является то, что для передачи данных на накопителе с интерфейсом iSCSI можно использовать не только носители, коммутаторы и маршрутизаторы существующих сетей LAN/WAN, но и обычные сетевые адаптеры Fast Ethernet или Gigabit Ethernet на стороне клиента. Правда, при этом возникают значительные накладные расходы процессорной мощности ПК, который использует такой адаптер. По утверждению разработчиков, программная реализация iSCSI может достичь скоростей среды передачи данных Gigabit Ethernet при значительной, до 100% загрузке современных CPU. В связи с чем рекомендуется использование специальных сетевых карточек, которые будут поддерживать механизмы разгрузки CPU от обработки стека TCP.

Виртуализация в сетях хранения данных

Ёщё одной важной технологией в построении современных накопителей и сетей хранения данных является виртуализация.

Виртуализация систем хранения данных — это представление физических ресурсов в некоем логическом, более удобном виде. Эта технология позволяет гибко распределять ресурсы между пользователями и эффективно ими управлять. В рамках виртуализации успешно реализуется удаленное копирование, моментальная копия, распределение запросов ввода-вывода на наиболее подходящие по характеру обслуживания накопители и множество других алгоритмов. Реализация алгоритмов виртуализации может осуществляться как средствами самого накопителя, так и с помощью внешних устройств виртуализации или же с помощью управляющих серверов, на которых работает специализированное программное обеспечение под стандартными ОС.

Это, конечно, очень малая часть того, что можно сказать о виртуализации. Эта тема очень интересна и обширна, поэтому мы решили посвятить ей отдельную публикацию.

Источник