- Новые технологии хранения данных: ждет ли нас прорыв в 2020 году?
- Программно-определяемые сети хранения данных
- Емкость HDD-накопителей вырастет до 32 Тбайт
- NVMe-накопители станут еще быстрее
- QLC-память наконец-то “выстрелит”?
- SCM-память: скорость, близка к DRAM
- От обозримой реальности к далекому будущему
- Структура ДНК, как основа для будущих хранилищ данных
- Не ДНК единым…: молекулярные накопители
- 5D-оптическая память: революция в хранении данных
- Основы информатики
- Технические средства хранения информации
- Кодирование информации
- Единицы измерения информации
Новые технологии хранения данных: ждет ли нас прорыв в 2020 году?
В течение нескольких десятилетий прогресс в технологиях хранения информации измерялся, прежде всего, с точки зрения емкости накопителей и скорости чтения/записи данных. Со временем к этим параметрам оценки прибавились технологии и методологии, которые делают HDD- и SSD-накопители умнее, гибче и проще в управлении. Каждый год производители накопителей традиционно намекают на то, что рынок больших данных изменится, и 2020 год — не исключение. IT-лидеры усиленно ищут эффективные способы хранения огромных потоков данных и управления ими, а, следовательно, вновь обещают изменить прежний курс развития систем хранения. В данной статье мы собрали самые передовые технологии размещения информации, а также расскажем о концепциях футуристических накопителей, которым еще только предстоит обрести свою физическую реализацию.
Программно-определяемые сети хранения данных
Если говорить о процессах автоматизации, гибкости и увеличения емкости хранения информации вкупе с повышением эффективности работы персонала, все больше предприятий рассматривает возможность перехода на так называемые программно-определяемые сети хранения или SDS (Software-Defined Storage).
Ключевая фишка технологии SDS заключается в отделении аппаратной части от софтверной: то есть подразумевается виртуализация функций хранения данных. К тому же, в отличие от обычных систем хранения с сетевым подключением (NAS) или сетей хранения данных (SAN), SDS предназначен для работы в любой стандартной системе x86. Довольно часто цель разворачивания SDS состоит в том, чтобы улучшить операционные расходы (OpEx), требуя меньше административных усилий.
Емкость HDD-накопителей вырастет до 32 Тбайт
Традиционные магнитные накопители вовсе не умерли, а всего лишь переживают технологический ренессанс. Современные HDD уже могут предложить пользователям до 16 Тбайт для хранения данных. В течение следующих пяти лет — эта емкость вырастет вдвое. При этом накопители на жестких магнитных дисках по-прежнему останутся самым доступным хранилищем произвольного доступа и сохранят за собой первенство в цене за гигабайт дискового пространства еще на много лет.
Наращивание емкости будет происходить на основе уже известных технологий:
- Гелиевые накопители (гелий снижает аэродинамическое сопротивление и турбулентность, позволяя установить в накопитель больше магнитных пластин; при этом тепловыделение и энергопотребление не увеличивается);
- Термомагнитные накопители (или HAMR HDD, появление которых ожидается в 2021 году и построено на принципе микроволновой записи данных, когда участок диска нагревается лазером и перемагничивается);
- HDD на базе черепичной записи (или SMR-накопители, где размещение дорожек с данными происходит друг над другом, в формате черепичной кладки; это и обеспечивает высокую плотность записи информации).
Гелиевые накопители особенно востребованы в облачных дата-центрах, а SMR HDD оптимальны для хранения больших архивов и библиотек данных, доступ и обновление данных, в которых требуются не особо часто. Также они идеально подходят для создания резервных копий.
NVMe-накопители станут еще быстрее
Первые SSD-накопители подключались к системным платам через интерфейс SATA или SAS, но разработаны эти интерфейсы уже более 10 лет назад для магнитных HDD-дисков. Современный же протокол NVMe является гораздо более мощным протоколом связи, предназначенным для систем, обеспечивающих высокую скорость обработки данных. Как итог, на рубеже 2019-2020 года мы видим серьезное падение цен на NVMe SSD, которые становятся доступными для любого класса пользователей. В корпоративном сегменте NVMe-решения особенно ценятся теми предприятиями, которым необходимо осуществление анализа больших данных в реальном времени.
Такие компании, как Kingston и Samsung уже показали, на что могут рассчитывать корпоративные пользователи в 2020 году: мы все ждем появления NVMe SSD с поддержкой PCIe 4.0, которые позволяют добавить ЦОД еще больше скорости при работе с данными. Заявленная производительность новинок составляет 4,8 Гбайт/с, и это далеко не предел. Следующие поколения Kingston NVMe SSD PCIe gen 4.0 смогут обеспечить пропускную способность на уровне 7 Гбайт/с.
Вместе со спецификацией NVMe-oF (или NVMe over Fabrics) организации смогут создавать высокопроизводительные сети хранения данных с минимальными задержками, которые составят весомую конкуренцию ЦОД с прямым подключением DAS (или Direct-attached storage). При этом с использованием NVMe-oF операции ввода/вывода обрабатываются эффективнее, в то время как задержка сравнима с DAS-системами. Аналитики предсказывают, что развертывание систем, работающих по протоколу NVMe-oF стремительно ускорится в 2020 году.
QLC-память наконец-то “выстрелит”?
Флеш-память NAND Quad Level Cell (QLC), также будет демонстрировать растущую популярность на рынке. QLC была введена в 2019 году и поэтому имела минимальное распространение на рынке. Это изменится в 2020 году, особенно среди компаний, которые внедрили технологию LightOS Global Flash Translation Layer (GFTL) для преодоления присущих QLC проблем.
Согласно прогнозам аналитиков, рост продаж SSD-накопителей на базе QLC-ячеек увеличится на 10%, в то время как TLC-решения “захватят” 85% рынка. Как ни крути, а QLC SSD все еще сильно отстает в производительности по сравнению с TLC SSD и не станет основой для ЦОД в ближайшие лет пять.
В то же время, ожидается, что стоимость флеш-памяти NAND в 2020 году вырастет, поэтому поставщик контроллеров SSD Phison, например, делает ставку на то, что повышение цен, в конечном итоге, подтолкнет потребительский рынок твердотельных накопителей к использованию 4-битной флэш-памяти QLC NAND. Кстати, Intel планирует запустить в продажу 144-слойные QLC-решения (вместо 96-слойных продуктов). Что ж…, кажется, нас ждет дальнейшая маргинализация HDD.
SCM-память: скорость, близка к DRAM
Широкое распространение SCM-памяти (Storage Class Memory) предсказывалось несколько лет, и 2020 год может стать отправной точкой, в которой эти предсказания, наконец, сбудутся. В то время как модули памяти Intel Optane, Toshiba XL-Flash и Samsung Z-SSD уже вышли на корпоративный рынок, их появление не вызвало ошеломляющей реакции.
Устройство Intel сочетает в себе характеристики быстрой, но нестабильной DRAM с более медленным, но постоянным хранилищем NAND. Эта комбинация направлена на повышение способности пользователей работать с большими массивами данных, обеспечивая как скорость DRAM, так и емкость NAND. SCM-память не просто быстрее, чем альтернативы на базе NAND: она в десятки раз быстрее. Задержка составляет микросекунды, а не миллисекунды.
Эксперты рынка отмечают, что центры обработки данных, планирующие использовать SCM будут ограничены тем, что данная технология будет работать лишь на серверах с использованием процессоров Intel поколения Cascade Lake. Однако, по их мнению, это не станет камнем преткновения, чтобы остановить волну обновлений существующих ЦОД в целях обеспечить высокие скорости обработки информации.
От обозримой реальности к далекому будущему
Для большинства пользователей хранение данных не сопряжено с ощущением “емкостного Армагеддона”. Но только задумайтесь: 3,7 миллиарда человек, которые в настоящее время пользуются Интернетом, ежедневно генерируют около 2,5 квинтиллиона байтов данных. Для удовлетворения этой потребности необходимо все больше центров обработки данных.
Если верить статистике, к 2025 году мир готов к обработке 160 Зетабайт данных в год (это больше байтов, чем звезд в обозримой Вселенной). Вероятно, что дальше нам придется покрыть каждый квадратный метр планеты Земля ЦОД’ами, иначе корпорации просто не смогут подстроиться под столь высокий рост информации. Или же… придется отказываться от некоторых данных. Впрочем, есть несколько потенциально интересных технологий, которые могли бы решить нарастающую проблему информационного переполнения.
Структура ДНК, как основа для будущих хранилищ данных
Не только IT-корпорации ищут новые способы хранения и обработки информации, но и многие научные деятели. Глобальная задача — обеспечить сохранение информации в течение тысячелетий. Исследователи из Швейцарской высшей технической школы Цюриха (ETH Zurich, Швейцария) полагают, что решение нужно искать в органической системе хранения данных, которая существует в каждой живой клетке: в ДНК. И главное — “придумана” эта система задолго до появления компьютера.
Нити ДНК очень сложны, компактны и невероятно плотны, как носители информации: по мнению ученых, в грамм ДНК можно записать 455 Эксабайт данных, где 1 Эбайт эквивалентен миллиарду гигабайт. Первые эксперименты уже позволили осуществить запись 83 Кбайт информации в ДНК, после чего преподаватель кафедры химии и биологических наук, Роберт Грасс, высказал идею о том, что в новом десятилетии медицинской сфере нужно плотнее объединиться с IT-структурой для совместных разработок в области технологий записи и хранения данных.
По мнению ученых, органические накопители данных на базе цепей ДНК смогли бы хранить информацию до миллиона лет и безошибочно предоставлять ее по первому запросу. Не исключено, что через несколько десятилетий большинство накопителей будут бороться именно за эту возможность: умение надежно и емко хранить данные в течение длительного времени.
Швейцарцы не единственные, кто работает над созданием систем хранения на основе ДНК. Этот вопрос поднимался еще с 1953 года, когда Фрэнсис Крик открыл двойную спираль ДНК. Но в тот момент человечеству попросту не хватало знаний для подобных экспериментов. Традиционное мышление в области хранения данных на основе ДНК сфокусировано на синтезе новых молекул ДНК; сопоставление последовательности битов с последовательностью четырех пар оснований ДНК и создание достаточного количества молекул для представления всех чисел, которые необходимо сохранить. Так, летом 2019 года инженерам из компании CATALOG удалось записать 16 Гбайт англоязычной “Википедии” в ДНК, созданную из синтетических полимеров. Проблема заключается в том, что этот процесс медленный и дорогой, что является существенным узким местом, когда речь идет о хранении данных.
Не ДНК единым…: молекулярные накопители
Исследователи из Университета Брауна (Brown University, США) заявляют, что молекула ДНК — не единственный вариант молекулярного хранения данных сроком до миллиона лет. В качестве органического хранилища могут выступать и низкомолекулярные метаболиты. При записи информации в набор метаболитов, молекулы начинают взаимодействовать друг с другом и производить новые электрически нейтральные частицы, которые содержат записанные в них данные.
К слову, исследователи не остановились на этом и расширили набор органических молекул, что позволило увеличить плотность записываемых данных. Считывание же такой информации возможно посредством химического анализа. Единственный минус — реализация такого органического накопителя пока не представляется возможной на практике, вне лабораторных условий. Это всего лишь наработка на будущее.
5D-оптическая память: революция в хранении данных
Еще одно экспериментальное хранилище принадлежит разработчикам из Саутгемптонского университета (University of Southampton, Англия). В стремлении создать инновационную цифровую систему хранения информации, которая сможет существовать миллионы лет, научные деятели разработали процесс записи данных на крошечный кварцевый диск, который основан на фемтосекундной импульсной записи. Система хранения предназначена для архивирования и холодного хранения больших объемов данных и описывается, как пятимерное хранилище.
Почему пятимерное? Дело в том, что информация кодируется в нескольких слоях, включая обычные три измерения. К этим измерениям добавляются еще два — размер и ориентация по наноточкам. Емкость данных, которые можно записать на такой мини-накопитель, составляет до 100 Петабайт, а срок хранения — 13,8 млрд. лет при температуре до 190°C. Максимальная же температура нагрева, которую может выдержать диск составляет 982 °C. Короче…, он практически вечный!
Недавно работа сотрудников Саутгемптонского университета привлекла внимание компании Microsoft, чья программа облачного хранения данных Project Silica направлена на переосмысление нынешних технологий хранения данных. По прогнозам “мелкомягких” к 2023 году в облаках будет храниться более 100 Зетабайт информации, так что сложности возникнут даже у крупномасштабных систем хранения.
Для получения дополнительной информации о продуктах Kingston Technology обращайтесь на официальный сайт компании.
Источник
Основы информатики
Технические средства хранения информации
Основной принцип хранения информации можно сформулировать следующим образом: сохраненная информация всегда имеет форму «следа», оттиска на каком-нибудь носителе.
Тип носителя роли не играет. Это может быть камень, дерево , бумага, магнитная лента или фотопленка. След в форме некоторого знака на камне, дереве и бумаге может быть нанесен непосредственно человеческой рукой, вооруженной резцом, кистью или карандашом. Он виден невооруженным взглядом и может быть легко прочитан.
Использование в качестве носителей информации фотопленки, магнитной ленты и лазерного диска требует специальных устройств — преобразователей информации. Так, для записи информации на фотопленку требуется фотоаппарат, а для считывания информации — проектор. Магнитные запись и считывание информации осуществляются с помощью магнитофона.
Характерной чертой всех этих типов носителей является необходимость наличия специальных технических устройств как для записи, так и для считывания информации. Это означает возможность механизации и автоматизации процессов записи и чтения информации, делает их независимыми от присутствия человека.
Сегодня совершенствование компьютера как универсального средства обработки информации привело к созданию целого ряда устройств, специально предназначенных для хранения информации в электронной форме.
Такие современные материалы, как фотопленка и магнитная лента, способны удовлетворить большинству требований, но они не лишены недостатков. Общеизвестно, что со временем фотоснимки темнеют, прослушивание грампластинок сопровождается потрескиванием, а магнитные записи начинают «шуметь» после многократного проигрывания. Сегодня самый распространенный способ хранения информации — магнитная запись. Но и она может быть испорчена под воздействием температуры или магнита. Для хранения небольших порций информации используют гибкие магнитные диски ( floppy disks ), на смену которым приходят Zip дискеты. Для хранения больших объемов информации применяют » жесткие » диски ( hard disks), иногда называемые винчестерами.
Со временем объем информации, с которой работал человек и которую ему надо передать другому человеку, возрастал. Это привело к созданию нового типа носителя — лазерного диска.
Лазерный диск — трехслойный диск , изготовленный из стекла или прочной пластмассы. В нем между двумя тонкими защитными слоями пластмассы (стекла) помещен тонкий слой металлической фольги из серебра или даже из золота. Запись информации на такой диск осуществляется лучом лазера. Но записать информацию на лазерный диск можно всего один раз.
В последние годы найдены материалы, сочетающие в себе достоинства магнитного и оптического носителей и позволяющие перезаписывать информацию, хранящуюся на диске. Основными достоинствами магнитооптических дисков являются большая информационная емкость, компактность, мобильность, возможность перезаписи хранящейся информации.
Подробнее об устройствах, предназначенных для хранения информации на ЭВМ, рассказывается в разделе «Периферийные и внутренние устройства».
Кодирование информации
Кодирование информации — это процесс формирования определенного представления информации.
В более узком смысле под термином » кодирование » часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.
Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например «наложить» друг на друга звуки от разных источников.
Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать ) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.
Единицы измерения информации
Решая различные задачи, человек вынужден использовать информацию об окружающем нас мире. И чем более полно и подробно человеком изучены те или иные явления, тем подчас проще найти ответ на поставленный вопрос. Так, например, знание законов физики позволяет создавать сложные приборы, а для того, чтобы перевести текст на иностранный язык, нужно знать грамматические правила и помнить много слов.
Часто приходится слышать, что то или иное сообщение несет мало информации или, наоборот, содержит исчерпывающую информацию. При этом разные люди, получившие одно и то же сообщение (например, прочитав статью в газете), по -разному оценивают количество информации , содержащейся в нем. Это происходит оттого, что знания людей об этих событиях (явлениях) до получения сообщения были различными. Поэтому те, кто знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, чем написано в статье, скажут, что информации не получили вовсе. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя.
Однако иногда возникает ситуация, когда людям сообщают много новых для них сведений (например, на лекции), а информации при этом они практически не получают (в этом нетрудно убедиться во время опроса или контрольной работы). Происходит это от того, что сама тема в данный момент слушателям не представляется интересной.
Итак, количество информации зависит от новизны сведений об интересном для получателя информации явлении. Иными словами, неопределенность (т. е. неполнота знания) по интересующему нас вопросу с получением информации уменьшается. Если в результате получения сообщения будет достигнута полная ясность в данном вопросе (т. е. неопределенность исчезнет), говорят, что была получена исчерпывающая информация. Это означает, что необходимости в получении дополнительной информации на эту тему нет. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было ( нулевая информация ).
Если подбросить монету и проследить, какой стороной она упадет, то мы получим определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит .
Единица измерения информации называется бит ( bit ) — сокращение от английских слов binary digit, что означает двоичная цифра.
В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено — не намагничено, есть отверстие — нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое — цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь . Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding).
В информатике часто используется величина, называемая байтом ( byte ) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт , соответственно, 1 из 256 (2 8 ). В большинстве современных ЭВМ при кодировании каждому символу соответствует своя последовательность из восьми нулей и единиц, т. е. байт . Соответствие байтов и символов задается с помощью таблицы, в которой для каждого кода указывается свой символ. Так, например, в широко распространенной кодировке Koi8 -R буква «М» имеет код 11101101, буква «И» — код 11101001, а пробел — код 00100000.
Наряду с байтами для измерения количества информации используются более крупные единицы:
1 Кбайт (один килобайт ) = 2 10 байт = 1024 байта;
1 Мбайт (один мегабайт ) = 2 10 Кбайт = 1024 Кбайта;
1 Гбайт (один гигабайт ) = 2 10 Мбайт = 1024 Мбайта.
Пример. Книга содержит 100 страниц; на каждой странице — 35 строк, в каждой строке — 50 символов. Рассчитаем объем информации, содержащийся в книге.
Страница содержит 35 x 50 = 1750 байт информации. Объем всей информации в книге (в разных единицах):
Источник