- Какие накопители человечество будет использовать в будущем вместо магнитных и оптических?
- ДНК, алмазы или атомы с неспаренными электронами?
- Атомы
- Алмазы
- Голографическая память (награждается посмертно)
- Технологии хранения данных: что дальше?
- Популярность новых технологий пока невелика
- Ускорение доступа
- Перспективные технологии записи данных
- Между «памятью» и «диском»
- И сервер, и хранилище
Какие накопители человечество будет использовать в будущем вместо магнитных и оптических?
ДНК, алмазы или атомы с неспаренными электронами?
Фрагмент фейнмановской лекции «Там внизу много места». Блоки информации состоят из атомов хлора на медной пластинке. Принцип кодирования описан ниже. Изображение: TU Delft
Современные магнитные накопители обладают фундаментальным ограничением на предел плотности записи. Оно соответствует минимальному размеру магнитного домена. При этом ни магнитные, ни оптические накопители не способны сохранить информацию хотя бы несколько десятков лет, а это — секунды в человеческой истории. Это фундаментальная проблема, которая заставляет инженеров искать решение.
Поэтому сейчас человечество экспериментирует с несколькими новыми способами хранения информации — более надёжными, чем существующие. И с большей плотностью записи.
Гены, подобно алмазам, вечны, но в несколько ином плане, чем алмазы. Отдельный кристалл алмаза постоянно сохраняет неизменную атомную структуру. Молекула ДНК не обладает таким постоянством. Жизнь каждой отдельной физической молекулы ДНК довольно коротка, составляя, возможно, несколько месяцев, и безусловно не больше, чем продолжительность жизни человека. Но молекула ДНК может теоретически продолжать существование в виде копий самой себя в течение 100 млн. лет. Кроме того, подобно древним репликаторам в первичном бульоне, копии какого-то одного гена могут распространиться по всему миру. Разница лишь в том, что все современные варианты аккуратно упакованы в тела машин выживания. Всем этим я хочу подчеркнуть потенциальное квази-бессмертие гена в форме копий как его определяющее свойство. — Ричард Докинз, «Эгоистичный ген»
Впервые идею о хранении цифровой информации в молекуле ДНК затронул в 1959 году американский физик Ричард Фейнман в своей лекции под названием «Внизу полным-полно места: приглашение в новый мир физики».
По самой своей природе молекула ДНК является идеальным носителем информации, максимально плотным и надёжным. Одна крошечная молекула хранит мегабайты информации для развития целого организма на десятилетия вперёд, экспрессии определённых белков в определённом возрасте и так далее. При этом сами гены существуют сотни миллионов лет в виде своих копий.
Плотность информации в ДНК поражает воображение. Журнал Nature оценивает, что все данные мира возможно записать в ДНК-хранилище весом до одного килограмма.
Неудивительно, что у учёных появилась идея записывать цифровую информацию непосредственно в ДНК. В минувшие годы неоднократно проводились успешные эксперименты с записью бинарных данных в пары оснований ДНК. В 2010 году биологи из Гонконга сумели внедрить в клетку бактерии E.coli синтетическую ДНК, а в 2012 году учёные из Гарварда записали 643 килобайта данных в ДНК, поставив новый рекорд по количеству записанной информации.
К настоящему моменту синтез молекул ДНК начинается в промышленном масштабе. В апреле 2019 года исследователи Microsoft продемонстрировали первую полностью автоматизированную систему хранения данных в искусственно созданной ДНК с возможностью считывания. То есть такое оборудование уже реально можно использовать в дата-центрах.
Первая в мире полностью автоматизированная система хранения данных в ДНК, источник
Для кодирования информации в ДНК используется четверичная система счисления, по количеству нуклеотидов (0 = A, 1 = T, 2 = C, 3 = G). После программного перекодирования двоичных данных система использует стандартное оборудование для подачи необходимых жидкостей и реагентов в синтезатор, который собирает изготовленные фрагменты ДНК и помещает их в ёмкость для хранения. Когда необходимо извлечь информацию, в систему добавляются другие химические вещества для правильной подготовки ДНК и через микрофлюидные насосы жидкости проталкиваются в те части системы, которые считывают последовательности молекул ДНК и преобразуют их обратно в двоичный код. Система работает полностью автоматически. Нет никаких учёных в белых халатах, никакой лаборатории и тому подобных аксессуаров из экспериментов прошлого.
По словам исследователей из Microsoft, автоматизация — ключевая часть головоломки, чтобы организовать хранение данных в коммерческом масштабе и сделать его дешевле. Сейчас учёные дорабатывают отдельные модули этой автоматической системы, интегрируют в неё опенсорсное программное обеспечение и оборудование типа Puddle и PurpleDrop, чтобы запись информации в ДНК стала реально общедоступным стандартом.
Ещё предстоит решить главную проблему — низкую скорость записи информации (то есть синтеза ДНК).
Кроме синтеза искусственных ДНК, есть вариант записи цифровых данных в естественные ДНК. В каком-то смысле это даже более простой процесс, потому что недостатка в накопителях нет, их полно вокруг. Например, запись производят с помощью фермента пирококка (Pyrococcus furiosus) PfAgo, который механически разрывает цепочки ДНК в специфических местах. В данном случае единица — наличие разрыва, а ноль — его отсутствие в возможном месте разрыва. Подробнее см. статью «DNA punch cards for storing data on native DNA sequences via enzymatic nicking» в журнале Nature Communications (8 апреля 2020 года).
Атомы
Одна из альтернатив ДНК по плотности и долговечности хранения информации — наноструктуры.
Например, в 2016 году инженеры из Университета Дельфта создали пластинку из меди, на поверхности которой выстроена решётка атомов хлора. Меняя расположение «дырок» в решётке, авторы кодируют биты.
Метод кодирования информации
На одном квадратном сантиметре поверхности подобного материала помещается до 10 терабайт.
Фрагмент фейнмановской лекции «Там внизу много места», записанный на атомном уровне. Изображение: TU Delft
В 2017 году международная группа физиков добилась стабильной записи и хранения информации на протяжении нескольких часов в одиночных атомах гольмия. В данном случае носителем информации являются неспаренные электроны гольмия, то есть это тоже в каком-то смысле разновидность магнитной памяти.
Так или иначе, но информационная плотность 1 бит = 1 атом позволяет хранить на квадратном сантиметре материала порядка 10 петабайт данных (в случае монокристалла железа). Разумеется, объём информации зависит от того, какой конкретно материал используется и сколько у него атомов на сантиметр.
Алмазы
Один из экзотических накопителей информации — алмаз. Например, в 2016 году физики из Городского колледжа Нью-Йорка предложили в качестве бита памяти использовать дефект в трёхмерной решётке алмаза, так называемый NV-центр. Учёные продемонстрировали способ записи, многократной перезаписи и считывания информации, которая надёжно хранится в алмазе сколько угодно долгое время (но только в полной темноте).
Подробнее см. работу «Long-term data storage in diamond» в журнале Science Advances за 26 октября 2016 года.
Голографическая память (награждается посмертно)
Объёмная оптическая память и голографическая память — другие потенциальные технологии повышенной ёмкости данных. Хотя по сути они мало отличаются от многослойных дисков DVD: принцип записи примерно такой же.
В объёмной оптической памяти чтение и запись файлов достигается фокусировкой лазера в объёме носителя (например, того же алмаза, как в примере выше). В голографической памяти данные передаются не побитово, а целыми блоками до гигабайта. В существующих экспериментах носителем выступает ниобат лития (LiNbO3), теоретическая плотность данных составляет 1 TБ на кубический сантиметр, практически ожидаемая плотность — 10 ГБ/см³.
Перспективы голографической памяти были поставлены под сомнение в 2010 году, когда пионер в этой области InPhase Technologies объявил о банкротстве после девяти лет работы и $100 млн полученных инвестиций. Первый продукт компания выпустила в 2007 году: 300-гигабайтные голографические диски Tapestry HDS-300R по цене $135 выглядели отлично, но привод для их записи продавался за… $15 000. Всё кончилось банкротством.
Диск и привод Tapestry HDS-300R
С тех пор термин «голографическая память» в индустрии стал не совсем приличным, примерно как «нейронные сети» в конце 90-х. Немногочисленные исследователи нейросетей старались использовать другие термины, чтобы не раздражать коллег. Технология сильно дискредитировала себя за десятилетия бесплодных исследований с 1950-х.
Неизвестно, какие накопители будет использовать человечество в будущем. Шансы остаются в том числе у магнитных. Там можно кардинально повысить плотность информации, если оперировать не двумя магнитными состояниями (заряд есть/нет), а бóльшим количеством состояний. Например, шестью состояниями, в каждом из которых намагниченность отдельных фрагментов ячейки сонаправлена с намагниченностью одного из трёх вытянутых эллипсов, см. «Towards a six-state magnetic memory element», Appl. Phys. Lett. 108, 182401 (2016).
Есть и другие интересные идеи. Например, информацию можно хранить в нейросетях по аналогии с долговременной памятью в мозге. Или использовать копии настоящего мозга, как в фантастическом рассказе «Лена». Такие копии пригодны не только для хранения информации, но и для выполнения умственной работы.
Правда, последние исследования показали, что в человеческом мозге информация хранится с сильной контекстной компрессией. В результате даже самые яркие воспоминания неизбежно изменяются со временем. Это хорошо для психики, но плохо подходит для долговременного хранения цифровых данных.
Маклауд предоставляет облачные серверы с быстрым и надёжным дисковым хранилищем на основе дисков NVMe. Зарегистрируйтесь по вышеуказанной ссылке и получите 10% скидку на первый месяц аренды сервера любой конфигурации!
Источник
Технологии хранения данных: что дальше?
Быстрый рост объема хранимых данных и, что еще более существенно, необходимость быстрой их обработки, побуждают производителей систем хранения данных совершенствовать свои решения. В частности — разрабатывать и внедрять новые технологии записи.
Популярность новых технологий пока невелика
По оценкам IDC, объем данных вырастет к 2025 году с 33 до 175 зетабайт. Неудивительно, что потребность в быстром доступе к данным и решениях для их хранения, обладающих высокой пропускной способностью или большой емкостью, сегодня выше, чем когда-либо, и постоянно растет.
Это стимулирует внедрение новых технологий и архитектур, дополняющих современные подходы к хранению данных. Так, из результатов опроса компании Spiceworks видно, что с одной стороны, уже через два года твердотельные накопители станут немного популярнее традиционных жестких дисков.
Однако, из того же опроса видно, что современные технологии хранения, например — постоянную память (NVDIMM, Intel Optane) используют лишь 16% респондентов, еще 12% планируют начать работать с ней в течение ближайших двух лет.
А с современными технологиями записи, такими как термомагнитная или микроволновая, знакомы вообще исчезающе малое количество.
Степень знакомства респондентов с технологиями хранения и записи
Источник: Spiceworks, 2020
А ведь именно их использование — один из главнейших резервов ускорения процессов обработки данных.
Ускорение доступа
Ускорить работу с данными можно разными способами. Один из путей, например, создание энергонезависимой памяти, которая будет сочетать в себе скорость работы оперативной памяти и и энергонезависимость.
Другой путь — поиск технологий, которые бы позволили создать устройства хранения, близкие по своим характеристикам к оперативной памяти.
Возможен и третий путь — изменение архитектуры самих систем хранения, которая позволит ускорить их работу за счет переноса части вычислений в сами СХД.
Перспективные технологии записи данных
Поиск новых методов записи и хранения данных идет в самых разных направлениях. Большая часть усилий тратится на совершенствование твердотельных накопителей, однако и жесткие диски имеют потенциал для совершенствования.
CNT (Carbon NanoTube) RAM. Модули CNT NVRAM от Nantero должны появиться в продаже в 2020 г. Эта память работает почти так же быстро, как DRAM, но потребляет меньшую мощность. Она считается наиболее многообещающим типом NVRAM для массового внедрения уже в 20-х годах.
FRAM (Ferroelectric RAM). Оперативная память, схожая с DRAM, но для энергонезависимости использующая слой сегнетоэлектрика: электрический диполь меняет полярность при воздействии внешнего электрического поля. Однако температурные факторы и электрические разряды приводят к тому, что со временем в такой памяти возникают сбои.
HAMR (Heat-Assisted Magnetic Recording). Технология разработана для значительного увеличения объема данных, которые можно хранить на жестком диске. Лазерный диод, прикрепленный к каждой записывающей головке, нагревает небольшую область диска, что позволяет записывающей головке менять магнитную полярность каждого бита и записывать данные с высокой плотностью. Даже маломощная головка может намагнитить «зерно» с нужной силой. После того, как место нагрева охлаждается, участок пластины становится стабильным. С помощью HAMR достигнута плотность записи в 2 Tbpsi (2 терабита на квадратный дюйм). По прогнозам, к 2023 году эта технология позволит создавать диски емкостью в районе 40 Тбайт.
MAMR (Microwave Assisted Magnetic Recording). Технология микроволновой магнитной записи основана на усилении магнитных свойств головки диска при помощи генератора магнитного поля с использованием микроволн. Резонанс, возникающий во время работы генератора, усиливает магнитное поле головки, намагничивающей зерна специального материала пластины. Вектор намагниченности отклоняется от вертикальной оси, что, в сочетании с ферромагнитным резонансом, усиливает магнитное поле головки в 3-4 раза. Все это позволяет уменьшить размер магнитных доменов и, соответственно, повысить плотность записи.
MRAM (Magnetoresistive RAM). MRAM основана на магнитном состоянии ферромагнитного материала. Она не деградирует со временем и не подвержена влиянию температуры. Важнейшие преимущества MRAM — высокая скорость записи и чтения (сравнимая с RAM и превышающая флэш-память в 500 раз), длительное хранение данных (более 20 лет), неограниченное число циклов перезаписи, широкий температурный диапазон.
PCM (Phase-Change Memory). Энергонезависимая память с фазовым переходом позволяет создавать более долговечные носители, чем твердотельные накопители с их проблемой износа. На базе этой технологии созданы упоминавшиеся микросхемы Intel Optane. Она считается одной из самых перспективных технологий, по оценкам Reports and Data рынок памяти с фазовым переходом достигнет $46,52 млрд к 2026 г.
RRAM или ReRAM (Resistive RAM). Резистивная оперативная память считается одной из самых перспективных новых технологий памяти благодаря своей высокой скорости, низкой стоимости, повышенной плотности хранения, потенциальным приложениям в различных областях и хорошей масштабируемости. С помощью многоуровневых ячеек RRAM можно увеличить плотность хранения и снизить стоимость. Потенциальные области применения RRAM — безопасность, нейроморфные вычисления и энергонезависимые логические системы.
SRAM (Static Random Access Memory). Статическая память с произвольным доступом — полупроводниковая память, в которой каждый бит хранится в схеме с положительной обратной связью. SRAM имеет малое время доступа — примерно в четыре раза меньше DRAM, но она намного дороже.
На пути новых технологий стоят два препятствия. Во-первых, это «цена за гигабайт».
Стоимость 1 гигабайта, $, хранимого по данной технологии
Источник: Yole Development, 2019
Второй фактор, определяющий возможности технологии — плотность записи, измеряемая в гигабайтах на квадратный дюйм.
Плотность хранения по данной технологии, Гбайт/кв. дюйм
Источник: Yole Development, 2019
Цитируемое исследование посвящено перспективам памяти MRAM. Как полагают в Yole, уже в ближайшие годы она существенно подешевеет и, одновременно, появится возможность создавать на ее основе более вместительные чипы. По обоим параметрам она не догонит DRAM, но приблизится к ее показателям. Можно предположить, что и другие технологии будут прогрессировать аналогичным образом. По крайней мере те, которые будут восприняты рынком.
Между «памятью» и «диском»
Оперативная память DRAM работает быстро, но при отключении электричества все данные, находящиеся в этот момент в ее микросхемах, пропадают. Заполнить нишу между ОЗУ и постоянной памятью призвана энергонезависимая память, в частности — модули памяти NVDIMM (non-volatile dual in-line memory module).
Модули NVDIMM-N объединяют на одной планке микросхемы DRAM, флеш-память и конденсатор — при отключении электричества мощности последнего хватает на то, чтобы переписать информацию из DRAM в флеш-память. Емкость таких миксросхем — десятки гигабайт, время задержки — десятки наносекунд.
Модули NVDIMM-F состоят из микросхем флеш-памяти, обращение к которым происходит по шине DRAM. Возможная емкость — терабайты, но время задержки — уже десятки микросекунд.
Также разрабатывается спецификация NVDIMM-P, которая должна будет обеспечить поддержку интерфейса DDR5 и всех типов новых технологий памяти (MRAM, PCM, ReRAM и т. д.) на уровне интерфейса.
Чаще всего «накопительные» микросхемы выполнены по технологии NAND, однако в самой популярной, наверное, энергонезависимой памяти, Intel Optane, используются PCM-технологии.
Intel, кстати, «отстраивается» от NVDIMM, утверждая, что «энергонезависимая память Intel Optane обеспечивает постоянное хранение данных без необходимости устанавливать какие-либо дополнительные компоненты и средства хранения, а также беспокоиться о замене аккумулятора».
Преимущества энергонезависимой памяти наиболее очевидны в транзакционных приложениях и в приложениях с интенсивными вычислениями в памяти, таких как базы данных in memory, анализ потоковых данных. Поэтому неудивительно, что соответствующему рынку сулят быстрый рост. Как полагают в Grand View Research, в 2019 г. выручка от продажи микросхем NVDIMM составила почти $913 млн, с 2020 по 2027 г. она будет расти в среднем на 39,7% в год.
И сервер, и хранилище
Еще один новый подходов к процессу обработки данных — «вычислительное хранение» (computational storage). В системах такой архитектуры СХД снабжаются собственными специализированными процессорами, которые «на месте» выполняют ряд операций, например — сжатие данных, их дедупликация, шифрование/дешифрование. Все эти операции вполне логично «переложить» на специализированные чипы, а не расходовать на их выполнение ресурсы центрального процессора.
Вычислительное хранение привлекает сегодня все большее внимание ввиду развития ИИ и приложений интернета вещей, которые требуют дополнительных вычислительных ресурсов. Тенденция перемещения этих ресурсов ближе к системам хранения наблюдается уже несколько лет и может получить массовое распространение, особенно в связи с развитием периферийных вычислений.
Источник