Закончились времена, когда облачные провайдеры использовали исключительно традиционные твердотельные диски. С появлением флеш-накопителей корпоративного уровня практически каждый поставщик добавил в свою инфраструктуру столь замечательное изобретение человечества. Объясняется это целым рядом преимуществ таких накопителей. Для решения каких задач облачные провайдеры используют flash-накопители? Прежде чем рассматривать реальные кейсы, вспомним, с чего все начиналось.
Зарождение и трансформация флеш-памяти
Первые отголоски флеш-памяти появились в середине XX в., когда ученый Вэн Цинг Чоу работал над улучшением блоков памяти координат бортового компьютера одной из ракетных систем. Детали разработки долго не раскрывали ввиду особой секретности проекта, но спустя годы о многом стало известно, в частности, о новой технологии под названием Programmable Read Only Memory (PROM).
Нельзя сказать, что технология получила широкое распространение, но именно она впоследствии использовалась при создании микросхем, которые отличались высокой скоростью доступа к данным и возможностью одноразовой записи. Существенный и далеко не единственный минус – емкости таких микросхем были ничтожно малы. Но, как говорится, лиха беда начало. Ситуацию исправила компания Intel, предложившая впоследствии на рынок новый стандарт памяти EPROM.
Кстати, по тем временам технология считалась самой передовой и впервые была использована в микросхемах BIOS на 8-разрядных домашних компьютерах ZX Spectrum производства английской компании Sinclair Research. Это действительно был настоящий прорыв, хотя эксперты отмечали определенные недостатки технологии. Например, в EPROM отсутствовала возможность электрическим способом стирать информацию, зато, по утверждению производителя, данные на таких микросхемах могли храниться до десяти лет. Для удаления данных приходилось прибегать к помощи мощнейших ультрафиолетовых ламп и стирать информацию ультрафиолетовым светом, который пропускался через специальное окошко.
В 1978 г. компания Intel представила миру схожую по технологии с EPROM микросхему Intel 2816, особенность которой заключалась в возможности удаления данных без воздействия ультрафиолета. Именно с микросхемы 2816 берет начало технология электрически перепрограммируемой памяти Electrically Erasable Programmable Read-Only Memory (ЕЕPROM), которая способствовала развитию двух принципиально отличных классов устройств: вместительных микросхем без возможности перезаписи данных и менее вместительных с возможностью перезаписи информации.
Новый поворот
В середине 1980-х компания Toshiba совершила переворот в технологии хранения данных. Фудзио Масуока, уроженец Такасиаки – города-гиганта по производству электротехнической продукции в Японии, занялся разработкой новой технологии и создал первый прообраз будущей флеш-памяти. К слову, flash в данном случае больше употребляется в контексте «быстрый, мгновенный». Хотя бытует мнение, что одному из коллег Фудзио Масуока процесс стирания данных напоминал фотовспышку – отсюда и название. Правда ли это, уже не столь важно. Но именно в тот период началась гонка за первенство между Intel и Toshiba.
В 1984 г. на конференции IEDM в США Фудзио Масуока представил прообраз новой ячейки памяти, после чего возникла большая заинтересованность тестовыми образцами, особенно со стороны Intel. Получив в распоряжение тестовые чипы, Intel привлекла к исследованиям целую армию инженеров и серьезно занялась разработкой флеш-памяти. Считается, что именно Intel вывела эту технологию на коммерческий рынок, но в Toshiba полагают, что все было не так. В 1985 г. в Toshiba впервые поступил заказ на разработку флеш-памяти объемом 256 Кбайт от американской автомобильной компании, а в 1989 г. вендор представил новый чип для хранения данных NAND-flash. Intel предложила первый чип только к началу 1988 г. – это были первые коммерческие образцы NOR-flash памяти.
Сегодня технологии NOR и NAND используются для решения разных задач. Так, микросхемы с архитектурой NOR больше применяют в случаях, когда критичным является время доступа к чтению сохраненных данных, а микросхемы с архитектурой NAND – там, где необходимо хранить большие объемы данных.
Тенденции и реалии рынка
Сегодня в сегменте enterprise-серверов и систем хранения данных можно выделить три основных подхода к организации flash-памяти.
SSD диски форм-фактора 2,5’’
SSD-диски форм-фактора 2,5” (реже M.2 и M.3) для обмена данными используют интерфейсы SATA, SAS, NVMe, а в качестве flash-модулей – SLC, eMLC, QLC. Стоит отметить, что практически все А-вендоры устанавливают такие диски в собственные серверы и системы хранения данных.
В настоящее время flash-модули, используемые в SSD, производятся по технологии 3D NAND, которая позволяет на одном чипе компоновать множество ячеек, внутри которых записываются биты информации. Современные 3D NAND модули поддерживают возможность записи до четырех битов в одну ячейку. Учитывая количество битов, записываемых в ячейку, все 3D NAND чипы можно разделить на типы. Не будем останавливаться детально на преимуществах и недостатках каждого из них, выделим общие характеристики.
Итак, в зависимости от типа 3D NAND потребитель получает:
- SLC – высокая надежность и производительность, но дорого и мало по объему. Этот тип flash-памяти сейчас практически не используется в корпоративном сегменте из-за высокой стоимости в расчете на количество гигабайт в отношении заданного объема;
- MLC (eMLC) – более низкий уровень надежности и производительности. Однако показатели находятся в пределах допустимых норм для корпоративного сегмента и достаточны для большей части приложений. Стоимость в расчете на количество гигабайт в отношении заданного объема существенно ниже, чем у SLC. В настоящее время этот тип памяти нашел широкое применение;
- TLC – используется преимущественно в сегменте потребительского рынка, хотя есть практики применения и в enterprise;
- память QLC – несмотря на низкий показатель endurance (коэффициент выносливости по записи) и характеристики надежности DWPD, показатель которой меньше единицы, перспективы использования такого типа памяти в корпоративном сегменте достаточно велики ввиду низкой стоимости за количество гигабайт в отношении заданного объема. Как минимум, QLC позволяет использовать объемные SSD-диски (64 ТБ, 128 Тб и выше) для нагрузок интенсивного чтения (read-intencive).
Как уже отмечалось, технология 3D NAND зрелая, SSD-диски наиболее широко представлены на рынке, ими пользуются все вендоры.
Flash-модули на интерфейсе PCIe
Flash-модули, применяющие интерфейс PCIe для обмена данными с хост-контроллером, можно встретить в решениях IBM FlashSystem и Violin. Это нишевое и пока не очень распространенное решение. Столь низкая популярность объясняется высокой стоимостью и некоторыми архитектурными ограничениями, присущими системам, построенным на базе таких модулей.
Несмотря на низкие показатели задержки (latency) и высокие параметры IOPS, заявленные для таких систем, они используются в основном для ПО, работающего в режиме реального времени, например трейдерские системы, онлайн-транзакции и многое другое.
SCM (Storage Class Memories)
Storage Class Memories (SCM) – высокоскоростные энергонезависимые устройства хранения информации – представлены на рынке модулями NVDIMM, Optane DC в формате карт расширения PCE-e либо DRAM-модулей, могут размещаться в слотах DIMM.
Стоит отметить, что SCM вышли на рынок сравнительно недавно – в начале 2017 г., когда компания Intel анонсировала модули Intel Optane SSD DC P4800X. Их особенность заключается в том, что для SCM характерны относительно небольшой объем хранения и впечатляющие показатели производительности и надежности.
Что касается области применения SSD, то они используются в основном для решения задач, требующих сотни тысяч IOPS и уровня задержек в сотни наносекунд. С учетом этих возможностей такой тип памяти зачастую применяется в качестве сверхбыстрого TIER в СХД и серверах (аналог кэша). Например, компания NetApp предлагает решение NetApp MaxData, которое позволяет использовать модули Intel Optane в качестве дополнительного высокопроизводительного уровня SSD для кэширования данных на стороне серверов.
Перспективы полной замены традиционных дисков
Заменят ли твердотельные решения на базе энергонезависимой памяти традиционные диски? Не первый год этот вопрос обсуждается на форумах и конференциях, представители бизнеса хотят знать истинное положение дел. Применительно к корпоративному сегменту можно с уверенностью сказать, что в обозримом будущем замена произойдет. Исключение пока составляют большие хранилища холодных данных, куда данные будут перемещаться с более производительных SSD-дисков.
В настоящее время сохраняется противостояние привычных дисковых массивов и решений, построенных на флеш-накопителях. Хотя если вернуться на десять лет назад, можно увидеть, что ситуации тогда и сейчас различаются. Поставленный вопрос был бы неуместен, поскольку твердотельные диски на базе flash стоили космических денег, имели ограничения по емкости и количеству циклов перезаписи. Бизнес не проявлял особого интереса к такому формату носителей и не спешил их использовать в составе СХД.
Точка зрения облачных провайдеров
Поставщики облачных услуг все чаще смотрят в сторону решений на базе флеш-памяти и используют в своей практике массивы All-Flash. Сегодня производители предлагают варианты AF-решений, благодаря которым обеспечивается высокая эффективность в отношении полученных результатов.
Поскольку требования корпоративных заказчиков к доступности и производительности ресурсов, арендуемых в облаке, постоянно возрастают, важно понимать, какое решение соответствует потребностям. Облачный провайдер «ИТ-ГРАД» (входит в группу МТС) сравнил технологические преимущества, которые дает использование AFA-массивов с гибридными СХД, а также сопоставил стоимость 1 Гб объема на SSD и 1 Гб объема на гибридных СХД. Был сделан вывод, что в определенных случаях оптимально расширять дисковые объемы именно за счет использования AFA.
Помимо экономии на объемах (40–50%) удалось значительно уменьшить количество занимаемых юнитов в стойках. Для сравнения: дисковая полка 2U на 24 SSD объемом 3,8 Тб дает полезного объема столько же, сколько пять гибридных полок 2U с установленными 100 SAS-дисками объемом 900 Гб. Переход на AFA дал возможность более гибко подходить к тарификации дисковых объемов и гарантировать показатели производительности дисковой подсистемы в SLA для заказчиков.
«Мы больше не расширяемся за счет SAS HDD. Для нас AFA-системы от NetApp – это универсальный инструмент на все случаи жизни в мире СХД, – рассказывает системный архитектор «ИТ-Град» Николай Араловец. – Помимо основной задачи – предоставление быстрого и надежного хранилища для дисков виртуальных машин, мы используем это решение и для других кейсов. Например, можем выдавать дисковые объемы напрямую в ВМ, минуя среду виртуализации. Такой функционал особенно востребован при построении HA-кластеров на базе ВМ, когда необходимо выдать общие LUNs на все узлы кластера. Кроме того, NetApp дает возможность предоставлять в аренду полноценную виртуальную СХД, которой клиент может управлять самостоятельно, не затрагивая при этом данные других заказчиков.
Использование функционала QoS позволяет гибко регулировать полосу пропускания, доступную для выделенных заказчиков, причем мы можем задать верхний лимит по производительности в MB/с либо в IOPs, гарантировать минимально доступную пропускную способность. Кластер СХД от NetApp дает возможность сглаживать потенциальные проблемы с недоступностью одной из нод по сети, перебрасывая трафик на другие ноды. Обо всех кейсах рассказать в рамках одной статьи невозможно, но мы готовы поделиться ими с нашими потенциальными заказчиками».
Прогнозы
Выше шла речь о трех основных направлениях SSD, и в настоящее время трудно рассчитывать на технологические прорывы. Продолжается эволюционное развитие технологий производства модулей. Очевидно, что растут объемы, и в ближайшей перспективе произойдет интеграция поддержки стандарта NVMe во все контроллеры flash-модулей, что позволит в полной мере использовать их возможности по производительности.
В качестве перспективных технологий можно выделить Samsung Key Value SSD, которые больше подходят для приложений, работающих с неструктурированными данными в виде Ceph, mongo DB, Redis, а также flash-модули STT-MRAM, ReRAM на базе магнитнорезистивной памяти и движение Intel в сторону Penta-Level Cell (PLC).