Обзор предложений
В настоящее время на рынке представлено большое количество продуктов, позиционируемых производителями как программно-определяемые системы хранения (Software Defined Storage – SDS). Для обзора существующих предложений целесообразно ввести классификацию, которая будет содержать критерии для сравнения представленных продуктов и позволит в первую очередь определить, относится продукт к SDS или нет.
Начнем с определения идеальной SDS. Программно-определяемая система хранения – это программное обеспечение, позволяющее использовать дисковые ресурсы стандартных вычислительных узлов (как правило, серверов архитектуры x86, x86-64), как это делается сейчас в традиционных системах хранения с жесткими дисками и SSD.
Под данное определение, с некоторыми оговорками, попадает большое количество продуктов. Разделим их на группы по характерным признакам.
Классические SDS
К этой группе мы относим продукты, которые изначально разрабатывались для объединения дисковых ресурсов серверов в единый пул. Общий признак таких SDS – масштабируемая (scale-out) архитектура, позволяющая наращивать производительность и объем дисковых ресурсов добавлением новых узлов.
CEPH. Продукт изначально разрабатывался как открытая распределенная файловая система и отказоустойчивое хранилище данных. Использование протокола TCP и серверов стандартной архитектуры определяет низкую стоимость хранения. Scale-out-архитектура и алгоритмы распределения данных по всем узлам кластера обеспечивают высокую производительность и отказоустойчивость. CEPH применяется хостинг-провайдерами в высокопроизводительных кластерах и в том случае, когда требуются масштабируемость свыше Пбайт данных, надежность и производительность. Как и многие другие продукты, разрабатываемые сообществом, внедрение и сопровождение CEPH обусловливают необходимость значительных трудозатрат высококвалифицированного персонала, поэтому его нельзя рассматривать как замену основной (general) системы хранения в корпоративном сегменте. В то же время продукт может с успехом использоваться в средах с типизированной нагрузкой и большими объемами данных.
Red Hat Storage Server. Разработанный одним из ведущих Linux-производителей на базе Red Hat Enterprise Linux продукт позиционируется как решение по хранению данных для частных, публичных и гибридных облачных сред, для хранения и эффективного использования медиаконтента, для высокопроизводительных вычислений. Этот продукт также можно отнести к классическим SDS.
Не обладая функционалом, необходимым для успешного применения бизнес-приложений, которым традиционно требуется блочный доступ, продукт обеспечивает высокую производительность в средах с большим количеством параллельных процессов ввода/вывода. Возможность гибкого масштабирования, простота замены вышедшего из строя оборудования и поддержка производителя обеспечивают надежную сохранность данных.
EMC ScaleIO. Обладает наиболее развитыми средствами развертывания и управления среди продуктов данной группы. EMC ScaleIO не только характеризуется высокими производительностью и масштабируемостью, но и способен заменить универсальную СХД среднего класса. Может быть использован как для решения многих типовых задач, так для бизнес-приложений, например баз данных. Следует отметить, что доступ к данным под управлением EMC ScaleIO можно получить только на уровне блочного устройства, с помощью специального драйвера.
Характеристики | CEPH | RedHat Storage | EMC ScaleIO | |
Платформа | Поддерживаемая архитектура | x86/x86-64 | x86/x86-64 | x86/x86-64 |
Поддерживаемые ОС | CentOS, Debian, Fedora, RHEL, Ubuntu | RedHat Linux | Microsoft Windows Red Hat Enterprise Linux CentOS Linux SUSE Linux |
|
Стоимость | Схема лицензирования | OpenSource, Коммерческая поддержка | За узел | За сырую емкость |
Защита данных | Возможность построения систем с произвольной и гарантированной избыточностью |
Да | Нет | Да |
Удаленная асинхронная репликация | Нет | Да | Нет | |
Самостоятельное восстановление | Да | Да | Да | |
Мгновенные снимки | Чтение | Нет | Чтение/Запись | |
Работа с «сырыми» дисками | Да | Нет | Да | |
Шифрование данных | Нет | Нет | Да | |
Гарантированное удаление данных | Нет | Нет | Нет | |
Защита от удаления данных. Режим WORM | Нет | Да | Нет | |
Функционал | Интеграция с традиционными СХД | Нет | Нет | Нет |
Дедупликация | Нет | Нет | Нет | |
Сжатие | Нет | Нет | Нет | |
Flash-Cache | Да | Нет | Нет | |
Многоуровневое хранение (Tiering) | Нет | Нет | Да | |
Геораспределенные решения | Нет | Нет | Нет | |
Интерфейс | Объектный доступ | S3, Swift | Да | Нет |
Блочный доступ | iSCSI, собственный клиент | Нет | Собственный клиент | |
Файловый доступ | Драйвер файловой системы для Linux (kernel, FUSE) | Драйвер файловой системы для Linux. (kernel, FUSE) | Нет |
SDS на основе традиционных систем хранения
SDS этой группы создаются путем выделения и адаптации программной составляющей традиционных СХД для серверов стандартной архитектуры без использования специального аппаратного обеспечения. При этом сохраняется функционал, присущий базовой системе хранения, и обеспечивается интеграция с традиционными СХД, на базе которых она разработана. Такой подход позволяет с максимальной эффективностью использовать преимущества SDS и функционал существующих СХД.
NetApp Data ONTAP Edge. Продукт дает возможность создать центр обработки данных на базе одного сервера. Устанавливаемая виртуальная машина на платформе VMware позволяет использовать внутренние диски сервера как систему хранения NetApp для виртуальных машин, развернутых на этом узле. Производитель рекомендует NetApp Data ONTAP Edge для передачи данных из удаленных офисов в центр и архивации их в системе хранения NetApp FAS. Таким образом, обеспечивается возможность использовать хорошо зарекомендовавшие себя технологии NetApp по репликации и зеркалированию данных между SDS и традиционными СХД. Применение этого решения ограничивается тем, что невозможно объединить ресурсы нескольких серверов и работать с объемом данных свыше 4 Тбайт.
HP StoreVirtual VSA. Решение от компании HP – яркий представитель SDS на основе традиционных систем хранения. HP StoreVirtual VSA для ОС HP Lefthand обладает богатейшим функционалом и может использоваться для создания программно-определяемых масштабируемых СХД. Стоит отметить такие возможности, как создание уровней хранения (tearing) и автоматическое перемещение данных между ними, защита данных и отсутствие единых точек отказа благодаря технологии Network RAID, работа со всеми ведущими гипервизорами VMware vSphere, Microsoft Hyper-V и KVM. Интеграция с системами развертывания ПО и облачными сервисами, а также доступность широкого спектра услуг поддержки HP делают данный продукт одним из наиболее универсальных. Он может применяться как провайдерами услуг, так и заказчиками из корпоративного сегмента.
Характеристики | DataONTAP Edge | HP StoreVirtual VSA | HCP-VM (Virtual Machine) | |
Платформа | Поддерживаемые гипервизоры | VMware ESXi | ESXi, Hyper-V, KVM | VMware vSphere Hypervisor |
Стоимость | Схема лицензирования | За узел | За узел. Ограничение по объему на узел | За емкость |
Защита Данных | Удаленная асинхронная репликация | SnapMirror | Да | Да |
Мгновенные снимки | Чтение/Запись | Чтение/Запись | Чтение/Запись | |
Шифрование данных | Нет | Нет | Да | |
Гарантированное удаление данных | Нет | Нет | Да | |
Защита от удаления данных. Режим WORM | Нет | Нет | Да | |
Производительность | Ограничение по масштабированию емкости | 10TB | 50 ТБ/узел, 32 узла | 40 узлов, 4,7ПБ |
QoS | Нет | Да | ||
Функционал | Дедупликация | Да | Нет | Да |
Сжатие | Да | Нет | Да | |
Многоуровневое хранение (Tiering) | Нет | Да | Да | |
Геораспределенные решения | Да | Да | Да | |
Интерфейс | Объектный доступ | Нет | Нет | S3, Swift |
Блочный доступ | iSCSI | iSCSI | Нет | |
Файловый доступ | CIFS, NFS | Нет | HTTP, SMB, NFS, WebDAV |
SDS в составе вычислительных комплексов
SDS данной группы позволяют совместить функцию виртуализации вычислительных ресурсов и виртуализацию хранения. Серверы, используемые в качестве хост-машин для виртуальной среды, оснащаются жесткими дисками, которые объединяются в SDS с помощью специализированного модуля гипервизора.
Решения группы «все в одном» обеспечивают гибкость и простоту масштабирования вычислительного комплекса, экономию на выделенной СХД. Вычислительными ресурсами, необходимыми для обработки запросов на хранения, систему обеспечивает хост-сервер.
Внедрение подобных решений позволяет заказчику трансформировать имеющуюся инфраструктуру в Software Defined Datacenter, добившись полной независимости от аппаратной конфигурации оборудования.
Характеристики | Vmware vSAN | Nutanix | |
Платформа | Поддерживаемая архитектура | x86/x86–64 | Собственная x86 «все в одном» и сертифицированные серверы x86 |
Поддерживаемые гипервизоры | VMware ESXi | ESXi, Hyper-V, KVM | |
Стоимость | Возможность использования общедоступных компонентов | Да | Нет. Обязательно наличие коммутаторов с низкими задержками |
Схема лицензирования | За CPU на сервере или для VDI за пользователя | За узел | |
Защита данных | Возможность построения систем с произвольной и гарантированной избыточностью |
Да | Да |
Удаленная асинхронная репликация | Нет | Да | |
Мгновенные снимки | Нет | Чтение/Запись | |
Шифрование данных | Нет | Да | |
Гарантированное удаление данных | Нет | Да | |
Производительность | Автоматическая балансировка нагрузки между узлами | Да | Миграция данных «вслед за нагрузкой» в локальном кластере |
Ограничение по масштабированию емкости | 32 узла в кластере | Неограниченный объем | |
Линейное масштабирование производительности | Да | Да | |
QoS | Средствами VMware | Да | |
Функционал | Дедупликация | Нет | Да |
Сжатие | Да | Да | |
Flash-Cache | Да, обязательное требование – наличие | Да | |
Многоуровневое хранение (Tiering) | Нет | Да | |
Интерфейс | Объектный доступ | Собственный интерфейс только для виртуальных машин vmware | Нет |
Блочный доступ | Нет | iSCSI | |
Файловый доступ | Нет | NFS |
Программно-аппаратные комплексы
Данные решения, как правило, представляют собой законченный комплекс оборудования и программного обеспечения системы хранения. Они обладают большей надежностью и обеспечиваются расширенной технической поддержкой производителя, протестированы на совместимость и работают стабильно.
Как правило, эти системы служат трем основным целям.
- Продление жизни существующих СХД путем виртуализации их емкости. Используя виртуальные системы хранения данных, заказчик абстрагируется от аппаратной составляющей и получает возможность выполнять обслуживание, миграцию и расширение емкости путем добавления новых систем прозрачно для приложения. Такие решения позволяют объединять небольшие системы хранения для увеличения объема, производительности и отказоустойчивости.
- Расширение функционала существующих СХД. Как правило, система SDS обладает более широким спектром возможностей и позволяет работать с большинством аппаратных платформ. Системы дополняют уже существующие или системы низкого уровня богатым набором функций.
- Создание единого пула ресурсов хранения. Единый пул обеспечивает возможность повысить эффективность хранения путем создания уровней хранения данных с автоматической миграцией, а также упрощает управление и мониторинг.
Характеристики | IBM SVC | HP StoreVirtual | HITACHI CONTENT PLATFORM | |
Платформа | Поддерживаемая архитектура | Стандартный сервер IBM на базе x86-64 | Стандартный сервер HP на базе x86-64 | Стандартный сервер Hitachi Data Systems на базе x86-64 |
Защита данных | Удаленная асинхронная репликация | Да | Да | да |
Мгновенные снимки | Чтение/Запись | Чтение/Запись | Чтение/Запись | |
Шифрование данных | Нет | Нет | Да | |
Гарантированное удаление данных | Нет | Нет | Да | |
Защита от удаления данных. Режим WORM | Нет | Нет | Да | |
Производительность | Автоматическая балансировка нагрузки между узлами | Да | Нет | Миграция данных «вслед за нагрузкой» в геокластере |
Ограничение по масштабированию емкости | 32 ПБ, 8 узлов | 32 узла | 80 ПБ, 80 узлов | |
Линейное масштабирование производительности | Да | Да | Да | |
QoS | Да | Нет | Да | |
Функционал | Интеграция с традиционными СХД | Да, IBM Storwzie | Нет | Интеграция с СХД Hitachi HUS, VSP, HNAS. |
Дедупликация | Нет | Нет | да | |
Сжатие | Да | Нет | да | |
Многоуровневое хранение (Tiering) | Да | Да | Да | |
Геораспределенные решения | Да | Да | Да | |
Интерфейс | Объектный доступ | Нет | Нет | S3, Swift |
Блочный доступ | iSCSI, FC, FCoE | FC, iSCSI | Нет | |
Файловый доступ | Нет | CIFS, NFS, HTTP, FTP | HTTP, SMB, NFS, WebDAV |
Восприятие, информированность и востребованность программно-определяемых сред
Для заказчиков основными предпосылками к переходу на SDS являются:
- более высокая стоимость аппаратных СХД по сравнению со стоимостью широко распространенных серверов;
- централизация основных функций в ограниченном количестве контроллеров СХД и ограничение масштабирования систем.
Раньше считалось, что параллельные файловые системы предназначены для интернет-компаний или научных организаций, а сейчас подобное отношение переносится на SDS. Между тем некоторые из них обладают большим функционалом, сочетающимся с проработанными механизмами развертывания, и удобным пользовательским интерфейсом. Поэтому SDS – хороший выбор не только для компаний, чей бизнес основан на ИТ, но и для корпораций, которые являются потребителями традиционных СХД.
Основным преимуществом решений SDS заказчики считают низкую стоимость владения, которая может возрасти за счет увеличения затрат на поддержание работы системы в случае уникальных решений и непредсказуемой надежности аппаратных ресурсов.
Заказчикам знакомы решения от известных производителей, предлагающих SDS совместно с каким-либо хорошо зарекомендовавшим себя продуктом. Например, HP StoreVirtual VSA предлагается вместе с популярной и хорошо зарекомендовавшей себя аппаратной версией HP LeftHand p4000, а Data ONTAP Edge – для организации резервирования в центре данных из территориально удаленных офисов.
Некоторые производители заранее встраивают решения SDS в свои успешные продукты, избавляя заказчика и интегратора от необходимости проектирования и разработки собственных решений. В качестве примера можно привести VMware VSAN, которая предлагается вместе с vSphere для хранения виртуальных машин. Законченное решение по виртуализации представляет собой Nutanix, которая содержит собственный модуль хранения – NDFS. Компания RedHat включила в свой портфель продуктов opensource разработку GlusterFS под названием RedHat Storage, обеспечив коммерческой поддержкой.
Задачи
Решения SDS сегодня востребованы прежде всего там, где необходимо снизить до минимума цену емкости либо путем использования существующего парка устаревших серверов, либо за счет приобретения дешевого оборудования. Основные задачи, эффективно решаемые с помощью SDS:
- хранение резервных копий или архивов;
- среды разработки и тестирования;
- облачные вычисления и хостинг.
При этом некоторые SDS уже могут применяться для решения более широкого спектра задач, таких как:
- создание программно-определяемых центров обработки данных;
- объединение существующих аппаратных ресурсов в единую систему хранения для повышения гибкости и отказоустойчивости;
- создание модульных вычислительных сред на базе идентичных многофункциональных узлов;
- расширение функционала существующих систем хранения данных. Объединение нескольких систем хранения данных в единый пул ресурсов;
- создание уникальных решений с высоким уровнем отказоустойчивости, производительности и эффективности.
Ожидания и перспективы
Внедряя SDS, заказчики ожидают от инфраструктуры:
- снижения стоимости – экономия в существующей сложной ситуации на рынке;
- повышения производительности – построение высокопроизводительных систем без покупки СХД класса Hi-End;
- расширения функционала – получение функционала традиционных СХД для решений, в которых нецелесообразно применение реальных СХД.
При этом большинство ожидает, что программно-определяемые системы хранения данных будут иметь следующие характеристики.
Гибкость (flexibility). Благодаря поддержке большинства распространенных аппаратных платформ системы SDS позволят практически мгновенно добавлять или заменять узлы хранения без привязки к производителю оборудования, форм-фактору. Сроки разработки нового функционала в программно-определяемых системах хранения заметно ниже, чем для создания новой аппаратной платформы, поддерживающей требуемый функционал.
Виртуализация ресурсов (Resource Virtualization). Функционал системы не привязан к аппаратным компонентам. Это обеспечит замену и обслуживание компонентов без остановки системы, а также снижение затрат на управление разрозненной инфраструктурой. Возможность совмещения программно-определяемых подсистем хранения с подсистемами виртуализации вычисления и сети позволяет повысить утилизацию ресурсов.
Интерфейс программирования (APIs). Программно-определяемые системы хранения предоставляют широкий функционал и большой набор интерфейсов взаимодействия со смежными системами, позволяя создавать законченные решения, автоматизировать рутинные процессы, снижая риск ошибки и сокращая затраты.
Удобство управления (Ease of Management). SDS предоставит пользователю единую точку входа для управления всей подсистемой хранения, исключив необходимость настройки отдельных компонентов.
Замена компонентов (Component Replacement). Программно-определяемые среды дают возможность абстрагироваться от аппаратных ресурсов и производить замену, миграцию и обслуживание компонентов практически без снижения производительности и прерывания сервиса.