Одно из ключевых преимуществ программно-определяемых СХД (SDS) состоит в том, что они предоставляют конечному заказчику полную свободу выбора ресурсов хранения информации. В отличие от традиционной СХД SDS не является lock-in solution, в котором нельзя что-то заменить. Наоборот, здесь полная свобода выбора: в таком случае заказчик приобретает не готовую СХД, а решение, которое позволяет ему самостоятельно создать систему хранения данных в соответствии с текущими потребностями и возможностями. И что не менее важно, когда наступает момент модернизации SDS, контроллер уже менять не придется – только диски.
Традиционные и программно-определяемые СХД
Классическая СХД представляет собой готовое аппаратное решение, состоящее из двух частей. Первая – это дисковая подсистема, содержащая накопители различного объема и производительности: SATA, SAS, SSD, Flash-память. Вторая – контроллер СХД, ее интеллект, который выполняет ряд функций в процессе чтения/записи блоков данных, начиная от самых простых вещей, таких как Thin Provisioning, и заканчивая кэшированием или автоматическим тирингом. Соответственно, чем быстрее выбранная дисковая подсистема и чем выше функциональность СХД, тем она дороже. В настоящее время в арсенале производителей СХД десятки моделей, предназначенных для выполнения конкретных задач. Это готовые программно-аппаратные решения с заданными техническими характеристиками, обладающие четко регламентированными возможностями масштабирования и, как правило, с ограниченным сроком жизни, в них не всегда можно заменить какие-то компоненты.
Ключевое отличие программно-определяемой СХД (SDS) заключается в том, что это программное обеспечение, а не программно-аппаратный комплекс, не готовое под ключ решение. ПО выполняет здесь роль контроллера СХД, который является полностью аппаратно-независимым, т. е. оно умеет работать с любыми известными дисковыми массивами от любого вендора и любого года выпуска. У таких SDS-решений в принципе отсутствует вопрос совместимости.
Идея SDS заключается в абстрагировании от аппаратной составляющей, т. е. мы единожды платим за этот контроллер и он наш на всю жизнь – его не надо списывать, выбрасывать и т. д. Его не нужно ждать несколько недель при покупке, он скачивается с сайта производителя за считанные минуты.
Сегодня внедрение SDS – новый тренд, то, к чему присматриваются заказчики. Их привлекает идеология SDS, которая позволяет отказаться от закупки СХД High-End-уровня за сотни тысяч долларов и приобретать самое простое «железо» Middle-Range, оптимизируя его софтом. Конечно, дело здесь не сводится только к экономии бюджета. Вы получаете возможность оптимизации имеющихся ресурсов хранения, в том числе морально устаревших, давая им вторую жизнь.
Отметим также, что SDS делает Flash более доступным для конечного пользователя. Это немаловажно, так как Flash-массив – удовольствие не из дешевых, и далеко не всегда заказчику требуется целый массив (во-первых, в несколько десятков терабайт, во-вторых, самим данным редко нужен All-Flash). В SDS-решениях заказчик может установить Flash в локальном сервере, например на несколько TB, объединить его с другими ресурсами хранения, тем самым получив и объем, и производительность за приемлемую стоимость.
Эффективность SDS в цифрах
Представьте себе, что вы решили внедрить новое бизнес-приложение, которому необходима высокопроизводительная СХД в несколько сотен тысяч IOPS. Данные на этой СХД должны находиться в режиме высокой доступности и храниться на двух площадках (ЦОД). Если пойти традиционным путем, то необходимо будет выделить вычислительные ресурсы. Допустим, они у нас есть, и СХД, например Flash-массив на 20 TБ, который нам нужно приобрести (точнее, два массива – на каждую из площадок). Стоимость составит 200 тыс. долл. При этом мы прекрасно понимаем, что данные не бывают «горячими» на 100%, в среднем на 30%. Таким образом, на самом деле нам нужно не 20 ТБ, а всего лишь 6 ТБ именно на Flash.
C SDS можно приобрести PCI-E SSD (75% рынка СХД используют именно их диски) общей стоимостью примерно 15 тыс. долл., чтобы установить их локально на сервер, где будет располагаться наше бизнес-приложение, после чего объединить их с дисками меньшей производительности для объема. Вот, собственно говоря, и весь фокус. Блоки данных, к которым у нас происходит наиболее интенсивное обращение, будут тогда автоматически перемещаться между дисками разной производительности. При этом мы минимизируем количество межузловых соединений, достигая лучшего показателя latency, что критично для подобного рода задач.
По данным SPC-1, сегодня самая быстрая СХД в мире на 2U именно SDS, собранная на базе обычного сервера компании Lenovo и Datacore, общей стоимостью всего решения примерно 50 тыс. долл., выдает 500 тыс. IOPS. Кстати, вся информация с детальным отчетом имеется в Интернете в открытом доступе.
Таким образом, SDS позволяет рационально использовать Flash без существенного изменения инфраструктуры. Даже если кто-то уже задумался о Flash-массиве, договорился о тестировании и ждет своей очереди, он может сейчас скачать Datacore с сайта, получить Flash-карту (а это гораздо проще и быстрее, чем целый массив) и приступить к тестированию. Кроме того, SDS-решение значительно повышает производительность дисковой подсистемы: Datacore, например, использует RAM-серверы в качестве кэша, а все остальные диски – лишь уровни, иерархии хранения.
Сложность распространения SDS на нашем рынке
Основная проблема, связанная с продвижением SDS-решений в России, заключается в трудности адаптации к новому подходу. Решения серверной виртуализации в 2003 г. также сталкивались с массой вопросов и сложностей. Мы говорим не о продукте, а о новом подходе, который меняет ландшафт инфраструктуры. Было бы наивно полагать, что кто-то решится мгновенно перейти на SDS после долгих лет использования классических СХД.
Сегодня заказчики исследуют рынок, прицениваются, тестируют решения, выбирают наиболее подходящее. И это правильный подход – все нужно взвешивать, тем более когда речь идет о системах хранения данных компании.