Интервью с руководителем отдела корпоративных систем хранения данных, IBM Россия и СНГ
Что вкладывается в понятие программно определяемой системы хранения данных – Software Defined Storage, SDS? Каковы предпосылки и в чем смысл перехода к такой концепции построения инфраструктуры хранения данных?
Концепция программно определяемой инфраструктуры (Software Defined Infrastructure) сегодня – «горячая» тема на рынке. Речь ведется о программном определении всего: сетей, вычислений, систем хранения. Но если, скажем, в мире серверных систем эта концепция уже фактически реализована благодаря технологиям виртуализации (вычислительные ресурсы можно объединять в пулы и выделять по требованиям пользователей и приложений), то в мире СХД концепция программного определения относительно нова. Виртуализация в системах хранения применяется достаточно давно (напомню, решение для виртуализации СХД IBM SAN Volume Controller присутствует на рынке уже более десяти лет), но SDS это не только виртуализация
Программно-определяемая система хранения — это решение, в котором превалирует не «железо» – аппаратная составляющая может быть любой, а «софт». Программное обеспечение реализует весь тот функционал, который прежде реализовывался аппаратно, и позволяет объединять в единый пул разнотипные системы хранения данных.
Если говорить о предпосылках перехода к SDS, то первая – гетерогенность сред хранения. В ходе своего развития аппаратная часть систем хранения очень сильно менялась, вспомним хотя бы носители информации – перфокарты, ленты, жесткие диски, лазерные диски, флэш-диски… При этом каждая новая технология была, как правило, несовместима с предыдущей. Программное обеспечение меняется не столь сильно – дописываются микрокоды, происходят обновления, но сущность «софта» не меняется. Поэтому абстрагирование от аппаратных платформ хранения и переход к программно-определяемой инфраструктуре вполне логичен.
Другая предпосылка заключается в том, что бизнес не может и не хочет общаться с ИТ на языке технологий. Бизнес-заказчик хочет получить от ИТ определенные параметры сервиса хранения: емкость, скорость доступа к данным, надежность хранения (включая информационную безопасность). Концепции SDS и «облака» как раз и позволяют ИТ говорить с бизнесом на понятном ему языке, в терминах параметров сервиса, которые нужны пользователю. Технологии остаются незаметными для пользователя, в то время как ИТ могут быстро и гибко масштабировать параметры емкости, производительности и пр.
Надо ли понимать, что под SDS понимается чисто программное решение?
Не совсем. Предпочтительнее все-таки программно-аппаратные комплексы.
Полностью программные решения сложно внедрять. В нашем портфеле такое решение тоже есть – это Elastic Storage, ставшее развитием файловой системы GPFS в сторону дополнительного функционала и удобства использования. Но это решение нишевое. Оно используется как своего рода конструктор, при всей своей гибкости и независимости от аппаратного обеспечения оно требует большой работы по кастомизации. К широкому внедрению подобных решений рынок не вполне готов.
А вот программно-аппаратный комплекс SAN Volume Controller (SVC) – это решение «из коробки». Несмотря на свою долгую историю, этот продукт продолжает развиваться и быть востребованным. Преимущество программно-аппаратного комплекса в том, что аппаратная часть уже заранее «заточена» под решаемые задачи. Например, в SVC предусмотрен отдельный сопроцессор, который отвечает за компрессию данных, поэтому система позволяет сжимать данные «на лету» без потери производительности. Если пытаться решать аналогичную задачу исключительно программным способом на произвольном «железе», придется сильно усложнить логику «софта».
Таким образом, да, SDS – это прежде всего программное обеспечение, но и аппаратная часть имеет значение.
Как сообщалось на одном из мероприятий, для создания SDS корпорация IBM предлагает базовые продукты корпоративного и среднего класса и комплекс средств, обеспечивающих оптимизацию инфраструктуры хранения. Что это за продукты и средства?
По сути, речь идет об одних и тех же продуктах, но снабженных разным функционалом.
Относительно простое (базовое) решение можно построить, например, с помощью систем Storwize. Это дисковые системы среднего класса, которые имеют много общего с SVC и полностью вписываются в парадигму SDS – они позволяют программно создавать единое пространство хранения с выделением емкости и производительности по требованию. При том что система Storwize впервые была анонсирована в 2010 г. и за прошедшее время ее аппаратная база поменялась практически полностью, все обновления происходили плавно, без изменения программной логики.
Более сложные решения по оптимизации среды хранения связаны с тюнингом производительности, распределением данных по уровням хранения (не просто в рамках одной системы, но в рамках комплекса систем), созданием портала самообслуживания. По сути, речь идет о движении в сторону частного облака. Тот же SVC, например, имеет удобные API, которые позволяют связать его с корпоративным порталом. При необходимости можно создать единый портал, связывающий ресурсы частного и публичного облака. Направление, в котором движется IBM – это обеспечение единого управления физически разделенными ресурсами.
Какие трудности могут возникнуть у заказчика при переходе от традиционной инфраструктуры хранения данных к SDS? Каковы рекомендации и помощь IBM в таких проектах?
Возможная проблема при переходе к SDS связана с тем, что при консолидации систем хранения возникает одна потенциальная точка отказа или потенциальное «узкое горло». Поэтому важно использовать проверенное промышленное решение, полностью зарезервированное и высокопроизводительное. Решение SVC демонстрирует высокие показатели как по производительности, так и по надежности – оно состоит из четырех пар контроллеров, так что отказ какого-либо из них не скажется на качестве работы системы. С этой точки зрения можно ничего не опасаться, но важно правильно смонтировать систему и регулярно (по регламенту) обновлять ПО.
Работу над проектами по созданию SDS у заказчика мы начинаем с их глубокой предпродажной проработки. Прежде всего, это обследование имеющейся ИТ-инфраструктуры и выяснение, какой функционал необходим заказчику. Чтобы проект удался, у заказчика должны быть хорошие каналы связи – наличие программно-определяемой сети не обязательно, но обязательны надежные каналы Fiber Channel. В подобных проектах мы не просто продаем систему заказчику – выделенный специалист IBM следит за тем, чтобы внедрение проводилось правильно, в соответствии с лучшими практиками, и чтобы заказчик действительно получил SDS, а не просто виртуализировал емкость хранения.
Необходимый функционал – Thin Provisioning, компрессия, FlashCopy и пр. – как правило, запускается путем активации лицензий, заложенных в решении, в некоторых случаях – путем покупки дополнительных лицензий. Хочу особо отметить функционал компрессии, реализованный в последних версиях наших решений. Он позволяет «на лету», без потери производительности сжимать данные в процессе записи и так же быстро распаковывать их при чтении. Причем в ходе предпродажной проверки решения мы можем определить возможную степень сжатия данных, с которыми работает заказчик, и гарантировать ему конкретные показатели компрессии.
Много ли существует примеров практической реализации SDS? Кто заказчики SDS – это в основном крупные компании?
В мире таких проектов достаточно много. Из наших заказчиков могу упомянуть, например, Isbank, крупнейший банк Турции. Но заказчики SDS – это вовсе не обязательно крупные компании. Скорее это компании с историей закупок СХД. На определенном этапе любая компания понимает, что развитие инфраструктуры хранения данных по принципу «новая задача – новый массив» экономически себя не оправдывает. И тогда они обращаются к виртуализации СХД, концепции SDS и облака.
Сегодня каждый проект внедрения SDS в каком-то смысле имиджевый, поскольку потенциальные заказчики очень внимательно присматриваются к их результатам. Но в недалеком будущем, уверен, SDS станет таким же прорывом в ИТ, каким когда-то стала серверная виртуализация.