Под флагом федерации
Сегодня можно говорить о постепенном сближении показателей производительности и функциональности систем хранения данных среднего и старшего классов. В чем же именно происходит нивелирование различий между ними, остаются ли у «тяжелых» систем какие-то преимущества и что будет определять пути дальнейшего развития систем хранения данных? Мы попробуем ответить на эти непростые вопросы.
По оценкам аналитиков, на СХД сегодня приходится 3–5% средств ИТ-бюджетов российских компаний на ИТ-оборудование, и, как ожидается, эта доля в ближайшие несколько лет будет только увеличиваться. Эксперты полагают, что, несмотря на достаточно сложную ситуацию в экономике, рынок СХД в России, вероятно, будет расти двузначными темпами, даже с учетом того, что стоимость хранения единицы данных будет ежегодно снижаться на 7–8% и все большую популярность начнет набирать оборудование средней ценовой категории.
В числе факторов, препятствующих росту спроса на новые СХД, – виртуализация дисковых хранилищ и системы с поддержкой алгоритмов дедупликации и сжатия на лету, которые позволяют повышать эффективность использования развернутых инфраструктурных решений, считают в IDC. Однако объемы данных растут, поэтому в емкостном выражении рынок внешних СХД будет однозначно увеличиваться. И конкуренция в этом сегменте усиливается.
Что же представляет собой сегодня популярная категория СХД среднего класса (Midrange) и в чем отличие этих решений от систем старшего класса (High-End)?
Игра в классы
У систем СХД старшего класса, востребованных в основном крупными компаниями-заказчиками, такими как финансовые организации, есть несколько важных отличий. Во-первых, это солидная история развития архитектур, микрокода и технологий решений, во-вторых, связанная с этим очень высокая надежность.
Старший класс консервативен. Нередко инновации внедряются в подобных системах позднее, чем в других решениях хранения: они должны быть хорошо обкатаны на реальных приложениях, доведены до ума, High-End-СХД не имеют права приносить никаких сюрпризов их владельцам. Инновации в старшие классы должны быть не просто хорошо протестированными и отлаженными, но и зрелыми по всем механизмам их использования, т. е. должна быть отлажена сама модель взаимодействия оператора с этими функциями, детально проработан сценарий применения под основные отраслевые приложения. В результате старшие системы хранения данных могут на год-два отставать по своей функциональности от среднего класса. Хороший пример из истории: функция автоматического многоуровневого хранения, которая пришла в High-End-класс примерно на три-пять лет позже (в 2008–2010 гг.), чем в Midrange (2005 г.). Итак, любые изменения в их архитектуру вносятся долго, болезненно и очень аккуратно.
По спектру функций оба класса систем в настоящее время эквивалентны. Quality-of Service (QoS), мгновенные снимки данных, сжатие и дедупликация, удаленная репликация, геораспределенные кластеры и даже святая святых старшего класса – многоконтроллерность – все эти возможности уже сегодня предлагает и средний класс.
А вот что пока точно остается за старшим классом, так это его история и консерватизм, повышенное внимание к поддержке и экосистема технической экспертизы, сложившаяся за десятилетия существования этого направления. Совокупность всех указанных факторов зачастую называют одним термином – «надежность старшего класса».
Федерация против «старшеклассников»
При разработке новых дисковых массивов большинство вендоров ориентируются на применение компонентов, выпускаемых для серверов стандартной архитектуры. Эта стандартизация позволяет им избавляться от больших затрат, связанных с разработкой и производством специализированных микросхем (Application-Specific Integrated Circuit – ASIC) и сосредоточиваться на программно-реализуемых функциях, которые можно будет легко переносить на процессоры Intel следующего поколения.
С увеличением вычислительной мощности процессоров и появлением флеш-памяти средний класс сначала стал конкурировать со старшими СХД по производительности. Этому способствовали и более простая архитектура, и более «свежий» код, лишенный проблем с наследованием устаревших функций и моделей программирования. Лишь для немногих приложений – исключительно крупных консолидированных СУБД – производительность систем среднего класса может оказаться недостаточной.
Следующий шаг – соперничество среднего класса СХД со старшим за показатели надежности. Конечно, самому по себе массиву среднего класса тяжело конкурировать с High-End по этому параметру. Но ситуация стала кардинально меняться с появлением федеративных систем хранения (2009 г.). И этот тренд – сопоставление федераций массивов против монолитных систем хранения данных старшего класса – сейчас активно набирает темпы роста.
Федерация – это группа СХД. Она позволяет консолидировать инфраструктуру хранения так, чтобы она функционировала как единое целое. И хотя каждая в отдельности взятая система среднего класса (как правило, двухконтроллерная) уступает старшей СХД по надежности, федерация таких систем с возможностью переноса рабочей нагрузки между системами в виртуализированных и облачных вычислительных средах без прерывания работы приложений поспорит с High-End по показателю совокупной надежности и отказоустойчивости. Другими словами, федерация позволяет получить нужный уровень качества за счет количества.
Стоит, однако, отметить, что задача обеспечения высокой надежности должна решаться не только на уровне СХД, но и на уровне инфраструктуры ИТ, т. е. всего ЦОД.
В общем случае федерация СХД среднего класса дешевле одной системы хранения данных старшего класса с эквивалентными емкостью и производительностью. При этом она может быть еще и надежнее – по совокупной оценке рисков, в которую необходимо включать и человеческий фактор. Например, при выполнении сложных сервисных процедур, когда человеческий фактор может привести к остановке приложений не по вине производителя СХД, у владельца федерации появляется возможность в онлайн-режиме переместить нагрузку на другие узлы федерации, которые в настоящих работах не участвуют, и таким образом устранить риск воздействия ошибок инженера на непрерывность функционирования приложений. Фактически это прозрачный вывод отдельного массива из эксплуатации в целях его технического обслуживания. Ровно то, что мы сейчас наблюдаем в «вычислительных федерациях», например VMware vSphere. Основа такого сценария – техническая независимость друг от друга систем хранения, входящих в состав федерации. Федерация – совокупность независимых систем. В этом ключевое отличие от многоконтроллерных кластеров – систем старшего класса. В High-End-системе уходить уже некуда, поэтому задача обслуживания массива старшего класса всегда будет требовать дорогостоящих работ и высочайшего уровня экспертизы у инженеров.
Это же свойство прослеживается и в сценарии обновления микрокодов: федерация СХД позволяет устанавливать новую версию прошивки не на все узлы, а только на один или несколько выбранных, что принципиально невозможно в старшем классе. Таким образом, внедрение новых микрокодов в федерации происходит постепенно, система за системой, что представляет собой еще более консервативный и аккуратный механизм, чем даже в системах класса High-End.
По устойчивости систем к отказу контроллеров и дисков ситуация в старшем и среднем классах идентична. Производитель может уже сегодня гарантировать безотказную работу при выходе только одного контроллера (или дискового контроллера) или нескольких, если отказавшие контроллеры находятся в разных парах. И связано это лишь с тем, что у любого современного диска всего два порта для подключения к вышестоящим контроллерам – и в High-End, и в Midrange классах.
В итоге по совокупной оценке факторов надежности и доступности федерация систем среднего класса даже превосходит массивы High-End-класса благодаря возможности реализовывать дополнительные сценарии снижения роли человеческого фактора.
Но вернемся к экономике СХД. Насколько выгоден вариант федерации? Как обычно, это зависит от конкретной конфигурации систем. Тем не менее, с учетом высокой стоимости СХД старшего класса, федерация массивов имеет больше шансов выиграть и в этой категории. К тому же ТСО у федерации систем среднего класса, как правило, ниже, чем у старших СХД. Конечно, конфигурации федерации могут быть разными – требуется резервная емкость для перемещения нагрузки, но при четырех и более узлах запас в обоих случаях становится примерно одинаковым. Между тем с увеличением количества узлов возрастают и затраты на контроллеры и диски. Все это влияет на общую стоимость федерации, следовательно, здесь приходится решать задачу оптимизации.
В целом же тенденция такова, что все меньше остается ситуаций, когда по соображениям надежности или по иным причинам выгоднее использовать дорогую консолидированную СХД старшего класса. И это один из важных факторов продолжающегося сужения рынка «старшеклассников».
Конечно, предрекать им конец, как минимум, преждевременно. Вымирание им точно не грозит – старший класс будет развиваться, технологии продолжат совершенствоваться. Консолидированная архитектура систем хранения все еще удобна, что обусловлено в первую очередь консолидированной архитектурой самих приложений. Однако таких, по-настоящему требовательных «монолитных» приложений, которые по техническим причинам нельзя перевести на распределенные федеративные хранилища, относительно мало, впрочем, как и вендоров СХД старшего класса, которых можно пересчитать по пальцам одной руки, включая даже OEM-бренды.
ПО решает все
Определять пути дальнейшего развития систем хранения данных будет программное обеспечение. В конечном счете именно логика и архитектура ПО определяют особенности реализации аппаратной платформы СХД. Традиционно крупные СУБД и приложения, как правило, консолидированы, и именно под них создаются мощные серверы и массивы хранения данных старшего класса. Для консолидированной нагрузки удобнее использовать одну логическую СХД, многодисковую и многоконтрольную.
Между тем СХД среднего класса уже стали настолько емкими и производительными, что ресурсов такого узла вполне достаточно для 99% всех возможных задач. Кстати, одна из особенностей российского рынка – высокий спрос на системы старшего класса. В Европе и США они занимают значительно меньшую по сравнению с Россией долю рынка и используются для особо критичных приложений со сложным профилем нагрузки, требующих томов большой емкости и серьезной вычислительной мощности.
Виртуализация и еще раз виртуализация
В настоящее время принципы серверной виртуализации, например, принцип равноправия узлов (когда нет «виртуализатора» хранения с присущими ему ограничениями, определяющего предельные показатели производительности и надежности), высокая горизонтальная масштабируемость СХД, находят применение на уровне хранения данных. Настоящая виртуализация – виртуализация без «центрального» виртуализатора, без посредника (контроллера виртуализации). Это единое эластичное облако с онлайновой миграцией нагрузки, совокупность механизмов общения равноправных узлов с единым централизованным управлением.
Только после того как в области хранения данных стало возможным построение виртуализации без посредника, появился повод говорить о федерации хранения и реальной конкуренции с системами класса High-End.
Поскольку программное обеспечение развивается сейчас в направлении распределенных вычислений, федерация СХД среднего класса становится оптимальной платформой для все большего числа задач. Один из примеров распределенных приложений – VDI. Еще более подходящая основа для подобных задач – гиперконвергентные системы с еще более мелким дроблением ресурсов. Так, в одном из проектов VDI в США гиперконвергентное облако обслуживает 55 тыс. рабочих мест.
От федерации к гиперконвергенции
По существу, облачный дата-центр – это ЦОД с высоким уровнем виртуализации. Сейчас наши облачные провайдеры обычно применяют массивы среднего класса, но не исключено, что в будущем кирпичиками ЦОД станут гиперконвергентные системы – узлы, объединяющие в себе виртуализированные вычислительные ресурсы и ресурсы хранения данных. Они хорошо подходят для распределенной нагрузки – виртуальных рабочих мест (VDI), веб-сервисов, частных облачных инфраструктур и пр. Массовый рынок ПО движется в сторону такой дискретизации «тяжелых» монолитных приложений, а значит, будет расти спрос и на гиперконвергентные решения. Им суждено заменить собою традиционные серверные фермы и федерации массивов.
С увеличением процессорной мощности, расширением использования флеш-памяти, перемещением контроллера «на кристалл» меняется сама архитектура хранения. СХД превращается в систему х86 с гипервизором, начинает стираться грань между серверами и системами хранения данных. Одни и те же процессоры служат сегодня и для поддержки функциональности СХД, и для выполнения бизнес-приложений, а конкретные функции систем хранения реализуются на уровне виртуальных машин.
Упрощается архитектура системы – устраняются контроллеры как отдельные элементы, приложение становится ближе к СХД. Узел облака – это просто сервер.
В мире приблизительно 79% ИТ-организаций планируют в 2016 г. увеличить расходы на конвергентную инфраструктуру, отмечают аналитики 451 Research. По прогнозам IDC, мировой рынок гиперконвергентных систем до 2019 г. ежегодно будет расти почти на 60%. В ближайшие три года его объем приблизится к 4 млрд долл. Успех гиперконвергенции лишь подчеркивает правильность тренда перехода от High-End к федеративным, распределенным хранилищам. Не исключено, что оба этих явления – проявление более глубинного тренда изменений, связанного с тем, как сегодня создаются и куда стремятся архитектуры вышестоящих приложений. Ведь именно они в конечном итоге определяют архитектуру поддерживающей их инфраструктуры.