О традиционных и новых подходах к хранению данных, практике применения СХД Connect рассказал Александр Яковлев, менеджер по маркетингу продукции, серверов и систем хранения Fujitsu
– Начнем с главного: большие данные – это выдумка маркетологов или повседневная реальность? Какие требования предъявляются к современным СХД в контексте оперирования с большими данными?
– Компании уже достигают конкретных бизнес-результатов на основании анализа больших данных, принимая оптимальные решения, которые позволяют увеличивать обороты и прибыльность компании. Поэтому большие данные – уже реальность. Требования к системам хранения данных предъявляются повышенные, причем не столько к размеру СХД, сколько к эффективности хранения данных, возможности динамически перераспределять ресурсы, к ее пропускной способности, которая должна быть, без преувеличения, огромной, в частности при анализе данных продуктивных систем. С одной стороны, есть жесткие требования по скорости доступа к ним со стороны, например ERP-системы, в плане гарантированного времени отклика и достаточности полосы пропускания продуктивных систем. С другой стороны, к тем же данным (или смежным с ними, лежащим в том же хранилище) должны иметь доступ и аналитические системы, которые также могут создавать серьезную нагрузку на базу данных. То есть возникает задача разграничения доступа к одним и тем же данным. И здесь у компании Fujitsu имеются очень серьезные наработки, как в сегменте специализированных хранилищ, так и для обычных дисковых СХД.
– Какой пример можно привести из практики?
– Самый простой пример – онлайн-ритейлер. С одной стороны, налицо очень жесткие требования по времени отклика на запрос покупателя через сайт. С другой – известно, что средства аналитики в области розничной торговли способны увеличить на десятки процентов посещаемость сайта, обороты и прибыль компании. Возникает задача разграничения уровней доступа и возможностей, предоставляемых различным группам пользователей. Решение этой задачи осложняется нелинейностью продуктивной нагрузки – могут возникать как прогнозируемые (перед праздниками), так и непрогнозируемые пики продаж, наблюдаться снижение покупательской активности. Соответственно, в одной ситуации реализуется осознанное уменьшение полосы пропускания, количества операций в секунду для аналитики с целью гарантировать минимальное время доступа для продуктивной системы, в другой – полоса пропускания для получения аналитики может быть увеличена. У ритейла уже есть понимание, что маркетинговые программы необходимо реализовывать на основе анализа больших данных, только тогда они приносят ощутимый для бизнеса позитивный результат. Для банковской сферы использование СХД и для продуктивных систем, и для аналитики также актуальны. Только там все сложнее, поскольку добавляются серьезные требования по обеспечению уровня надежности СХД выше 0,99999, гарантирующей непрерывность ИТ-поддержки бизнеса. Любые сбои в оказании банковского онлайн-сервиса, даже если они чисто технического характера, могут вызвать панические настроения среди клиентов и иметь крайне неприятные последствия для банка.
– С какими трудностями может столкнуться бизнес при эксплуатации традиционных СХД?
– К трудностям можно отнести задачи по масштабированию СХД общего назначения в плане, например, возросших требований к производительности системы, ее емкости. Кстати, Fujitsu в качестве варианта для решения подобных проблем предлагает заказчикам апгрейд СХД с заменой контроллеров.
– Разночтения в трактовке одних и тех же терминов – распространенное явление, особенно для новых технологий. Что такое программно-определяемая СХД (Software—Defined Storage) в вашем понимании?
– Программно-определяемая СХД – это система, которая позволяет обеспечивать длительное и эффективное хранение данных независимо от аппаратного обеспечения конкретного производителя СХД. Функционал классической СХД определяется проприетарным программным обеспечением или аппаратными решениями на уровне контроллеров, подключения дисковых полок и т. д. Таким образом, любой переход на новые технологии подразумевает обновление парка СХД и миграцию данных со старых решений на новые. Поскольку в случае с SDS отсутствует жесткая привязка к аппаратуре, при появлении в составе ИТ-инфраструктуры компании новых серверов, дисковых систем хранения возникает возможность осуществлять бесшовную миграцию данных и даже совместно использовать и старые СХД, и новые решения.
– Какое SDS-решение предлагает Fujitsu? В чем его преимущества?
– Это ETERNUS CD10000, программно-определяемое решение с огромными возможностями по масштабированию и дополнительными преимуществами для заказчика. Во-первых, это открытая, непроприетарная среда, реализованная на базе открытых стандартов Ceph и OpenStack. Во-вторых, законченное решение с управляющими сервисами, разработанными глобальным вендором Fujitsu. Специалисты компании способны сделать полноценное конфигурирование системы под требования заказчика (сайзинг), определить требуемое количество узлов хранения, их производительность, после чего оперативно реализовать внедрение системы и осуществлять ее поддержку в процессе эксплуатации как завершенного СХД-решения класса Hi-End.
– На какие задачи ориентировано данное решение?
– Система прекрасно подходит для заказчиков, которые начинают строить облачные хранилища. Решение особенно эффективно при объемах хранения порядка десятков петабайт данных, причем хранения с различными уровнями SLA и для большого количества различных пользователей. То есть ETERNUS CD10000 – классическое высокоэффективное облачное хранилище, которое может хранить данные с длительным жизненным циклом, поскольку в нем заложена возможность добавления в систему узлов хранения будущих поколений и плавной миграции данных.
– Проявляют ли интерес к данному решению на российском рынке?
– Решение анонсировано совсем недавно, в конце 2014 г., поэтому о конкретных результатах говорить пока рано, но интерес со стороны участников российского рынка большой. Во-первых, это выражается в количестве запросов, во-вторых, сама по себе задача построения высокопроизводительных облачных хранилищ актуальна для рынка. ETERNUS CD10000 подходит для ее решения действительно очень хорошо.
– Внедрение новой, программно-определяемой СХД – инвестиционно-емкий проект?
– Проект внедрения новой СХД, как любой другой проект, требует определенных инвестиций. Что касается инвестиционной емкости, то смотря с чем сравнивать. Если взять стоимость хранения данных с использованием многопетабайтных дисковых систем с единой точкой управления, то подобное решение становится еще и экономически эффективным.
– Означает ли появление ETERNUS CD10000 постепенный уход с рынка обычных СХД, замену их более прогрессивным решением?
– Нет, не означает. Третье поколение дисковых систем ETERNUS DX S3 появилось не так давно, около года назад, и эти решения прекрасно зарекомендовали себя на рынке, в том числе в контексте работы с большими данными. Указанные СХД позволяют динамично перераспределять внутренние ресурсы между различными группами пользователей в соответствии с требованиями бизнеса, гарантируют высокий уровень производительности и высокую надежность. При этом каждое СХД-решение начального и среднего уровня от Fujitsu является в своем сегменте лидером по производительности, показывая абсолютные рекорды по времени отклика, что подтверждено не только нашими заказчиками, но и независимыми производителями (в частности, по результатам тестирования независимого ресурса Storageperformance.org).
– В заключение интервью о надежности. Чем она обеспечивается в случае SDS? Как это реализовано в ETERNUS CD10000?
– Сама архитектура ETERNUS CD10000 позволяет: обойти «бутылочное горлышко», которое в ряде случаев может образовываться на контроллерах традиционных СХД начального или среднего уровня по показателю производительности; обращаться непосредственно ко всем нодам, из которых состоит конкретная СХД. Кроме того, выход из строя одного контроллера в традиционной СХД – довольно неприятная ситуация, а в случае с SDS это практически не влияет на общую производительность системы.