В последнее время одной из тенденций рынка стало повышение требований к надежности ЦОД. Сейчас многие центры обработки данных соответствуют самым высоким уровням надежности. Для заказчика это означает, что отказ любого компонента инфраструктуры дата-центра останется незамеченным и не повлияет на связанные с ним бизнес-процессы. Тем не менее в случае природных и техногенных катастроф или терактов, во время которых, к примеру, может существенно пострадать здание самого дата-центра, все может оказаться гораздо сложнее. И даже ЦОД с самым высоким уровнем надежности Tier-III может перестать обеспечивать доступность и сохранность данных. Для защиты от таких катастроф требуется построение более сложной, географически распределенной инфраструктуры, где при выходе из строя основного дата-центра происходит переключение на резервный ЦОД с резервным оборудованием.
Организация таких систем обычно характеризуется высокой сложностью и высокой стоимостью. Для их работы требуется резервное оборудование, аналогичное основному, а также быстрые каналы связи с гарантированной пропускной способностью. Это позволит обеспечить репликацию данных с минимальными задержками между площадками, находящимися на большом расстоянии. Кроме того, необходимы и сами программно-аппаратные решения, обеспечивающие репликацию данных между площадками и системами хранения данных.
Обслуживание подобных решений является трудоемкой и дорогой задачей. До недавнего времени их реализация была доступна только заказчикам из сегмента крупного бизнеса.
С появлением облаков, виртуализации и облачных провайдеров ситуация начала меняться (стоимость аналогичных решений постепенно снижается). Облачные провайдеры изначально имеют избыточный запас вычислительных ресурсов и хорошо обеспечены каналами связи до основных точек обмена трафиком. Кроме того, зачастую они имеют собственные каналы связи между несколькими территориально разнесенными ЦОД.
Виртуализация, в свою очередь, значительно изменила и упростила подходы к работе с данными и ИТ-сервисами. Появились виртуальные дата-центры, программно-определяемые СХД и специальное ПО для репликации данных с поддержкой различных типов облаков. Организовать репликацию и защиту виртуальных машин стало значительно проще и дешевле, чем заниматься проектированием и созданием сложных решений для сопряжения площадок на базе физических стоек серверов и хранилищ.
Что же такое катастрофоустойчивое облако? Это решение, которое обеспечивает непрерывную работу критически важных ИТ-систем в облаке при масштабных авариях и форс-мажорах. Облачный сервис Cloud DRaaS (Disaster Recovery as a Service) позволяет значительно снизить риски, связанные с утерей данных и простоем бизнеса. Причем все это возможно без капитальных вложений в ИТ-инфраструктуру.
На практике решения Cloud DRaaS чаще всего представляют собой услуги облачных провайдеров на базе классического IaaS либо программные решения от разработчиков ПО резервного копирования, а также комбинацию этих решений. Для подобных услуг реализована возможность включения (подключения) «горячего» резервирования (репликации) существующих виртуальных машин в удаленный сегмент облака, расположенный в территориально удаленном ЦОД. В личном кабинете провайдера заказчик, как правило, может самостоятельно подключить защиту или репликацию для своих облачных серверов, при необходимости создать и настроить планы восстановления. В случае аварии в основном дата-центре происходит автоматическое переключение на резервную площадку, где осуществляется запуск виртуальных машин согласно плану восстановления, при этом обеспечиваются минимальные показатели RTO (Recovery Time Objective – время, необходимое для восстановления работы после сбоя) и RPO (Recovery Point Objective – точка восстановления).
Кроме того, использование услуги Cloud DRaaS возможно для резервирования существующей ИТ-инфраструктуры, причем как для физических серверов, так и для серверов, уже находящихся в частном или публичном облаке. Для подключения могут потребоваться установка специальных агентов репликации на защищаемые серверы заказчика и организация канала между инфраструктурой заказчика и провайдером DRaaS. В остальном принципы те же: в случае аварии на основной инфраструктуре «горячий» бэкап в облаке можно запустить в течение нескольких минут. Пока ресурсы находятся в режиме ожидания, оплата идет по минимальным тарифам. Конечно, это значительно выгоднее и проще, чем самостоятельная организация резервного ЦОД.
Здесь стоит упомянуть еще об одной тенденции, стремительно набирающей популярность. Речь идет о сервисах аварийного восстановления в облаке в составе ПО для резервирования данных от известных разработчиков, таких как Veeam и Acronis. Они работают по модели настраиваемого и оплачиваемого по факту использования сервиса резервного копирования. Этот сервис перемещает, защищает и восстанавливает данные, находящиеся в физической, виртуальной или облачной средах. В отличие от классического резервного копирования реплики передаются сразу на удаленную площадку к одному из доступных для выбора по всему миру облачных провайдеров, количество которых постоянно растет. Выбор площадки осуществляется пользователем самостоятельно в процессе настройки задачи резервирования. Здесь поставщики ПО выступают посредниками между клиентами и облачными провайдерами, привлекая к участию в программе все новых провайдеров, которые, естественно, соответствуют требованиям и могут обеспечить принятие реплик и их готовность к запуску в случае аварии. Резервные копии передаются в облако и создаются в виде готовых к запуску образов виртуальных машин, обеспечивая возможность полноценного послеаварийного восстановления в облаке. Такие сервисы восстановления доступны как модули к существующему ПО резервного копирования либо уже входят в состав полных версий продуктов. Многие провайдеры строят на базе этих программных продуктов собственные DRaaS-решения, предлагая в аренду лицензии на ПО и собственные ресурсы. Защита доступна не только для серверов, но и для рабочих станций, и даже для отдельных приложений. Возможно создание мультиоблачной защиты, когда разные части распределенной инфраструктуры обеспечены единой защитой на облачной резервной площадке. Модель лицензирования подразумевает оплату аренды лицензий по числу защищаемых виртуальных машин. Также придется оплачивать стоимость резервирования ресурсов или хранения данных облачному провайдеру, что свойственно практически для всех сценариев аварийного восстановления в облаке.
Как видим, услуги, оказываемые по относительно новой модели Cloud DRaaS, позволяют максимально упростить и удешевить некогда сложные и дорогостоящие решения катастрофоустойчивости. Стоимость предлагаемых сейчас услуг Cloud DRaaS обычно не превышает 30–40% стоимости аренды услуг IaaS (вычислительных ресурсов). Дополнительная оплата, как правило, берется только за резервирование ресурсов, так как во время штатной работы «горячая» копия не создает нагрузку на облако. Отсюда и низкая стоимость.
Конечно, несмотря на растущую популярность, все еще остается ряд проблем при реализации решений Cloud DRaaS, прежде всего последствия возможной смены сетевой адресации на резервной площадке, непредвиденные сложности во время аварийного переключения и проблемы с доступностью инфраструктуры после восстановления. При использовании ПО с модулем DRaaS могут возникнуть трудности из-за низкой скорости интернет-подключения со стороны резервируемой площадки – в этом случае поможет WAN-акселератор, входящий в состав расширенных версий ПО.
Ключевой момент в обеспечении непрерывности бизнес-процессов – тщательное планирование послеаварийного восстановления. Такое планирование включает создание BCP (Business Continuity Plan): плана обеспечения непрерывности бизнеса с детальным описанием того, что необходимо сделать для восстановления бизнес-процессов, и DRP (Disaster Recovery Plan) – плана аварийного восстановления с четким описанием действий технического персонала в случае аварии. План DRP обеспечивает возможность максимально быстро взять под контроль или возобновить выполнение критически важных задач. План восстановления состоит из четырех основных этапов:
- исследование ИТ-процессов организации;
- разработка стратегии восстановления с учетом оптимальных RTO/RPO;
- описание действий при аварии с назначением ролей и ответственных;
- тестирование процедур восстановления.
Выполнение полноценных тестовых сценариев восстановления в продуктивной среде поможет проверить работоспособность используемого решения и убедиться в полноте мер, предусмотренных планом аварийного восстановления. Также не стоит забывать о плане возвращения к нормальным деловым операциям: эта часть процедуры послеаварийного восстановления, хотя и является не менее важной, зачастую остается без внимания.
При взаимодействии с провайдерами услуг Cloud DRaaS, безусловно, стоит учитывать опыт сотрудников компаний, которые помогут предупредить проблемы и исключить возможные ошибки еще на этапе планирования.
В России несколько провайдеров уже предоставляют услугу Cloud DRaaS. Среди них «Даталайн», КРОК, «Ланклауд», Mail.Ru , «Максиплэйс», «Софтлайн» и др. Провайдеры предлагают в основном оба варианта услуги – катастрофоустойчивое облако и «Резервный облачный ЦОД». Некоторые из них – участники программ CSP и MSP от Veeam и Acronis, которые сами являются одновременно партнерами и конкурентами, предоставляя программные решения для самостоятельного создания сервиса катастрофоустойчивого облака и провайдерам, и конечным заказчикам. Таким образом они могут выступать в качестве резервной площадки для запуска бэкапов со сторонних или локальных площадок.
Среди заказчиков услуга только начинает набирать популярность: многие представители малого и среднего бизнеса еще просто не осознают, что уже сейчас им доступны решения такого масштаба, которые не требуют огромного бюджета и высоких трудозатрат на реализацию и поддержку. А ведь практически в любом бизнесе найдется ИТ-сервис или система, недоступность которой даже в течение нескольких часов вызовет серьезные убытки и нанесет урон репутации. Что уж говорить о E-commerce-проектах, чей бизнес полностью зависит от круглосуточной доступности в онлайн-режиме. Несмотря на это, средства обеспечения высокой доступности и катастрофоустойчивости сейчас использует преимущественно крупный бизнес.
Можно смело говорить о высоком потенциале услуги Cloud DRaaS и росте ее популярности в ближайшее годы как со стороны пользователей – представителей всех сфер бизнеса, так и с точки зрения многообразия предложений Cloud DRraaS. Растущий рынок IaaS и всеобщая цифровизация сделают услугу доступной и востребованной в самом широком смысле. Скорее всего, в обозримом будущем мы увидим Cloud DRaaS и в составе стандартного набора услуг всех основных облачных провайдеров, и в качестве функции большинства ПО для резервного копирования инфраструктуры. При этом будут продолжать снижаться показатели RTO и RPO, а уровень автоматизации и скорость подключения катастрофоустойчивой защиты – повышаться.