Дмитрий Хороших, менеджер по развитию бизнеса в области решений для ЦОД, Cisco
Системы хранения данных являются важнейшей частью ИТ-инфраструктуры любой организации. Сегодня невозможно представить себе компанию, перед которой бы не стояла задача хранить и обрабатывать данные, даже банальное ведение бухгалтерской отчетности или управление персоналом требует таких процессов. И конечно же, для многих компаний потеря или порча данных почти всегда ведет к убыткам, поэтому вопросам работы с данными уделяется повышенное внимание.
Централизованные хранилища корпоративных данных начали создаваться одновременно с объединением компьютеров в сети и за прошедшие 15–20 лет претерпели значительные изменения. Сегодня стало вполне обычным использование единой аппаратной СХД, к которой через сеть SAN подключены десятки, а то и сотни серверов. Такая конфигурация изначально была продиктована необходимостью поддержки работы «тяжелых» серверов СУБД с обеспечением высокой надежности и скорости доступа к данным. Но затем, в силу своей простоты и понятности, эта конфигурация стала использоваться для хранения практически всех типов данных компании.
Много лет у такого подхода практически не было альтернативы, но технологии не стоят на месте, и сегодня уже используется множество продуктов и подходов, предлагающих более простые решения для задач хранения и обработки данных.
Типы данных
Однако, прежде чем перейти к их описанию, давайте разберемся, какие типы данных сегодня чаще всего хранятся на корпоративных СХД.
- Образы дисков виртуальных машин. С тотальным распространением виртуализации этот тип нагрузки сегодня является практически доминирующим как по объему, так и по требованиям к пропускной способности подсистемы ввода-вывода и интерфейсов СХД.
- Файловые хранилища, на которых хранятся данные самых разных типов. Базы почтовых серверов, весь спектр корпоративных документов, различные медиаданные (изображения, музыка, видео) – размер этих данных также может быть весьма значительным.
- Файлы или дисковые тома корпоративных СУБД. Как ни странно, объем этих данных сегодня составляет невысокий процент от общего объема хранимых данных средней компании, при этом они, как правило, имеют для бизнеса наибольшую ценность, поскольку зачастую связаны с обеспечением функционирования критичных бизнес-процессов.
- Данные систем резервного копирования. С развитием требований к надежности приложений и удешевлением систем хранения данных в последние три-четыре года становится заметной тенденция перехода к хранению первой резервной копии данных и СУБД непосредственно на СХД либо в виде файлов, либо в виде мгновенных снимков разделов – обычно используются оба способа. Особенно часто таким образом выстраивают резевирование образов ВМ (1) – первая копия хранится в виде мгновенного снимка и еще несколько создаются уже средствами системы РК.
Это, так сказать, традиционные типы данных, которые давно и прочно существуют почти во всех организациях. В последние несколько лет к ним добавляются и новые, среди которых чаще всего встречаются следующие.
- Большие данные (Big Data). Хранилища «сырых», как правило, неструктурированных данных, поступающих с источников самого разного типа и имеющих самую различную природу. Это могут быть и данные логов, обращения пользователя к сайту, фотографии, аудиовидеофайлы, показания различных датчиков и т. д. Объединяют их два общих свойства:
- заранее невозможно гарантированно предсказать их объем;
- любое полезное использование этих данных требует их предварительной обработки.
Оба свойства требуют особого подхода к хранению и обработке таких данных.
- Объектные системы хранения позволяют хранить любые данные в виде объектов произвольного размера и содержания. Они являются во многом альтернативой файловым хранилищам, когда речь идет о надежном хранении большого объема разнородных данных.
Особо подчеркнем, что данные последних двух типов, как правило, не хранятся на традиционной инфраструктуре СХД – под них почти всегда создаются отдельные системы хранения на базе серверов с большим количеством дисков и специализированного ПО.
Платформа Cisco UCS
Теперь, когда мы разложили по полочкам задачи, стоящие перед корпоративным хранилищем, самое время представить, какие решения для них сегодня предлагает компания Cisco. Но прежде несколько слов о той платформе, на которой эти решения работают.
Платформа Cisco UCS была выведена на рынок чуть меньше десяти лет назад. Сама идеология платформы меняет представление ИТ-отделов организаций о том, как должен выглядеть сервер с точки зрения подключения к внешним сетям, управления, надежности и т. д. Любой сервер является stateless-оборудованием – это значит, что абсолютно все его настройки могут быть изменены, т. е. сконфигурированы под выполняемую задачу. Виртуализированный аппаратно-сетевой адаптер может выполнять функции произвольного количества LAN- и SAN-сетевых адаптеров. Все задачи по конфигурации серверов осуществляются программным путем через очень простую, но мощную конструкцию – сервисный профиль. По сути дела, Cisco UCS (в терминологии Cisco – вычислительная фабрика) является программно-определяемой серверной платформой. Большинство операций по обслуживанию серверной платформы автоматизировано – таким образом администратор освобождается от большей части рутинной работы. Кроме того, в составе одной фабрики могут работать серверы как Blade-формата, так и стоечные, при этом интерфейс управления у них может быть единым.
Портфель решений Cisco
Представленная платформа является основой всех решений Cisco для корпоративных СХД. Рассмотрим их по порядку.
Для сред виртуализации предлагается использовать гиперконвергентную систему Cisco HyperFlex. Это решение позволяет реализовать инфраструктуру на наборе серверов с локальными дисками, объединенном в единую разделяемую защищенную систему хранения данных и в единый ресурсный пул для вычислительных ресурсов.
Использование гиперконвергентного подхода существенно упрощает процесс планирования, выбора, внедрения, обслуживания, масштабирования инфраструктуры по сравнению с традиционным подходом «сервер + сеть + СХД»: по сути, все, что требуется, – выбрать конфигурацию одного блока и нужное количество блоков для получения совокупного объема ресурсов хранения и вычислительной мощности.
Cisco HyperFlex поддерживает разные форм-факторы узлов (до десяти или до 25 дисковых накопителей), разные типы накопителей (HDD, All-Flash, All-NVMe), масштабирование узлами как с дисками, так и без них (если требуются только вычислительные ресурсы), масштабирование до 64 узлов в одном кластере.
Комплекс HyperFlex включает в себя не только серверы и системное ПО хранения данных, но и интегрированную сетевую инфраструктуру на базе Cisco UCS Fabric Interconnect, которая решает задачи, связанные с обеспечением связности, взаимодействия с внешним миром и управления серверным оборудованием на основе политик и шаблонов.
HyperFlex поддерживает гипервизоры VMware vSphere и Microsoft HyperV, контейнерную инфраструктуру на базе Kubernetes, обеспечивает компрессию и дедупликацию данных, позволяет построить катастрофоустойчивое решение с асинхронной репликацией или растянутый кластер с синхронной репликацией и нулевой потерей данных в случае аварии.
Решения для файловых и объектных хранилищ основаны на специальном сервере S3260. Он представляет собой корпус форм-фактора 4RU с 56 слотами для накопителей формата 3,5″, с двумя слотами для размещения серверных узлов. Каждый серверный узел – двухпроцессорный на базе Intel Xeon Scalable, оснащен HBA- или RAID-контроллером, двумя дисками для загрузки ОС, возможна установка NVMe накопителей. Все 56 дисков распределяются между двумя серверными узлами нужным образом.
При необходимости вместо второго серверного узла в систему могут быть установлены дополнительно четыре диска LFF (что доведет суммарный дисковый объем до 60 дисков или 720 ТБ «сырого» пространства при использовании дисков 12 ТБ) или модуль расширения первого узла с дополнительными устройствами ввода-вывода, RAID-контроллером, NVMe-накопителями.
С помощью специализированного ПО, такого как Microsoft Storage Spaces, Scality (scality.com), Cohesity (cohesity.com), на базе этого сервера можно построить быстрое и отказоустойчивое хранилище нужного типа. Стоимость такого решения будет в разы ниже, чем стоимость аналогичного дискового массива.
S3260 может использоваться в рамках UCS-системы, что позволяет управлять конфигурациями на основе политик и шаблонов, тиражируя их при необходимости, – за счет этого можно строить большие хранилища петабайтного масштаба с минимальными трудозатратами.
Для систем резервного копирования мы предлагаем решения совместно с нашими партнерами Veeam и Commvault. С каждым из этих партнеров у Cisco имеются готовые валидированные дизайны, предусматривающие хранение резервных копий на внутренних дисках серверов семейств C240 или S3260. Использование типовых дизайнов Cisco позволяет сокращать время проектирования и внедрения новых платформ, а также значительно снижать эксплуатационные риски.
Построение систем для работы с большими данными – отдельная область экспертизы. Технические решения для BigData-платформ зачастую существенно отличаются от традиционного подхода. Весь опыт компании Cisco по построению таких решений изложен в документе Big Data Design Playbook (http://cs.co/big-data-playbook).
Серверная платформа Cisco UCS в качестве основы кластера для работы с большими данными позволяет минимизировать все операции по настройке и обслуживанию аппаратной среды кластера и сосредоточиться на решении прикладных задач.
И наконец, для работы с «тяжелыми» высоконагруженными СУБД мы предлагаем готовые законченные дизайны по «традиционным» системам хранения – с нашими партнерами NetApp, IBM, Pure Storage и т. д. С каждой из этих компаний у нас существуют десятки проработанных дизайнов под самые разные прикладные задачи – ознакомиться с ними можно в открытом документе Datacenter Design Playbook (http://cs.co/dc-design-playbook).
***************************************
Как видим, подавляющее большинство задач хранения и обработки корпоративных данных на сегодняшний день могут быть решены с помощью продуктов компании Cisco. Использование единой серверной платформы как основы для всех этих решений позволяет значительно снизить затраты на создание и эксплуатацию корпоративных систем хранения.
Основные типы корпоративных данных и предлагаемые решения Cisco для их хранения и обработки