С появлением вычислительных систем возникла и потребность в хранении информации, с которой они работали. Для этого применялись различные типы носителей: перфокарты и магнитные ленты, накопители на гибких магнитных дисках (дискеты) и магнитооптические диски, компакт-диски, жесткие диски и, наконец, флеш-диски. Перечисленные носители различались характеристиками. ИТ-индустрия остановилась на использовании в основном флеш-памяти и жестких дисков – в силу их очевидных преимуществ. Чем обусловлен такой выбор?
Флеш-технологии дают неоспоримое преимущество в скорости доступа к данным, компактности носителя, низком энергопотреблении, тепловыделении и большей емкости. Да-да, прочитав «бóльшей емкости», вы не ошиблись. Максимальный объем HDD-диска на сегодняшний день составляет 10 ТБ, и дальнейшее наращивание его емкости с технологической точки зрения – задача сложная. В то же время объемы флеш-дисков растут день ото дня. Уже сейчас существуют устройства объемом в 13 ТБ, при том, что на рынке регулярно появляются анонсы о создании дисков 16 ТБ до конца 2016 г. Максимальный объем флеш-дисков FMD DC2, выпускаемых компанией Hitachi Data Systems, – 12,8 ТБ с учетом сжатия данных 2:1. В ближайшее время этот объем может быть удвоен.
Оборотная сторона медали флеш-накопителей – стоимость хранения единицы информации, которая в настоящее время значительно выше, чем при использовании HDD-дисков. Речь идет о дисках NL-SAS 7.2K объемом до 10 ТБ, так как диски SAS 10/15K имеют ограниченный объем и к тому же обходятся значительно дороже NL-SAS дисков.
Производительность доступа и эффективность хранения
Пока мы говорили только об устройствах, на которых хранятся данные. Но мало хранить данные – к ним нужно предоставить доступ по удобным и востребованным пользователями протоколам. Кроме того, необходимо обеспечить необходимый уровень производительности доступа к данным и защитить их. Все это обеспечивают современные системы хранения: от простых систем для домашнего использования до крупных СХД корпоративного класса, как, например, известная многим система Hitachi VSP G1000.
Одна из важных характеристик системы хранения данных – эффективность хранения. Представьте себе информационную систему, в которой за несколько лет накопились данные объемом около 100 ТБ, а требуемое в системе время отклика операций ввода-вывода при этом не должно превышать двух миллисекунд. При таких требованиях к производительности без флеш-дисков не обойтись. Но закупка флеш-накопителей объемом в 100 ТБ обойдется дорого. Для того чтобы свести стоимость решения к минимуму и выполнить требования по производительности, были разработаны методы конвергентного хранения данных: от многоуровневого хранения (tiering) до флеш-кэширования и технологий многоуровневого хранения в реальном времени. Все они позволяют прозрачно для приложения расположить отдельные блоки логических томов (LUN) на механических и флеш-дисках исходя из степени интенсивности доступа к ним. Кстати, это происходит автоматически, без участия ИТ-персонала, в то время как свободные ресурсы ИТ-отдела можно перенаправить на выполнение других задач. При этом приложение в среднем работает на скорости флеш-носителя, а итоговая стоимость решения оказывается немногим выше, чем если бы СХД использовала только механические диски.
Подходы к хранению данных
В зависимости от скорости смещения активных (с точки зрения интенсивности ввода – вывода) участков логических томов применяют только одно многоуровневое хранение или в связке с флеш-кэшированием либо многоуровневое хранение в реальном времени. Рассмотрим эти подходы подробнее.
При использовании многоуровневого хранения выделяют два и более уровней хранения данных. Первый уровень хранения, состоящий, как правило, из локально установленных в СХД флеш-дисков, – самый быстрый и, как следствие, самый дорогостоящий. Для эффективной работы многоуровневого хранения емкость флеш-уровня должна быть немногим более объема активно используемых данных приложения. По статистике, этот объем редко превышает 10–15% общего объема тех данных, доступ к которым требуется ускорить.
Второй и все следующие уровни хранения информации обычно состоят из механических дисков, которые могут не только устанавливаться локально в СХД, но и располагаться на других системах, подключенных основной системой хранения в режиме виртуализации.
Таким образом, компания может иметь одну высокопроизводительную СХД с локально установленными флеш-дисками на верхнем уровне хранения, а остальные уровни хранения размещать на внешних СХД с механическими дисками. Основная СХД при этом будет не только переносить данные между флеш-уровнем и уровнем хранения с механическими дисками исходя из активности доступа к данным, но и балансировать нагрузку между внешними системами хранения. Единственный недостаток многоуровневого хранения – низкая скорость реакции СХД на резкое увеличение или уменьшение активности ввода – вывода на отдельных участках логического тома. Время реакции варьируется от 30 минут у массивов Hitachi VSP G200 – G1000 и до 24 часов – у систем хранения других производителей.
Для увеличения скорости реакции СХД на изменения активности ввода – вывода на отдельных участках логического тома используются два принципиально разных подхода – каждый со своими сильными и слабыми сторонами. Первый подход – применение так называемого флеш-кэширования, позволяющего настроить в СХД флеш-ресурсы, которые будут использоваться системой для хранения копий «горячих» данных, размещаемых на более медленных механических дисках. В качестве флеш-ресурсов для кэширования в системах хранения различных производителей применяются PCIe-флеш-карты, диски SLC и eMLC/MLC. Преимущество такого подхода в том, что системы с флеш-кэшированием в зависимости от настроек могут использоваться для ускорения доступа практически к любым логическим томам СХД. Есть еще одно преимущество: при реализации флеш-кэширования на PCIe-картах задержка доступа к данным будет снижаться, что благоприятно скажется на общей производительности СХД.
Второй подход к повышению скорости реакции СХД на изменения активности ввода – вывода на отдельных участках логического тома – многоуровневое хранение в реальном времени. Пока этот подход реализован только в решениях компании Hitachi Data Systems, а именно – в линейке СХД среднего и старшего уровня VSP G. В решениях HDS многоуровневое хранение в режиме реального времени получило название Active Flash. Данные в многоуровневом (Hitachi Dynamic Tiering – HDT) пуле при включении опции Active Flash переносятся между флеш-уровнем хранения и остальными уровнями практически в реальном времени. По скорости реакции на изменения активности ввода –вывода такой подход не уступает традиционному флеш-кэшированию. Но по сравнению с флеш-кэшированием он имеет несколько преимуществ:
- для верхнего флеш-уровня хранения поддерживаются любые флеш-диски HDS, локально установленные в СХД (SSD, FMD v1, FMD DC2);
- дисковая емкость флеш-уровня HDT/Active Flash добавляется к общей полезной емкости системы хранения данных. В случае использования флеш-кэширования данные на флеш-носителях являются копией данных, находящихся на механических дисках, и не увеличивают общую полезную емкость СХД;
- для включения Active Flash на HDT-пуле с данными не требуется установка специализированных или монопольно выделенных флеш-дисков или модулей (PCIe flash, SLC SSD), как при флеш-кэшировании. При необходимости флеш-диски, составляющие флеш-уровень HDT/Active Flash, могут быть перенастроены для использования в других целях. Любая перенастройка при этом выполняется без остановки доступа к данным, расположенным на HDT-пуле с включенным Active Flash;
- для включения Active Flash на HDT-пуле с данными не требуется покупка отдельной лицензии, так как Active Flash является частью функционала HDT;
- при применении Active Flash допускается использование флеш-уровня хранения данных объемом до 4ПБ, т. е. максимального размера уровня хранения HDT-пула. Это значительно превосходит объем флеш-кэша в его реализации некоторыми производителями.
Резюмируя сказанное, можно отметить, что у компаний довольно широкий выбор средств для эффективного хранения информации. Конвергентное хранение востребовано заказчиками, несмотря на различия в подходах к нему со стороны производителей СХД. Сегодня бизнес рассматривает конвергентный подход к хранению информации как возможность работать с большими объемами данных, обеспечить приложениям необходимую производительность и сохранить привлекательную стоимость решений. Таким образом, конвергентные технологии становятся предпочтительными в период цифровых модернизаций бизнеса. Подобные решения позволяют компаниям не опасаться увеличения объема данных и сохранять конкурентные преимущества.