Компания «ФОРС Дистрибуция» провела тестирование, в ходе которого было произведено сравнение показателей производительности Arenadata DB (ADB) и Arenadata Hadoop (ADH) с Cloudera CDH на программно-аппаратной платформе Oracle Big Data Appliance.
Проведенные испытания позволили определить несколько сценариев модернизации контуров Big Data, в том числе программно-аппаратного комплекса Oracle Big Data Appliance. Первый сценарий предусматривает сохранение инвестиций в аппаратные средства при полной замене программного стека средств обработки больших данных на российское ПО. Второй сценарий предусматривает переход с импортного программного обеспечения на российское, параллельно с постепенной или единовременной заменой аппаратных средств на российские.
Для проведения тестов был выбран стек программных средств от одного из лидеров рынка ПО для корпоративных хранилищ данных – компании Arenadata. В рамках тестирования были выполнены тесты с синтетической нагрузкой на Oracle Big Data Appliance для определения параметров производительности каждого компонента, входящего в сборку Cloudera Data Hub Enterprise Edition. Тестирование производилось по методике TPS-DS со шкалированием 10000, что эквивалентно размеру данных в 10 Тб.
Для проведения тестирования на оборудовании Oracle было установлено программное обеспечение ADH. Инженерам компании «ФОРС Дистрибуция» удалось добиться стабильной работы контура в течение всего цикла тестирования. Результат показал, что на ADH задачи преобразования больших данных, относящиеся к типичной ETL-нагрузке, суммарно были выполнены на 39% быстрее, чем на программном стеке Cloudera CDH.
Для оценки показателей при выполнении задач Adhoc аналитики было проведено сравнение Cloudera Impala и Arenadata DB, базирующейся на технологиях Greenplum и обладающей высокой производительностью в сложной конкурентной нагрузке. Общее время выполнения запросов в ADB оказалось меньше на 43% по сравнению с Cloudera Impala. Также результаты тестирования демонстрируют, что ADB имеет более высокий показатель поддержки синтаксиса запросов по сравнению с Cloudera Impala.
«Проведенные совместно с экспертами компании Arenadata испытания доказали программную совместимость российских продуктов с ранее развернутыми импортными системами. Российские производители продолжают развивать свои решения, что дает ощутимое улучшение производительности при переходе с унаследованных систем, – комментирует Андрей Тамбовский, директор по технологиям «ФОРС Дистрибуция». – Разработанные нами сценарии миграции на российские разработки должны облегчить заказчикам процесс модернизации своих аппаратных и программных средств, одновременно оптимизируя расходы на такой переход и улучшая критичные для бизнеса характеристики инфраструктуры хранилищ данных».
«Благодаря технической зрелости и функциональности, продукты Arenadata используются в качестве современной альтернативы зарубежным решениям. Результаты тестирований, проведенных командой “ФОРС Дистрибуция“, подтвердили этот факт и наглядно продемонстрировали преимущества Arenadata DB и Arenadata Hadoop по сравнению с ПО на базе Cloudera», – отметил Антон Мартынов, директор по работе с партнерами Arenadata.