В рамках сотрудничества в области управления большими данными и аналитики компании DIS Group и «Ростелеком» завершили тестирование и подписали протокол о совместимости продуктов RT.DataLake и «Плюс7 ФормИТ на Hadoop».
«Платформа управления данными» от «Ростелекома» предназначена для бизнес-задач, связанных с большим объемом данных в различных отраслях, включая промышленность, медицину, страхование, логистику и государственный сектор: от построения корпоративных хранилищ и озер до сложной аналитики на базе искусственного интеллекта.
ETL-платформа «Плюс7 ФормИТ» позволяет интегрировать данные из различных корпоративных информационных систем, а также других источников, включая файлы, веб-формы, электронную почту и другие сервисы. Удобные визуальные интерфейсы ускоряют разработку процессов интеграции и управления качеством данных в несколько раз по сравнению с другими решениями.
Совместное использование RT.DataLake и «Плюс7 ФормИТ» позволит значительно расширить возможности платформы управления данными «Ростелекома», в том числе профилировать данные и приводить их к требуемому уровню качества – что особенно актуально при создании цифровых двойников и сложной предиктивной аналитике, требующих высочайшего уровня качества данных.
«Крупным корпоративным заказчикам могут потребоваться дополнительные мощные инструменты интеграции данных при создании озер данных на базе RT.DataLake. Мы считаем, что в таких случаях хорошим решением будет «Плюс7 ФормИТ на Hadoop» и успешно проверили его совместимость с RT.DataLake», – Директор по развитию платформы управления данными ПАО «Ростелеком» Станислав Лазуков.
В рамках протокола были обозначены следующие задачи тестирования:
- Автоматизированная установка дистрибутива RT. DataLake при помощи RT.ClusterManager;
- Интеграция платформ RT.DataLake и компонент «Плюс7 ФормИТ на Hadoop»;
- Чтение, запись и обработка данных на кластере Hadoop через подключение «Плюс7 ФормИТ на Наdоор» в режимах Native, Spark;
- Работоспособность утилиты Sqoop: в качестве источника и приемника применялись таблицы Oracle DB и PostgreSQL.
В ходе тестирования проверены все основные режимы совместной работы, включая ключевые возможности по интеграции данных и обработке данных на платформе «Плюс7 ФормИТ на Hadoop» в режиме Pushdown на платформу RT.DataLake.
«Подтверждение совместимости «Плюс7 ФормИТ на Hadoop» и RT.DataLake даст возможность создавать проекты по построению и наполнению озер данных с большими объемами неструктурированной информации, которые можно будет использовать для решения самых разных бизнес-задач», – технический директор DIS Group Олег Гиацинтов.