Студия нейропродашкена D.lab, которую «Газпром-Медиа Холдинг» запустил в сентябре 2023 года, представила первые демо-образцы AIGC – мультимедийного контента разных форматов и жанров, произведенные искусственным интеллектом с минимальным участием человека. Образцы созданы с помощью собственного решения D.lab. Теперь студия переходит к тестированию своих технологий на проектах Детского Радио, RUTUBE, PREMIER и Yappy.
Решение D.lab позволяет создавать новые форматы контента. Например, анимированные пересказы литературных произведений или краткие пересказы полнометражных фильмов. Решение может синтезировать музыкальное оформление и закадровый голос, визуализировать аудиоконтент, генерировать цифровых персонажей, стилизовать видео. Решение гибридное — в его основе более 20 open source и коммерческих моделей искусственного интеллекта, дополнительно обученных и скомбинированных командой D.lab, для производства мультимедийного контента. Также в решении применяются технологии компьютерного зрения, синтеза и распознавания речи.
Ключевые преимущества решения D.lab – экономия времени профессионалов, повышение скорости выполнения рутинных задач и снижение затрат на производство. Например, вместо ручной отрисовки различных фонов, персонажей или деталей можно выбирать из предложенных нейросетями вариантов, созданных на основе специальных запросов-промптов. Участие человека требуется только при постановке задачи, внесении стилистических правок и контроле результатов.
Эдуард Маас, руководитель D.lab:
«Мы работаем в постоянном контакте с профессионалами медиа, поскольку наше решение в первую очередь для них. У нас не нейромосфильм и нейроголливуд. Их и не может быть. У нас – набор решений-помощников для профессионального продакшена. Этот набор уже на текущем этапе позволил втрое сократить стоимость отдельных производственных процессов и выполнять их за часы и дни, а не за месяцы и годы. У нас нейросети уже более чем на 80% участвуют в создании самого разнообразного контента новых форматов. И нет задачи, чтобы на 100% вкалывали роботы».
На RUTUBE-канале D.lab (https://rutube.ru/channel/32312793/) представлены первые примеры AIGC-работ: анимационные пересказы «Слова о полку Игореве» и рассказа Айзека Азимова «Лжец!» из знаменитого цикла «Я, робот», видеопересказы киноклассики – «Метрополиса» Фрица Ланга и «Броненосца Потемкина» Сергея Эйзенштейна, а также образец анимационной стилизации видео.
Как работает решение D.lab:
В цикле создания анимационных пересказов литературных произведений от D.lab https://rutube.ru/video/47c417dec36971ab169f6c06619b3269/ в среднем 7 этапов:
- анализ исходного текста LLM-моделями
- написание сценария LLM-моделями
- формирование стилевой концепции моделями Text-to-Image
- черновая раскадровка ролика с текстовым описанием LLM-моделями
- генерация сцен и персонажей моделями Text-to-Image
- добавление анимации (при необходимости с участием человека)
- озвучание моделями Text-to-Speech
В «Лжеце!» качество нейросинтезированного озвучания не устроило команду D.lab, и было принято решение использовать классический вариант с настоящим человеческим голосом. На подготовку таких видеороликов по книгам сейчас уходит около двух недель.
В видеопересказах полнометражных фильмов https://rutube.ru/video/e5298d0cbc2f1a1b7054b20e620c5b39/ решением D.lab выполнено 6 видов работ:
- анализ фильма ансамблем нейросетей
- обработка полученных результатов LLM-моделями
- написание сценария видеоролика LLM-моделями
- выделение ключевых монтажных точек ансамблем нейросетей
- монтаж видеоролика
- озвучание моделями Text-to-Speech
Решение D.lab по стилизации https://rutube.ru/video/2112f93593542fd9325e511f85432102/ позволяет оперативно «переодевать» любое видео, например, превращать фильм в мультфильм. Решение двухшаговое:
– текстовое описание стилистики моделями Text-to-Image
– накладывание стилистики на исходное видео моделями Image-to-Image.
Как будут проходить тесты на Детском радио, в RUTUBE, PREMIER и Yappy:
Субхолдинг ГПМ Радио заинтересовали анимированные пересказы, и было принято решение протестировать нейропродакшен D.lab в визуализации контента единственной в России станции для юных слушателей – Детского радио. Уже готовится визуализация популярного аудиоподкаста. Первые результаты будут представлены завтра на Национальном рекламном форуме.
Команда RUTUBE тестирует возможности решения D.lab в создании коротких видео из своих оригинальных шоу. Параллельно платформа анализирует возможности AIGC сразу в нескольких направлениях – интеграция в новые выпуски текущих проектов, разработка премьерных шоу, построенных на нейроконтенте, использование такого материала в трансляциях спортивных и культурных событий, визуализация аудиоконтента, перемонтирование контента в разные форматы.
Онлайн-кинотеатр PREMIER выбрал для тестирования стилизацию видео. Трейлер одного из топовых сериалов сервиса будет представлен в непривычном виде.
В Yappy также выбрали стилизацию как наиболее подходящий и оперативный инструмент для обработки текущего контента. Команда платформы хочет использовать решение D.lab для повышения качества исходного видео (свет, стабилизация, фокусировка и т. п.).