Снизить уровень агрессии

MTS AI совместно со «Сколтехом» создала детоксификатор языка – ИИ-решение, которое распознает токсичные слова и выражения, а затем удаляет их либо заменяет близкой по смыслу, но не оскорбительной лексикой. Это решение позволяет сохранить смысл фразы и снизить градус агрессии в общении. Детоксификатор можно использовать не только в социальных сетях, но и в общении с голосовыми помощниками, чат- и войс-ботами. Разработка MTS AI и “Сколтеха” уникальна для российского рынка, поскольку большинство подобных решений предназначены для английского языка. Для русскоязычных пользователей подобных сервисов практически нет, а разработанные ранее решения оказались неэффективными.

 

«Великий и могучий»

 В рамках совместного проекта «Сколтех» и МТS AI удалось создать ряд технологий для детектирования и переписывания токсичного контента. Предложенные методы и модели могут быть использованы для предотвращения репутационных рисков компании (чат-бот, обученный на текстах из сети, может ответить токсично). Возможны и другие применения. Например, до отправления комментария пользователю может быть предложена менее токсичная формулировка его сообщения. В подобном сценарии использования, свобода выражения не страдает, но количество эмоционально написанных негативных комментариев может быть значительно сокращено.

 MTS AI и «Сколтех» предложили два типа моделей для создания ботов и приложений, которые убирают негативную лексику из речи. Первый подход использует языковую модель BERT, основанную на нейросетевой архитектуре «Трансформер». Модель осуществляет точечное редактирование текста – находит в нем негативные слова и выражения, заменяет их на нейтральные синонимы или вовсе удаляет. Второй подход также основан на архитектуре «Трансформер», однако он решает другую задачу – условную генерацию текста по входному запросу. То есть языковая модель создает нейтральную версию токсичной фразы. Для академического соревнования в рамках конференции «Диалог», была подготовлена модель детоксификации на основе языковой модели ruT5.

 «В результате данного проекта кроме методов, моделей и наборов данных появилось немало научных статей, опубликованных совместным коллективом исследователей, инженеров и студентов из «Сколтеха» и МТС, в том числе на ведущих международных конференциях в области ИИ, таких как ACL и EMNLP», — похвалился своими достижениями старший преподаватель «Сколтеха» и руководитель совместной лаборатории “МТС-Сколтех”, PhD Александр Панченко. Подробнее о методах и моделях, которые были использованы в рамках данного проекта, можно узнать в статье «Методы детоксификации текстов для русского языка», которую можно найти по адресу https://www.mdpi.com/2414-4088/5/9/54.

 

Детоксификация по-русски

 Можно протестировать работу самого детоксификатора с помощью тестового чат-бота в «Телеграм» по адресу https://t.me/rudetoxifierbot. В качестве примера он предлагает сделать следующие замены: «З****** со своим повышением цен» на «Надоели со своим повышением цен» или просто «Отключите этот п******** сервис» на «Отключите этот сервис». Поможет ли эта технология сдержать распространение агрессии в Интернет пока не понятно, но для некоторых компаний это будет хорошим способом избежать преследования за нарушение законодательства о нецензурных словах.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

ОСК провела демо-день ИЦК «Судостроение»

Подробнее
Спецпроект

Медицинские задачи для ИИ

Подробнее


Подпишитесь
на нашу рассылку