Всего в почтовом сервисе реализовано около 50 моделей машинного обучения
Почта Mail.ru ежедневно обрабатывает 600 миллионов писем и каждое из них проходит путь минимум из 10 ML-моделей, которые помогают защитить пользователя от фишинга, спама, разобрать письма по папкам и многое другое. Всего в почтовом сервисе функционирует около 50 моделей машинного обучения.
ML-модели Авторегистраций
Первая ML-модель была разработана в 2009 году в качестве инструмента для борьбы с ботами и спамерами в Почте. Сегодня усовершенствованная ML-система Авторегистраций блокирует около 130 000 подозрительных регистраций в день. При этом система определения взломов анализирует аккаунт в течение нескольких секунд после получения сигнала об угрозе.
ML-модели Антиспама
Системы Антиспама детектируют около 100 миллионов писем со спамом в сутки. На данный момент насчитывается 10 верхнеуровневых моделей для проверки писем на предмет спама. Сегодня ML-модели защищают пользователя от вредоносного контента, к которому относится: мошенничество, фишинг, кибератаки, призыв к заработку, помощь несуществующему родственнику и др. Алгоритмы машинного обучения анализируют текст и метаданные писем, а затем выявляют подозрительные схемы и защищают пользователей от возможных угроз.
ML-модели Категоризации
На протяжении многих лет Почта Mail.ru разрабатывала технологии для улучшения пользовательского интерфейса, уделяя в последнее десятилетие особое внимание ML. Умные системы почтового сервиса помогают наводить порядок в почтовом ящике: сортируют письма по папкам, помечают важные письма знаком «молния», предлагают отписаться от рассылок. Ежедневно пользователи получают 300 миллионов писем в папку «Рассылки», до 200 миллионов в папку «Входящие» и до 15 миллионов в папку «Чеки». Также Почта напоминает о 2,5 миллионах важных событий из Календаря. Около 2,3 млн пользователей начинают разбор ящика именно с важных писем.
Внедрение ML-моделей позволяет расширять возможности Почты, защищать данные пользователей, структурировать массив входящих писем, а также формировать новые продуктовые сценарии