Сбер открывает доступ к своей новейшей нейросетевой модели GigaChat. Банк первым из российских техногигантов вступил в соревнование мировых лидеров в области AI и выпустил собственную версию мультимодальной нейросети. На первом этапе модель будет доступна в режиме тестирования по приглашениям.
Мультимодальное взаимодействие
Модель умеет отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и картинки на основе описаний в рамках единого контекста.
В отличие от иностранной нейросети, сервис GigaChat изначально уже поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке.
Нейросетевой ансамбль
Архитектура сервиса GigaChat основана на нейросетевом ансамбле модели NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Благодаря этому новая нейросеть Сбера может решать множество интеллектуальных задач: поддерживать беседу, писать тексты, отвечать на фактологические вопросы.
Включение в ансамбль модели Kandinsky 2.1 даёт нейросети навык создания изображений. Входящую в состав NeONKA ru-GPT 3.5 с 13 млрд параметров планируется выложить в открытый доступ в целях ускорения развития open-source сообщества и технологий в области искусственного интеллекта. Важно, чтобы как можно больше талантливых студентов, учёных и разработчиков могли использовать самые современные технологии в своей работе.
Потенциал модели
Модель уже активно внедряется во многие продукты и сервисы Сбера, которые станут ещё удобнее для клиентов. Виртуальный ассистент Салют – один из первых продуктов, который получит в ближайшее время все возможности новой модели. Первая версия модели NeONKA была оптимизирована по размеру и скорости для применения в высоконагруженных сервисах.
Новая умная нейросеть прекрасно подойдёт для работы представителей СМИ, редакторов, программистов, педагогов, студентов, маркетологов и представителей других профессий. В будущем разработчикам и бизнесу GigaChat также будет доступен для использования через облачное API.
Сейчас модель работает в режиме закрытой бета-версии. Чтобы оказаться в числе первых, кто бесплатно протестирует новую нейросеть, надо вступить в закрытое сообщество в телеграм-канале.
Команды разработчиков
В разработке модели участвуют команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи GigaChat различных предметных знаний, настройки её на корректное исполнение инструкций и точность. Обучение нейросети происходило на суперкомпьютере Christofari Neo.
В GigaChat применяется ряд решений, призванных исключить использование генеративных моделей, противоречащее Кодексу этики в сфере искусственного интеллекта. Команда разработчиков обещает и дальше улучшать возможности умной нейросети и уделять особое внимание вопросам этики и безопасности модели.
Слово президента
«Новая разработка Сбера, которую мы сегодня представили, является прорывной для всей большой вселенной российских технологий. Более того, GigaChat уникален своей открытостью архитектуры, в то время, как мировые аналоги нашей модели придерживаются курса Closed AI. Важно, что GigaChat могут использовать не только массовые пользователи, которые любят экспериментировать с инновациями, но студенты и даже исследователи для серьезных научных работ», – подчеркнул Герман Греф, президент, председатель Правления Сбербанка.