В Yandex.Cloud стали доступны Nvidia A100 80GB

Клиенты облачной платформы Yandex.Cloud получили возможность использовать графические процессоры (GPU) Nvidia A100 80G. Производительность GPU NVIDIA A100 в сравнении с предыдущими поколениями увеличена в 2 раза. При этом новый графический процессор обладает самой быстрой в мире пропускной способностью памяти более – 2 ТБ/с, что позволяет работать с крупными моделями и наборами данных. Сейчас в Yandex.Cloud предлагаются конфигурации по 1 и 8 карточек на виртуальную машину. GPU NVIDIA A100 обеспечивают быструю масштабируемость и высокую скорость тренировки моделей искусственного интеллекта и алгоритмов машинного обучения, анализа данных, высокопроизводительных вычислений.

Новое поколение процессоров уже доступно в виртуальных серверах, для разработки и эксплуатации моделей машинного обучения в Yandex DataSphere, при работе с облачными сервисами контейнерной разработки (Managed Service for Kubernetes).

Новый графический процессор применяют для решения бизнес-задач в сфере финансовых услуг, ритейла, добывающей и обрабатывающей промышленности, строительства, фармацевтики и здравоохранения, медиа и многих других. Компании используют вычисления на GPU для прогнозирования спроса, управления заказами, подбора персонала, создания рекомендательных моделей, оптимизации логистики, анализа изображений и текста.

Сегодня решения на GPU NVIDIA A100 в Yandex.Cloud уже используются «М.Видео-Эльдорадо» и VizorLabs. Также новые процессоры доступны участникам программы Yandex.Cloud для науки и образования. GPU NVIDIA A100 используется в суперкомпьютерах Яндекса для улучшения качества поиска, голосового помощника Алисы, рекомендательных и других сервисов экосистемы Яндекса.

 

Дополнительная информация:

Тензорные ядра с поддержкой режима TensorFloat-32 (TF32) обеспечивают самую большую производительность HPC с момента появления GPU. 80 ГБ графической памяти позволяет при работе с A100 сократить процесс моделирования с двойной точностью с 10 часов до менее чем 4 часов. Приложения для высокопроизводительных вычислений также могут использовать TF32 в Nvidia A100 для достижения до 11 раз большей пропускной способности для точных операций. (https://www.nvidia.com/ruru/datacenter/a100/)

 Режим TF32, работающий на тензорных ядрах в графических процессорах A100, может обеспечить 10 кратное ускорение вычислений с плавающей запятой одинарной точности, по сравнению с графическими процессорами Nvidia Volta. Сочетание TF32 со структурированной разреженностью на A100 позволяет увеличить производительность по сравнению с Volta до 20 раз. (https://ru.visual-developers.com/6868385-what-is-the-tensorfloat-32-precision-format)

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Машиностроительные предприятия инвестируют в ПО

Подробнее
Спецпроект

ОСК провела демо-день ИЦК «Судостроение»

Подробнее


Подпишитесь
на нашу рассылку