AMD демонстрирует инновации и продукты, ориентированные на рабочие нагрузки, на мероприятии Accelerated Data Center Premiere

Компания AMD (NASDAQ: AMD) провела онлайн-мероприятие Accelerated Data Center Premiere. На нем были представлены новые ускорители AMD Instinct™ серии MI200, самые быстрые в мире ускорители для высокопроизводительных вычислений (HPC) и рабочих нагрузок искусственного интеллекта (ИИ)[i]. Кроме того, на мероприятии прошел предварительный показ инновационных процессоров AMD EPYC™ третьего поколения с AMD 3D V-Cache. AMD также раскрыла новую информацию о своем процессорном ядре следующего поколения «Zen 4» и анонсировала новое процессорное ядро «Zen 4c», оба из которых станут основой будущих серверных процессоров AMD и призваны расширить лидерство компании в области решений для центров обработки данных.

«Мы находимся в мегацикле высокопроизводительных вычислений, который стимулирует спрос на большее количество вычислений для обеспечения работы сервисов и устройств, влияющих на все аспекты нашей повседневной жизни, — сообщила доктор Лиза Су, президент и генеральный директор AMD. — Мы набираем значительные обороты в секторе центров обработки данных благодаря нашей ведущей продуктовой линейке. Среди наших достижений – переход компании Meta на AMD EPYC для питания своей инфраструктуры и создание Frontier, первого в США эксафлопсного суперкомпьютера, который будет работать на базе процессоров EPYC и ускорителей AMD Instinct. Кроме того, сегодня мы объявили о выпуске целого ряда новых продуктов. Процессоры EPYC следующего поколения будут обладать инновациями в дизайне, лидерстве, технологии 3D упаковки и высокопроизводительном производстве 5 нм, чтобы еще больше расширить нашу ведущую позицию в секторе облачных, корпоративных и высокопроизводительных вычислений».

Meta внедряет процессоры EPYC [03:09 — 05:29]

Компания AMD объявила о том, что Meta стала одной из крупных гипермасштабируемых облачных компаний, которые используют процессоры AMD EPYC для питания своих центров обработки данных. AMD и Meta совместно работали над созданием открытого, облачного, односокетного сервера, разработанного для обеспечения производительности и энергоэффективности, на базе процессора EPYC 3-го поколения. Дальнейшие подробности будут обсуждаться на Open Compute Global Summit в конце этой недели.

Передовые технологии упаковки чипов, которые повышают производительность центров обработки данных [05:35 — 18:00]

Компания AMD продемонстрировала использование инновационной технологии 3D-упаковки чиплетов в центрах обработки данных, выпустив первый серверный процессор с использованием высокопроизводительной 3D-упаковки. Процессоры AMD EPYC 3-го поколения с AMD 3D V-Cache под кодовым названием «Milan-X» представляют собой инновационный прогресс в дизайне и упаковке процессоров и обеспечивают повышение средней производительности на 50% в целевых технических вычислительных нагрузках[ii].

  • Процессоры 3-го поколения EPYC с AMD 3D V-Cache будут обладать теми же возможностями и функциями, что и процессоры 3-го поколения EPYC, и будут совместимы с обновлением BIOS, обеспечивая простоту внедрения и повышение производительности.
  • Виртуальные машины Microsoft Azure HPC, оснащенные EPYC 3-го поколения с AMD 3D V-Cache, доступны сегодня в режиме Private Preview, а их широкое распространение начнется в ближайшие недели. Более подробную информацию о производительности и доступности можно найти здесь.
  • Процессоры EPYC 3-го поколения с 3D V-Cache от AMD появятся в 1 квартале 2022 года. Партнеры, включая Cisco, Dell Technologies, Lenovo, HPE и Supermicro, планируют предложить серверные решения с этими процессорами.

Обеспечение производительности эксафлопсного класса для ускоренных вычислений [18:02 — 31:50]

Компания AMD выпустила ускорители серии AMD Instinct MI200. Основанные на архитектуре AMD CDNA™2, ускорители серии MI200 являются самыми передовыми ускорителями в мире и обеспечивают до 4,9 раза более высокую пиковую производительность для рабочих нагрузок HPC и в 1,2 раза более высокую пиковую производительность смешанной точности для подготовки руководящего ИИ, способствуя конвергенции HPC и ИИ[iii][iv].

Используемые в суперкомпьютере Frontier в Национальной лаборатории Ок-Ридж возможности производительности HPC и ИИ в ускорителях AMD Instinct серии MI200 станут ключевым фактором, позволяющим исследователям и ученым ускорить время, затрачиваемое на науку и открытия.

Центр обработки данных на базе «Zen 4», разработанный для лидерства по производительности [31:52 — 36:22]

Компания AMD представила новые подробности о расширении линейки процессоров AMD EPYC следующего поколения под кодовыми названиями «Genoa» и «Bergamo».

  • Ожидается, что «Genoa» станет самым высокопроизводительным в мире процессором для вычислений общего назначения. Он будет иметь до 96 высокопроизводительных ядер «Zen 4», произведенных по оптимизированной 5-нм технологии, и будет поддерживать следующее поколение памяти и технологий ввода-вывода с DDR5 и PCIe® 5. «Genoa» также будет включать поддержку CXL, обеспечивая значительные возможности расширения памяти для приложений центров обработки данных. Производство и запуск «Genoa» запланированы на 2022 год.
  • «Bergamo» — это процессор с большим количеством ядер, созданный специально для облачных приложений. Он оснащен 128 высокопроизводительными ядрами «Zen 4c». Эти ядра программно совместимы с архитектурой «Zen 4» и оптимизированы для создания конфигураций с большим количеством ядер для облачных рабочих нагрузок, которые выигрывают от максимальной плотности потоков. «Bergamo» поставляется со всеми теми же программными средствами и функциями безопасности и совместим по разъемам с «Genoa». Поставки «Bergamo» запланированы на первую половину 2023 года.

Вы можете посмотреть полную запись мероприятия по этой ссылке, а узнать больше обо всех продуктах, о которых говорилось на мероприятии, здесь.

 

[i] MI200-01: Самый быстрый в мире GPU для центров обработки данных — AMD Instinct™ MI250X. Расчеты, проведенные AMD Performance Labs по состоянию на 15 сентября 2021 года для ускорителя AMD Instinct™ MI250X (модуль HBM2e OAM 128 ГБ) при пиковой частоте форсированного двигателя 1700 МГц, показали пиковую теоретическую производительность 95,7 TFLOPS двойной точности (FP64 Matrix), 47,9 TFLOPS двойной точности (FP64), 95. 7 TFLOPS пиковой теоретической одинарной точности (матрица FP32), 47,9 TFLOPS пиковой теоретической одинарной точности (FP32), 383,0 TFLOPS пиковой теоретической половинной точности (FP16) и 383,0 TFLOPS пиковой теоретической точности формата Bfloat16 (BF16) с плавающей запятой. Расчеты, проведенные AMD Performance Labs по состоянию на 18 сентября 2020 года для ускорителя AMD Instinct™ MI100 (карта 32GB HBM2 PCIe®) при пиковой тактовой частоте двигателя boost 1 502 МГц, показали пиковую теоретическую производительность с плавающей запятой 11,54 TFLOPS с двойной точностью (FP64), 46,1 TFLOPS с одинарной точностью (FP32), 23,1 TFLOPS с одинарной точностью (FP32), 184,6 TFLOPS с половинной точностью (FP16). Опубликованные результаты на ускорителе NVidia Ampere A100 (80GB) GPU, тактовая частота boost-двигателя 1410 МГц, привели к 19,5 TFLOPS пиковой производительности тензорных ядер двойной точности (FP64 Tensor Core), 9,7 TFLOPS пиковой производительности двойной точности (FP64). 19,5 TFLOPS пиковой одинарной точности (FP32), 78 TFLOPS пиковой половинной точности (FP16), 312 TFLOPS пиковой половинной точности (FP16 Tensor Flow), 39 TFLOPS пиковой Bfloat 16 (BF16), 312 TFLOPS пиковой Bfloat16 форматной точности (BF16 Tensor Flow), теоретическая производительность с плавающей точкой.  Формат данных TF32 не соответствует стандарту IEEE и не включен в данное сравнение.

 

[ii] MLNX-021R: внутреннее тестирование AMD по состоянию на 27.09.2021 на 2х 64C EPYC 3-го поколения с AMD 3D V-Cache (Milan-X) по сравнению с 2х 64C CPU AMD 3-го поколения EPYC 7763 с использованием кумулятивного среднего значения максимального результата тестирования каждого из следующих бенчмарков: ANSYS® Fluent® 2021.1, ANSYS® CFX® 2021.R2 и Altair Radioss 2021. Результаты могут отличаться.

[iii] MI200-31: По состоянию на 20 октября 2021 года ускорители AMD Instinct™ серии MI200 являются «самыми передовыми серверными ускорителями (GPU) для центров обработки данных», определяемыми как единственные серверные ускорители, использующие передовую 6-нм технологию производства на сервере. AMD на 6 нм для серверных ускорителей AMD Instinct серии MI200. Nvidia на 7 нм для GPU Nvidia Ampere A100. https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth/

 

 

[iv] MI200-02: Расчеты, проведенные AMD Performance Labs по состоянию на 15 сентября 2021 года для ускорителя AMD Instinct™ MI250X (модуль HBM2e OAM объемом 128 ГБ) при пиковой частоте форсированного двигателя 1700 МГц, показали пиковую теоретическую производительность матрицы двойной точности (FP64 Matrix) с плавающей запятой 95,7 TFLOPS. Опубликованные результаты на GPU-ускорителе NVidia Ampere A100 (80 ГБ) позволили получить 19,5 TFLOPS пиковой теоретической производительности с плавающей точкой двойной точности (FP64 Tensor Core). Результаты можно найти по адресу: https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf, страница 15, таблица 1.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Машиностроительные предприятия инвестируют в ПО

Подробнее
Спецпроект

ОСК провела демо-день ИЦК «Судостроение»

Подробнее


Подпишитесь
на нашу рассылку