Процессоры AMD ускоряют производительность лучших суперкомпьютеров по всему миру

В рамках мероприятия Supercomputing Conference 2021 (SC21) компания AMD (NASDAQ: AMD) продемонстрировала увеличивающееся присутствие и растущее преимущество в индустрии высокопроизводительных вычислений (HPC) благодаря исключительным инновациям и внедрению процессоров и ускорителей AMD для центров обработки данных. Клиенты из разных отраслей промышленности продолжают расширять использование процессоров AMD EPYC™ и ускорителей AMD Instinct™ для обеспечения передовых исследований, необходимых для решения некоторых из крупнейших мировых проблем в области климата, биологических наук, медицины и других.

О растущем преимуществе AMD свидетельствует последний список Top500. Сейчас существует 73 суперкомпьютера, работающих на базе AMD. Это в 3+ раза больше по сравнению с прошлым годом, когда в списке присутствовал 21 суперкомпьютер на базе AMD. Кроме того, на AMD работают четыре из десяти самых мощных суперкомпьютеров в мире, а также самый мощный суперкомпьютер в регионе EMEA. Наконец, процессоры AMD EPYC серии 7003, выпущенные восемь месяцев назад, используются в 17 из 75 суперкомпьютеров на базе AMD в этом списке, что демонстрирует быстрое внедрение последнего поколения процессоров EPYC.

«Требования пользователей суперкомпьютеров растут в геометрической прогрессии, поскольку мир стремится ускорить исследования, сокращая время обнаружения ценной информации, — сказал Форрест Норрод, старший вице-президент и генеральный менеджер бизнес-группы центров обработки данных и встраиваемых решений в AMD. — Благодаря процессорам AMD EPYC и ускорителям Instinct мы продолжаем совершенствовать наши продукты, чтобы расширить границы технологий центров обработки данных, позволяющих ускорить исследования, улучшить результаты и оказать большее влияние на мир».

Компания AMD также была отмечена в ежегодном конкурсе HPCwire Readers’ and Editors’ Choice Awards на SC21. Компания получила десять наград, включая «Лучшую инновацию в области устойчивого развития в HPC», «Лучшее серверное решение HPC» и награду «Выдающееся лидерство в HPC», врученную президенту и генеральному директору компании доктору Лизе Су.

Расширяющаяся клиентская база

AMD принимает активное участие в индустрии высокопроизводительных вычислений, чтобы обеспечить производительность и эффективность решений AMD EPYC и AMD Instinct, а также открытой экосистемы ROCm™ для ускорения исследований. Благодаря таким громким проектам, как запуск суперкомпьютера «Frontier» в Ок-Риджской национальной лаборатории, AMD обеспечивает вычислительные технологии и производительность, необходимые для поддержки текущих и будущих исследований по всему миру.

 

Яркие примеры внедрения «Frontier» и других новых систем HPC в отрасли:

Год прорывных продуктов и исследований

В этом году компания AMD выпустила процессоры серии AMD EPYC 7003, самые высокопроизводительные в мире серверные процессоры[i].  С тех пор процессоры активно начали внедрять партнеры, которые делают открытия в области биомедицины, прогнозирования стихийных бедствий, чистой энергетики, полупроводников, микроэлектроники и многого другого.

Расширяя возможности процессоров серии EPYC 7003, компания AMD недавно представила процессоры EPYC 3-го поколения с кэш-памятью AMD 3D V-cache. Благодаря использованию инновационной технологии упаковки, которая послойно распределяет кэш-память L3 в процессорах серии EPYC 7003, технология AMD 3D V-Cache обеспечивает повышенную производительность для технических вычислительных нагрузок, преобладающих в HPC. Виртуальные машины Microsoft Azure HPC, оснащенные EPYC 3-го поколения с AMD 3D V-Cache, в настоящее время доступны в режиме Private Preview и скоро будут доступны во всем мире.

Компания AMD также представила самый быстрый в мире ускоритель для HPC и ИИ — AMD Instinct MI250X. Созданные на базе архитектуры AMD CDNA™ 2, ускорители серии AMD Instinct MI200 обеспечивают до 4,9 раза большую пиковую производительность FP64 по сравнению с конкурентными ускорителями для центров обработки данных, что очень важно для таких приложений HPC, как моделирование погоды[ii]. Ускорители серии AMD Instinct MI200 также являются первыми ускорителями с пропускной способностью памяти более 100 ГБ, обеспечивая скорость до 3,2 терабайт в секунду, что является лучшей совокупной пропускной способностью в отрасли[iii].

 

[i] MLN-016: Результаты по состоянию на 01/28/2021 с использованием SPECrate®2017_int_base. AMD EPYC 7763 с измеренным расчетным результатом 798 выше, чем текущий самый высокий 2P-сервер с AMD EPYC 7H12 с результатом 717, https://spec.org/cpu2017/results/res2020q2/cpu2017-20200525-22554.pdf. Опубликованные производителем результаты для EPYC 3-го поколения могут отличаться.  SPEC®, SPECrate® и SPEC CPU® являются зарегистрированными торговыми марками корпорации Standard Performance Evaluation Corporation. Дополнительную информацию см. на сайте www.spec.org.

[ii] MI200-01: Самый быстрый в мире GPU для центров обработки данных — AMD Instinct™ MI250X. Расчеты, проведенные AMD Performance Labs по состоянию на 15 сентября 2021 года для ускорителя AMD Instinct™ MI250X (модуль HBM2e OAM 128 ГБ) при пиковой частоте форсированного двигателя 1700 МГц, показали пиковую теоретическую производительность 95,7 TFLOPS двойной точности (FP64 Matrix), 47,9 TFLOPS двойной точности (FP64), 95. 7 TFLOPS пиковой теоретической одинарной точности (матрица FP32), 47,9 TFLOPS пиковой теоретической одинарной точности (FP32), 383,0 TFLOPS пиковой теоретической половинной точности (FP16) и 383,0 TFLOPS пиковой теоретической точности формата Bfloat16 (BF16) с плавающей запятой. Расчеты, проведенные AMD Performance Labs по состоянию на 18 сентября 2020 года для ускорителя AMD Instinct™ MI100 (карта 32GB HBM2 PCIe®) при пиковой тактовой частоте двигателя boost 1 502 МГц, показали пиковую теоретическую производительность с плавающей запятой 11,54 TFLOPS с двойной точностью (FP64), 46,1 TFLOPS с одинарной точностью (FP32), 23,1 TFLOPS с одинарной точностью (FP32), 184,6 TFLOPS с половинной точностью (FP16). Опубликованные результаты на ускорителе NVidia Ampere A100 (80GB) GPU, тактовая частота boost-двигателя 1410 МГц, привели к 19,5 TFLOPS пиковой производительности тензорных ядер двойной точности (FP64 Tensor Core), 9,7 TFLOPS пиковой производительности двойной точности (FP64). 19,5 TFLOPS пиковой одинарной точности (FP32), 78 TFLOPS пиковой половинной точности (FP16), 312 TFLOPS пиковой половинной точности (FP16 Tensor Flow), 39 TFLOPS пиковой Bfloat 16 (BF16), 312 TFLOPS пиковой Bfloat16 форматной точности (BF16 Tensor Flow), теоретическая производительность с плавающей точкой.  Формат данных TF32 не соответствует стандарту IEEE и не включен в данное сравнение. https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf, страница 15, таблица 1.

[iii] MI200-07: Расчеты, проведенные AMD Performance Labs по состоянию на 21 сентября 2021 года для ускорителей AMD Instinct™ MI250X и MI250 (128 ГБ HBM2e) OAM, созданных по 6-нм техпроцессу AMD CDNA™ 2 FinFet с пиковой тактовой частотой памяти 1600 МГц, привели к объему памяти HBM2e 128 ГБ и пиковой теоретической производительности пропускной способности памяти 3,2768 TFLOPS. Интерфейс шины памяти MI250/MI250X составляет 4 096 бит на 2 матрицы, скорость передачи данных памяти — 3,20 Гбит/с, что обеспечивает общую пропускную способность памяти 3,2768 ТБ/с ((3,20 Гбит/с*(4 096 бит*2))/8).Самые высокие опубликованные результаты на графическом ускорителе NVidia Ampere A100 (80 ГБ) SXM показали объем памяти HBM2e 80 ГБ и пропускную способность памяти GPU 2,039 ТБ/с.https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/a100/pdf/nvidia-a100-datasheet-us-nvidia-1758950-r4-web.pdf.

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Машиностроительные предприятия инвестируют в ПО

Подробнее
Спецпроект

ОСК провела демо-день ИЦК «Судостроение»

Подробнее


Подпишитесь
на нашу рассылку