В Переславле-Залесском прошел 13-й Национальный суперкомпьютерный форум, организованный АНО «Национальный суперкомпьютерный форум», Институтом программных систем РАН, а также Национальной и Евразийской суперкомпьютерными технологическими платформами.
На мероприятии рассказали, что за прошедший год в списке Top-500 произошли изменения: российский суперкомпьютер MTS GROM покинул рейтинг, в итоге осталось только шесть установок в России. Из них три принадлежат «Яндексу» (Chervonenkis, Galushkin и Lyapunov), две – «Сбербанку» (Christofari Neo и Christofari), а единственный публичный суперкомпьютер – Lomonosov 2 – находится в МГУ. Последний уже более десяти лет входит в Top-500.
Существуют также мощные системы, например «МГУ-270», которые могли бы попасть в рейтинг, но не подавали заявки, т. е. многие суперкомпьютеры остаются непубличными.
Среди мировых изменений в Top-500 стоит отметить новый самый мощный суперкомпьютер El Capitan с производительностью 1742 эксафлопс. Он построен на процессорах AMD и использует уникальный интерконнект от Hewlett Packard Enterprise. Это подтверждает переход суперкомпьютерных технологий от петафлопсной к эксафлопсной эре, требующий радикальных изменений на всех уровнях аппаратного и программного обеспечения для поддержания конкурентоспособности.
Форум прошел в гибридном формате: пленарное заседание состоялось в очном формате, все секционные – в режиме онлайн.
Открыл мероприятие Сергей Абрамов, председатель Оргкомитета, член Российской академии нук.
Алексей Маслов, заведующий лабораторией суперкомпьютерных вычислений факультета вычислительной математики и кибернетики МГУ имени М. В. Ломоносова, поделился своими мыслями о суперкомпьютерном потенциале и его роли в ускорении открытий и инноваций в образовании и науке. Он отметил, что для полного раскрытия этого потенциала необходимо выполнить несколько ключевых шагов.
Во-первых, «создать среду „вызревания“ подготовленных специалистов». Это подразумевает обеспечение их результативности на небольших проектах и обучение культуре командной работы с кодом, моделями и инструментами развертывания на суперкомпьютерном кластере.
Во-вторых, следует «обеспечить творческие научные коллективы специалистами и поддержкой в различных ИТ-областях», что включает в себя обработку данных, использование специализированных хранилищ и баз данных, параллельные вычисления, фреймворки и модели искусственного интеллекта. Поддержка в этих областях позволит научным командам максимально раскрыть свой потенциал в сочетании с суперкомпьютерными вычислительными возможностями, сосредоточившись на передовых открытиях, а не на инструментах их достижения.
В-третьих, важным аспектом является «обеспечение концентрации знаний и вычислений». Это создаст приток умов и энтузиастов, что является необходимым условием для открытий и инноваций. Алексей Маслов подчеркнул, что «концентрация и избыточность» – ключевые факторы успеха.
Наконец, для реализации идей нужна команда увлеченных энтузиастов, которые «все это подготовят и будут предлагать самые удобные среды разработки и вычислений». Они должны обеспечивать разработчиков и инженеров всеми возможными технологиями, накапливать и передавать полученный опыт. Как отметил докладчик, «нас объединяет желание решать сложные задачи и наращивать компетенции».
Доцент кафедры системного анализа и информатики РАНХиГС Сергей Амелькин рассказал о суперкомпьютерах – сложных фрактальных системах (СФС). Эксперт определил СФС как системы, состоящие из множества элементарных объектов, которые можно делить на подсистемы, каждая из которых также является СФС. «Система Y может рассматриваться как объединение конечного числа подсистем более низкого уровня Xi», – отметил спикер.
Сергей Амелькин выделил три ключевых условия для СФС:
фрактальность – системы состоят из большого количества элементарных объектов;
наблюдаемость – состояние СФС определяется вектором запасов ресурсов Q, которыми система обменивает с внешним окружением также рассматриваемым как СФС;
управляемость – управление СФС возможно лишь через усредненные параметры, например, изменение внешних условий или запасов ресурсов.
Среди предметных областей, охватываемых СФС, спикер выделил большие данные, сложные системы и предиктивный анализ. Для их реализации необходимы большие коллективы разработчиков и использование программных систем, таких как имитационное моделирование и нейронные сети.
Важным аспектом обсуждения стали технические решения для минимизации производства энтропии в системах охлаждения суперкомпьютеров. Докладчик указал на необходимость оптимизации байпасных потоков хладагента, которые могут снижать эффективность охлаждения. «Конструктивные решения позволяют распределить потоки хладагента так, чтобы поддерживать минимальную дисперсию температур процессоров», – заключил эксперт.
Сергей Салибекян, кандидат технических наук и доцент МИЭМ НИУ ВШЭ, представил свою работу, посвященную арифметико-логическому устройству (АЛУ), функционирующему в парадигме dataflow. Основная проблема, на решение которой направлена исследование, заключается в вычислительных задачах, реализованных в среде объектно-ориентированного программирования и моделирования.
Среди задач, которые были рассмотрены, Сергей Салибекян выделил алгоритм кластеризации Mean shift, сеточные вычисления по разностной схеме, решение задачи рюкзака методом динамического программирования и перемножение матриц. Эти вычислительные задачи требуют эффективных решений, что и стало отправной точкой для разработки АЛУ.
Эксперт также рассказал о программной реализации АЛУ и потокового менеджера, подчеркнув важность интеграции этих компонентов в среду объектно-ориентированного программирования и моделирования: «Мы реализовали имитационную модель dataflow вычислительной системы для решения вычислительных задач с использованием разработанного АЛУ.
Кроме того, докладчик упомянул о создании компилятора арифметических выражений, который позволит более эффективно обрабатывать данные в рамках предложенной архитектуры.
Представители Юго-Западного государственного университета в Курске Александр Новиков и Эдуард Ватутин представили исследование, посвященное построению нециклических пандиагональных латинских квадратов (ПДЛК) различных порядков. В презентации Александр Новиков отметил, что «одним из редких типов латинских квадратов, представляющих научный интерес, являются так называемые пандиагональные латинские квадраты».
Актуальность исследования заключается в том, что построение ПДЛК с использованием классических алгоритмов часто сталкивается с большими вычислительными сложностями или даже невозможностью получения определенных видов квадратов, таких как полуциклические и нециклические. Таким образом, цель работы Александра Новикова заключается в исследовании и апробации алгоритмов построения нециклических ПДЛК различных порядков.
В рамках своей работы исследователь выделил несколько ключевых задач: исследовать алгоритмы и математические модели построения нециклических ПДЛК различных порядков, выполнить программную реализацию изученных алгоритмов, провести экспериментальное исследование алгоритмов на основе программной реализации.
Александр Новиков отметил, что эксперименты подтвердили корректность исследуемых алгоритмов, а также обозначил пути дальнейшего развития своей разработки, в частности, расчет числовых характеристик полученных коллекций ПДЛК и исследования других методов их построения.
Андрей Амелёнков из Российской академии народного хозяйства и государственной службы при Президенте Российской Федерации совместно с Алексеем Демидовым, младшим научным сотрудником Исследовательского центра искусственного интеллекта РАН, представил доклад на тему «Оптимизация КПД радиатора охлаждения суперкомпьютера путем варьирования скорости потока хладагента».
В докладе подчеркивается, что «максимальная эффективность процессов в макросистемах достигается, когда эти процессы обратимы», что соответствует бесконечно низкой их скорости. При ограниченной интенсивности процессов оптимальный режим работы соответствует минимальной необратимости.
Авторы выделяют три основных вида ресурсов: энергетические, экономические и информационные, которые могут быть объединены в иерархическую макросистемную модель для решения задач энергосбережения в вычислительных потоках. Важно найти термодинамически оптимальный режим работы комплекса для снижения энергопотребления, что требует формулировки критерия оптимальности, учитывающего необратимость термодинамических и информационных процессов.
Расчет производится численным решением задачи нелинейного программирования, где критерием является удельное производство энтропии, а ограничениями – поддержание термодинамического баланса. Энергия, поступающая к вычислительному комплексу, полностью преобразуется в тепло, а мощность пропорциональна затратам энергии, утилизируемой через варьирование потока хладагента.
Задача минимизации отношения производства энтропии к вычислительной мощности также решается численно. Для разработки программного обеспечения использовались архитектурные подходы MVC и MVP, что обеспечило разделение приложения на основные компоненты. Контроль качества программы подтвержден натурными экспериментами с мониторингом температуры хладагента на ключевых точках теплообмена.
Оценка качества результатов применения алгоритмов машинного обучения – тема выступления Виктора Мочалова, представителя Военно-космической академии имени А. Ф. Можайского. Эксперт акцентировал внимание на важности повышения качества обработки материалов космической съемки через обоснованное формирование уточненных исходных данных.
Как отметил Виктор Мочалов, «представлена методика формирования исходных данных для обучения и оценки качества результатов применения алгоритмов машинного обучения». Методика основана на использовании математического аппарата нечеткой кластеризации, который применяется в рамках фрагмента сцены. Это позволяет обеспечить формирование как первичных, так и уточненных значений исходных данных.
Одним из ключевых выводов доклада стало то, что «формирование уточненных значений исходных данных сопровождается контролируемым повышением качества результатов автоматизированной обработки материалов съемки». В приведенном примере качество результатов увеличивается от 4 до 8,5%.
Предложенная методика может быть использована не только для обоснования требований к материалам съемки и алгоритмам машинного обучения, но и для контролируемого управления значениями показателей качества результатов идентификации элементов ландшафта.
Анна Клименко, представитель Института информационных наук и технологий безопасности Российского государственного гуманитарного университета, выступила с докладом о распределении вычислительных ресурсов в геораспределенных гетерогенных динамичных вычислительных средах. Эксперт подробно рассказала о ключевых аспектах, которые влияют на эффективность управления ресурсами.
Во-первых, учет транзитной нагрузки повышает точность получаемых оценок расходуемых ресурсов. Это утверждение подчеркивает важность анализа нагрузки на сети при распределении вычислительных задач, что позволяет более точно прогнозировать потребление ресурсов.
Во-вторых, учет трудоемкости ИПРВР в модели актуален в динамичных средах. Таким образом, в условиях изменяющихся вычислительных ресурсов и задач необходимо адаптировать модели для обеспечения их актуальности и эффективности.
В-третьих, интегральный критерий, учитывающий ресурсоемкость ИПРВР и решения ВЗ, позволяет снизить ресурсные затраты при эксплуатации ГГДВС. Этот вывод демонстрирует, как комплексный подход к оценке ресурсов может привести к значительной экономии и оптимизации процессов в гетерогенных вычислительных средах.
13-й Национальный суперкомпьютерный форум стал важной площадкой для обсуждения актуальных вопросов и тенденций в области суперкомпьютерных технологий. Изменения в списке Top-500 и переход к эксафлопсной эре подчеркивают необходимость постоянного развития и инноваций в этой динамичной отрасли. С учетом того, что в России осталось всего шесть суперкомпьютеров из рейтинга, важно поддерживать интерес к этой сфере, развивать существующие ресурсы и привлекать новые.