11 февраля 2020 года состоялся онлайн пресс-брифинг с доктором Марком Фернандезом, научным руководителем проекта Spaceborne-2, посвященный последним новостям космоса – запуску суперкомпьютера HPE Spaceborne-2 на орбиту и его предстоящей миссии на Международной Космической Станции (МКС).
В ходе брифинга доктор Марк Фернандез подробно рассказал о запуске Spaceborne-2, кейсах его использования на МКС, специфике работы высокопроизводительных систем и ПО в рамках космических путешествий на Луну, Марс и другие планеты. Предполагается, что новый суперкомпьютер позволит астронавтам максимально сократить время задержки передачи данных с Земли на космическую станцию и обратно, Spaceborne-2 также соберет необходимые данные для таких космических проектов, как анализ фотографий со спутника в режиме реального времени с помощью искусственного интеллекта.
Суперкомпьютер для NASA Ames
Марк Фернандез, специализирующийся в США на больших комплексных решениях в государственной и коммерческой сфере, начал с рассказа о предыдущей запуску Spaceborne-2 миссии, с которой и началось сотрудничество HPE и NASA.
Если быть точным, то заказчиком выступил NASA Ames – космический комплекс Ames Research Center (ARC). Исследовательский центр Эймса – отделение правительственного агентства NASA, расположенное на территории аэропорта Моффет-Филда, недалеко от Маунтин-Вью (Калифорния). Центр назван в честь профессора физики Джозефа Эймса, сооснователя и председателя (1919-1939) комитета NASA. Как отметил доктор Фернандез, NASA Ames уже использовал ранее высокопроизводительные системы SGI от HPE, так что это не было первым знакомством NASA с корпорацией HP.
NASA хотела получить суперкомпьютер для орбитальной космической станции с дальним прицелом – не только для текущих исследований, но и для планируемой экспедиции на Луну и, в более отдаленной перспективе, для межпланетной станции на Марсе.
Подготовка к полету на Марс
Собственно говоря, подготовка к новой лунной миссии NASA началась в 2014 году. Не секрет, что многие вычисления, необходимые для исследовательских проектов в космосе, все еще приходится делать на Земле – ввиду ограниченности вычислительных ресурсов, имеющихся на орбите планеты. Передача данных на землю происходит с задержкой, и если для проектов на низкой околоземной орбите она не так критична, то с отдалением от Земли и приближением к Марсу задержка будет расти до критических размеров. Поэтому, при исследовании Марса, данным понадобится около 24 минут, чтобы достичь Земли, и еще столько же времени уйдет на то, чтобы космонавты получили ответ. Все это сделает исследования на поверхности планеты сложными и потенциально небезопасными.
В связи с этим Марк Фернандез вспомнил о фильме «Марсианин», режиссера Ридли Скотта с Мэттом Деймоном в главной роли, и не смог удержаться от того, чтобы не посмеяться над наивным показом в кино связи Земли с Марсом, объяснив, насколько далеко кинематограф отстоит от реалий сегодняшнего дня.
В свое время, высадка на Луну, которую американцы осуществили 50 лет назад, оказалась под угрозой из-за компьютерной ошибки, возникшей за 8 минут до посадки. Бортовому компьютеру тогда просто не хватило вычислительных мощностей, чтобы обработать все входящие данные. Конечно, современные смартфоны, да и, впрочем, калькуляторы или стиральные машины, уже обладают значительно более мощными вычислительными ресурсами, чем те ЭВМ, которыми располагало NASA в 1960-х. Однако и потребности в высокопроизводительных компьютерах с того времени значительно выросли.
Стратегия NASA по полету на Марс предусматривает, что космонавты должны полагаться в первую очередь на себя. Исключительно важно, чтобы компьютеры могли справляться с неожиданными вводными, новыми массивами данных и продолжать делать подсчеты без передачи их на Землю. Для этого им понадобится комплексный анализ данных, который будет охватывать все доступные источники и позволит делать выводы в режиме реального времени, откуда бы данные не поступали: от камер, сенсоров, навигационных систем или с базы со всеми погодными данными, когда-либо собранными на Марсе.
Итак, данные будут поступать из разнообразных источников, сенсоры в носимых устройствах будут постоянно собирать и обрабатывать биометрическую информацию, чтобы отслеживать малейшие колебания пульса астронавтов и массу других показателей. Камеры смогут анализировать выражения лиц астронавтов, чтобы отслеживать агрессию или уровень стресса. Навигационные данные будут поступать в бортовой компьютер, которому нужно будет постоянно адаптировать курс и, кроме того, отслеживать состояние оборудования и необходимость ремонта. Так что мощные вычислительные ресурсы будут критично важными не только для автоматизации рутинных заданий, создания симуляций и работы с искусственным интеллектом, но и для предотвращения катастроф.
Создание суперкомпьютера для запуска ракеты в космос. Технологии Spaceborne-1
Получив заказ от NASA Ames, HPE поставила перед разработчиками суперкомпьютера для космоса следующие три первоочередные задачи.
1) Протестировать имеющиеся у компании коммерческие серверы на совместимость с теми перегрузками, которые испытывает оборудование при старте ракеты-носителя.
2) Убедиться в том, что астронавты смогут самостоятельно произвести инсталляцию серверного оборудования на станции. Как пошутил Марк Фернандез «астронавты не обязаны быть сисадминами».
3) Упаковать космический компьютер в корпус, который будет совместим с техническими блоками космической станции, ее системой питания и пр.
Spaceborne-1 отправился на орбиту в 2017 году. Целью эксперимента были первые в истории испытания коммерчески доступной высокопроизводительной системы в космосе, способной функционировать без перебоев в непростых условиях в течение года, то есть, немного дольше, чем займет планируемый полет на Марс.
Понятно, что инженерам HPE пришлось повысить устойчивость технологий перед внешними факторами. Компьютер Spaceborne-1 был основан не на космических технологиях, а на системах класса HPE Apollo 40 c высокоскоростной коммутационной сетью, и работал на базе Linux. Хотя аппаратные компоненты системы не модифицировались, компания спроектировала уникальный контейнер с водяным охлаждением, а также разработала специальное системное ПО с учетом ограничений внешней среды и повышенных требований к надежности вычислений.
Угроз в космосе достаточно: радиация, солнечные вспышки, субатомные частицы, микрометеориты, нестабильность электроснабжения и охлаждения. Физическое укрепление требует времени и средств, а также добавляет веса. К моменту запуска компьютеры успевают устареть на несколько поколений, к тому же отправляются в космос после нескольких лет использования. Поэтому инженеры HPE в своих космических разработках пошли другим путем – защита с помощью системного ПО, которое будет управлять отладкой систем компьютера в режиме реального времени, а также сглаживать последствия ошибок, вызванных внешними условиями.
Даже без дополнительного укрепления Spaceborne-1 успешно прошел 146 сертификаций и испытаний на безопасность, и NASA допустило его к использованию в космосе.
Суперкомпьютер Spaceborne-1 состоял из двух серверов HPE Apollo 40, объединенных сетью InfiniBand со скоростью 56 Гбит/с, причем, каждый вычислительный узел содержал по четыре ускорителя NVIDIA Tesla P100. Это позволило довести мощность Spaceborne-1 до 1 Тфлопс – рекордное значение для космической станции.
Усовершенствование космических разработок HPE Spaceborne-2
После удачных испытаний Spaceborne-1 агентство NASA снова обратилась к HPE, заявив о том, что им необходимо удвоить компьютерные мощности на космической станции. И хотя пространство внутри космической станции считается «бесценным», для этого нового суперкомпьютера выделили два рэка (телекоммуникационных стойки) и дополнительное питание. NASA также потребовало увеличить продолжительность работы оборудования в полностью автономном режиме до 3-х лет, подразумевая, что примерно столько времени может уйти на марсианскую миссию.
Сказано – сделано. Как выглядит система Spaceborne-2, можно увидеть на картинке – это два полностью одинаковых рэка, стоящих друг на друге. Каждый из двух стандартных модулей Spaceborne-2 включает в себя два сервера со следующими характеристиками:
l × HPE Edgeline EL4000 Converged Edge system (односокетный узел с графическим процессором)
- 1 × x86 процессор с низким потреблением мощности
- 1 × GPU с низким потреблением мощности
- 64 GB оперативной памяти
- 4 × 240GB SSD
- 1 × 10Gb Ethernet
l × HPE ProLiant DL360 Gen10 (стандартный двухсокетный узел HPC Compute)
- 2 × x86 процессора Intel Xeon Cascade Lake
- 192 GB оперативной памяти
- 10 × 240GB SSD
- 1 × 10Gb Ethernet
Программное обеспечение: Red Hat 7.8 OS, NASA TReK 5.2.2. Питание от сети 28Vdc.
Таким образом, две стойки будут следить за состоянием и себя, и соседа. Все данные дублируются между стойками, а SSD будут программно и аппаратно объединены в RAID-массивы. Для общения между собой серверы будут использовать 10GbE-сеть. Питание систем будет осуществляться от двух независимых линий, которые подключены к солнечным батареям и аккумуляторам (предусмотрено ступенчатое динамическое регулирование уровня энергопотребления). Охлаждение у новых систем гибридное – теплообменник в стойке напрямую подключается к водному контуру охлаждения МКС.
Отвечая на вопрос журналиста, почему было принято решение использовать SSD-диски, хотя они, как считается, в большей степени подвержены воздействию космической радиации, Марк Фернандез сказал, стандартные шпиндельные диски не соответствуют сертификации NASA. В это сложно поверить, но вращающиеся механические части шпиндельных дисков, оказывается, создают импульс, который оказывает влияние на космический корабль. Поэтому SSD-диски оказались для МКС безопаснее.
Использование космического компьютера на МКС
Что же касается возможностей применения нового суперкомпьютера, то они достаточно широкие. Станция МКС успела обзавестись многочисленными приборами и датчиками, соответственно, объемы получаемых данных возросли. До сих пор приходилось их для первичной обработки передавать на Землю, что негативно сказывалось на времени проведения исследований.
Spaceborne-2, располагая мощностью свыше 2 Тфлопс, сможет осуществлять первичную обработку данных в кратчайшие сроки, а в некоторых случаях его мощности хватит и для проведения исследований без задействования наземных вычислительных массивов. Среди названных HPE сценариев использования Spaceborne-2 можно отметить следующие: отслеживание наземного трафика из космоса с целью выявления его тенденций, оценка загрязнений атмосферы Земли, отслеживание воздушного и космического трафика в реальном времени.
Spaceborne-2 примет участие и в обеспечении здоровья астронавтов, работающих на станции: мощностей новой платформы хватит на постоянное отслеживание показателей их здоровья, включая рентгеновские снимки и сонограммы. Это позволит ставить диагноз в кратчайшие сроки и, тем самым, минимизировать ущерб от возможного заболевания, а может быть, и спасти жизнь заболевшего астронавта.
Суперкомпьютер будет работать не только в одиночку: Microsoft Azure Space обеспечит двухстороннюю связь Spaceborne-2 с наземными вычислительными комплексами, что позволит использовать ее ученым по всему миру. Среди названных Microsoft Research исследований отметим возможность моделирования и предсказания пылевых штормов на Земле, что поможет лучше понять аналогичные процессы на Марсе, оценку затрат воды при выращивании растений в условиях невесомости, а также исследование грозовых паттернов, приводящих к масштабным лесным пожарам.