Компании HPE и AMD совместно с Ливерморской национальной лабораторией им. Лоуренса (LLNL) Министерства энергетики США анонсировали El Capitan, будущий суперкомпьютер экзафлопсного класса для LLNL, который будет оснащен процессорами AMD EPYC следующего поколения, видеокартами AMD Radeon Instinct и ПО AMD ROCm для гетерогенных вычислений с открытым исходным кодом.

Новая система обеспечит скорость в 2 эксафлопс, что в 10 раз быстрее самого мощного на сегодняшний день суперкомпьютера. Она будет работать на базе LLNL и использоваться тремя национальными лабораториями NNSA: LLNL, Сандийскими национальными лабораториями и Лос-Аламосской национальной лабораторией. Запуск El Capitan планируется в начале 2023 года.

El Capitan будет оптимизирована под сложное и затратное по времени научно-исследовательское 3D-моделирование для задач NNSA, с которыми современные высокотехнологичные суперкомпьютеры не справляются. Ученые получат возможность пользоваться новыми приложениями с интенсивной работой с данными, такими как моделирование, симуляция, аналитика и ИИ.

Система будет построена на базе процессоров AMD EPYC следующего поколения под кодовым названием Genoa с ядрами Zen 4, которые будут поддерживать подсистемы памяти и ввода-вывода для рабочих нагрузок ИИ и HPC, и графических процессоров AMD Radeon Instinct следующего поколения с новой архитектурой, оптимизированной для вычислений и выполнения рабочих нагрузок, в том числе HPC и ИИ. Эти графические процессоры будут использовать высокоскоростную память следующего поколения и предназначены для оптимальной производительности глубинного обучения.

Суперкомпьютер также использует архитектуру AMD Infinity третьего поколения, которая обеспечит высокоскоростное соединение с низкой задержкой между четырьмя графическими процессорами Radeon Instinct и одним процессором AMD EPYC, включенным в каждую ноду El Capitan. Кроме того, эта архитектура включает в себя унифицированную память для процессора и графического процессора, что упрощает доступ программистов к ускоренным вычислениям. Усовершенствованная версия среды гетерогенного программирования с открытым исходным кодом ROCm разработана для использования объединенной производительности процессоров и графических процессоров AMD. Наконец, принадлежащие HPE технологии Cray Shasta, предназначенные для поддержки работы разнообразных процессоров и ускорителей, призваны обеспечить производительность и масштабируемость нового уровня.

Системы, подобные El Capitan, представляют собой класс эксафлопсных суперкомпьютеров, которые в тысячу раз быстрее систем прошлого поколения петафлопсного класса, впервые представленных 12 лет назад. Новый рекорд производительности в 2 эксафлопса превосходит топ-200 самых быстрых суперкомпьютеров мира вместе взятых и на 30% выше изначальных прогнозов, сделанных семь месяцев назад. Он был достигнут благодаря партнерству между HPE, AMD и Министерством энергетики США, что позволило объединить возможности системы HPE Cray Shasta и интерконнекта Slingshot с возможностями процессоров AMD EPYC и графических процессоров AMD Radeon Instinct. Решение в пользу этой архитектуры было принято на основе стратегических, критически важных требований NNSA.

Созданные совместными усилиями HPE и AMD новые технологии поддерживают рабочие нагрузки высокопроизводительных вычислений и ИИ за счет следующих улучшений:

• оптимизированное взаимодействие между интерконнектом HPE Cray Slingshot и графическими процессорами AMD Radeon Instinct следующего поколения, архитектура которых была оптимизирована для НРС- и ИИ- рабочих нагрузок;

• высокоплотные вычислительные «лезвия» (blades) на базе процессоров следующего поколения AMD EPYC (кодовое название Genoa) с ядрами Zen 4;

• новый подход, использующий вычислительные «лезвия» типа «ускоритель в центре» (accelerator-centric) – с соотношением количества графических процессоров к центральным 4:1 и архитектурой AMD Infinity Architecture третьего поколения, которая обеспечит между ними высокоскоростную связь с низкими задержками. Это позволит повысить производительность для выполнения информационно емких процессов, связанных с ИИ, машинным обучением и аналитикой, благодаря разгрузке центральных процессоров с помощью графических.

Улучшены также возможности системы хранения данных и ПО, интегрированных в архитектуру HPE Cray Shasta. Дополнительное использование локальных флэш-накопителей, специально разработанных для того, чтобы обеспечить необходимую производительность для новых систем, создаст буфер для балансировки работы установленной на плате памяти и многоуровневых систем хранения данных, который будет мониториться интеллектуальным программным решением Cray Shasta. Это позволит автоматизировать перемещение данных в целях оптимизации хранения и своевременного доступа.

HPE также расширяет свое партнерство с LLNL с целью изучить возможности оптических технологий – вычислительного решения, использующего свет для передачи данных, которое будет установлено в El Capitan. Оптические технологии HPE были разработаны в рамках программы PathForward при поддержке Exascale Computing Project Министерства энергетики США. HPE создала и представила оптические прототипы, объединяющие интерфейсы электричество-в-оптику, которые могут быть широко использованы в будущих классах системных интерконнектов.

HPE и LLNL совместно изучают возможности интеграции этих оптических технологий с HPE Cray Slingshot на базе El Capitan для более эффективной передачи большего объема данных. Этот подход направлен на повышение энергоэффективности, надежности и расширение возможностей для увеличения пропускной способности с меньшими затратами.

Новую систему будет эксплуатировать Ливерморская национальная лаборатория им. Э. Лоуренса, разработавшая новые методы, которые позволяют ученым создавать более быстрые и точные модели для решения основных задач, например, в области инерциального управляемого термоядерного синтеза. Исследователи из LLNL будут использовать систему для изучения новых приложений, которые интегрируют искусственный интеллект и машинное обучение в рабочие нагрузки высокопроизводительных вычислений. Они уже применяют решения HPE в области высокопроизводительных вычислений и ИИ для совершения научных открытий в области медицинских и фармакологических исследований.

Помимо El Capitan, HPE создаст для Министерства энергетики еще две эксафлопсные системы, анонсированные в 2019 г.: Aurora и Frontier.