Компания Huawei анонсировала на конференции Huawei Connect 2019 запуск серии продуктов Atlas. В комплексный портфель Atlas вошли созданные на базе процессоров Ascend 910 и 310 быстродействующий кластер для обучения ИИ Atlas 900, сервер для обучения ИИ Atlas 800, станция для периферийных ИИ-вычислений Atlas 500, плата для формирования логических выводов и обучения ИИ Atlas 300, а также модульный ускоритель ИИ Atlas 200. Портфель охватывает все варианты применения ИИ в облаке, для граничных вычислений и непосредственно на конечных устройствах и предоставляет вычислительные ресурсы для обучения и использования моделей машинного и глубокого обучения.

По заявлению компании, ИИ-кластер Atlas 900, плата Atlas 300 и сервер Atlas 800 – одни из самых высокопроизводительных продуктов в мире. Используя унифицированную архитектуру Da Vinci и единую вычислительную платформу искусственного интеллекта для любых сценариев, серия продуктов Atlas обеспечивает синергию «облако–граница–устройство» для ускорения интеллектуальной трансформации различных отраслей.

Масштабируемый ИИ-кластер Atlas 900 состоит из тысяч процессоров Ascend 910. Он возглавил рейтинг ResNet-50 с показателем продолжительности обработки 59,8 с – на 15% быстрее ближайшего конкурента. Atlas 900 предоставляет достаточную вычислительную мощность для научных исследований, космических программ и нефтегазовой геологоразведки.

Сервер Atlas 800 размером 4U оснащен восемью ИИ-процессорами Ascend 910 (производительность до 2 PFLOPS) при плотности вычислений в 2,5 раза больше, чем у рыночных аналогов. Масса Atlas 800 составляет всего 75 кг. Система воздушного и жидкостного охлаждения отвечает требованиям высокоплотного размещения в корпоративных ЦОД и кластерах. Коэффициент энергоэффективности сервера в 1,8 раза выше, чем у конкурирующих продуктов.

Плата для обучения ИИ Atlas 300 имеет производительность до 256 TFLOPS, позволяя увеличить скорость обработки используемых для обучения изображений с 965 до 1802 в секунду – вдвое выше, чем у самых мощных аналогов. В плате Atlas реализованы сквозные высокоскоростные интерфейсы 100G RoCE для параллельной передачи параметров градиентов и наборов данных, что уменьшает задержки синхронизации до 70% и сокращает время обучения кластера до нескольких секунд.