По сообщению Сбера, промышленная версия нейронной сети ruDALL-E от SberDevices и Sber AI, которая создает изображения на основе текстового описания на русском языке, появилась в доступе на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud. Она содержит 12 млрд параметров и подходит для создания коммерческих материалов: иллюстраций для рекламы, архитектурного и промышленного дизайна, векторных и стоковых изображений.

ruDALL-E – мультимодальная нейросеть, которая генерирует оригинальные изображения по заданному русскоязычному описанию, моделируя совместное распределение текстов и изображений. Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ. Модель существует в двух вариантах, из которых сверхбольшую – ruDALL-E XL с 1,3 млрд параметров – можно использовать бесплатно, загрузив ее код и набор параметров с Github. Гигантская ruDALL-E 12B XXL с 12 млрд параметров доступна в подборке ruGPT-3 & family DataHub ML Space и позволяет создавать неограниченное число новых изображений по заданному описанию с меньшей степенью абстракции и более высокого качества.

Изображение создается в несколько этапов: нейросеть принимает описание на вход и генерирует заданное число картинок, затем другая выбирает максимально подходящие под описание, после чего они увеличиваются в размере без потери качества.