Компания «Полиматика», разработчик решений для анализа больших объемов данных, представила первую коммерческую версию модуля Polymatica ML, дающего бизнес-пользователям возможность самостоятельно создавать модели машинного обучения и контролировать их жизненный цикл. Разработка ПО велась на грант Российского фонда развития информационных технологий (РФРИТ).

Первая версия Polymatica ML, модуля интеллектуального анализа данных, использующего методы машинного обучения, позволяет пройти весь цикл создания и применения моделей: провести предварительный анализ данных для выявления наиболее значимых показателей для построения будущих моделей, построить несколько моделей с помощью простого конструктора, сравнить их качество и определить лучшую. На следующем этапе пользователь выбирает способ применения модели на основном массиве данных – их несколько в зависимости от решаемой задачи. Для промышленной эксплуатации есть встроенный механизм мониторинга модели, так как со временем ее точность снижается и требуется корректировка.

В числе функций Polymatica ML 1.0:

• Исследование данных – формирование и визуализация выборки из реляционных БД, оценка характеристик выборки по основным статистическим критериям, отбор и преобразование признаков.

• Построение моделей – создание и настройка моделей машинного обучения в графическом интерфейсе, тестирование и оценка качества моделей, настройка гиперпараметров моделей, интерпретация моделей, подключение библиотек Python с алгоритмами машинного обучения.

• Управление моделями – централизованный репозиторий моделей, поддержка их жизненного цикла, экспорт/импорт, публикация моделей: реляционные БД, сервис (REST API), Polymatica Analytics, сравнение моделей из репозитория и выбор лучшей модели.

Как подчеркивают в «Полиматике», разработчики вышли за рамки только создания моделей, нацеливаясь на нишу ModelOps или управления моделями машинного обучения уровне предприятия. Это позволяет хранить все модели в едином репозитории, системно следить за качеством их работы и переиспользовать существующие алгоритмы в новых моделях. В первой версии данный функционал уже доступен, и в компании планируют активно развивать его в ближайшей перспективе.