Компания Cognitive Pilot, разработчик систем ИИ для беспилотного транспорта (входит в экосистему Сбера), внедрила подход DVSE (Deep Visual Semantic Embeding) для выбора репрезентативных данных из видеопотока при обучении нейронных сетей. Процесс основан на применении ИИ и не требует участия человека.

Чтобы нейронная сеть могла с промышленной точностью распознавать объекты дорожной, полевой или иной среды и обеспечивать безопасность езды в любое время суток, ее необходимо обучить на больших массивах данных, поясняют в компании. Вручную выбирать эти данные из видеопотока длительностью более миллиарда кадров долго и утомительно. Подход DVSE позволяет нейронной сети автоматически выбирать из видеопотока разнообразные и репрезентативные данные, используя метрику сравнения разных кадров. Механизм также позволяет отфильтровывать из видеопотока лишние данные, не влияющие на процесс обучения.

Решение задачи за счет внедрения подхода DVSE позволит экономить десятки человеко-лет при создании автопилотов и заметно упростит процесс разработки в этой области. Если раньше на обработку видеопотока при обучении нейронных сетей и создании датасетов уходили годы, то сегодня достаточно просто нажать кнопку.

Как отмечают в Cognitive Pilot, в отличие от многих игроков рынка ИИ для беспилотного транспорта, которые работают в основном с готовыми данными, публичными датасетами и используют их в приложениях для одного направления (агро, automotive или другого), в Cognitive Pilot накоплена существенная экспертиза по обучению нейронных сетей на собственных датасетах сразу в нескольких сегментах: агро, рельсового транспорта и авто.