По сообщению Минцифры России, начинается разработка ГосДата.хаба – национального озера данных, которое систематизирует хранение и обработку данных для государственных аналитических сервисов, упростит подготовку отчетов госорганам и бюджетным организациям благодаря автоматизированному формированию документов по заданным алгоритмам. Все собранные данные будут попадать в озеро в обезличенном виде, их деперсонализация будет происходить на стороне поставщика данных.

Как поясняют в Минцифры, ГосДата.хаб объединит обезличенные данные органов власти всех уровней и позволит формировать расширенную аналитику. В первую очередь будут запущены сервисы аналитики для ИТ и связи. Государство будет мотивировать бизнес предоставлять обезличенные данные по отдельным направлениям, критически важным для системы госуправления.

Первоначально наборы данных, собранные в ГосДата.хабе, будут доступны для госорганов, но в перспективе обезличенные данные этих датасетов сможет использовать бизнес для развития собственных решений. Для этого будет создан датамаркет – один из публичных контуров Национальной системы управления данными (НСУД).

Проект будет развиваться в трех ключевых направлениях:

  • переход от разрозненной отчетности государственных ведомств к автоматизированной интегрированной системе сбора обезличенных данных из ГИС;
  • создание дата-сервисов и использование государственных данных для анализа состояния отраслей экономики и социальной сферы;
  • предоставление обезличенных государственных данных бизнесу и гражданам, в первую очередь разработчикам решений на основе ИИ.

Основной площадкой реализации национального озера данных будет ФГАУ НИИ «Восход». Как комментируют в НИИ «Восход», в рамках развития аналитических сервисов единой информационной платформы Национальной системы управления данными будут сформированы бизнес-процессы по подключению поставщиков данных к аналитическому хранилищу, организован полный цикл сбора, обработки, нормализации данных и их использования для решения прикладных бизнес-задач. Кроме того, в рамках проекта запланировано развитие компетенций обработки больших данных внутри государственного сектора, а также методологическая поддержка разработки показателей и метрик на основе данных.

Реализация проекта намечена на 2022–2024 гг., в опытную эксплуатацию система должна быть запущена в 2023 г.