Как известно, "…большое видится на расстояньи". Впрочем, применительно к российскому ИТ-рынку это высказывание не очень подходит, поскольку по мировым масштабам он совсем не так уж велик. И все же, чтобы лучше понять этот рынок и перспективы его развития, полезно взглянуть на него издали, в качестве внешнего наблюдателя.

Как представляется автору, сегмент средств документооборота, или, в международной терминологии, Enterprise Content Management (ECM), — один из наиболее интересных на российском рынке корпоративного ПО: быстро растущий, с большим числом игроков (в том числе вновь появляющихся), с ярко выраженной национальной спецификой, любопытными взаимоотношениями между западными и российскими поставщиками, принципиально разными категориями заказчиков (например, коммерческий и государственный сектора) и т. д. Именно через него прокладывают себе дорогу к широкому кругу пользователей новые технологии. Но чтобы понять процессы, происходящие у нас дома, нужно рассматривать их в контексте общемировых событий. Именно эта логика заставила автора в последнем обзоре по теме управления документами сделать акцент на общемировую ситуацию (см. "Бурлящий и стабильный рынок управления документами", «BYTE/Россия» № 4’2007).

И тут как раз можно вспомнить другую поговорку: "лучше один раз увидеть…" Возможность посмотреть на "ту" жизнь живьем представилась нынешней весной, в поездке на крупнейшее ежегодное ECM-мероприятие — AIIMexpo'2007, проходившее в Бостоне (США) с 16 по 19 апреля.

Глядя в зеркало

Есть такой известный исследовательский метод — моделирование. По роду работы автору приходится уже много лет посещать и освещать в ИТ-прессе главное российское ECM-мероприятие — выставку-конференцию Docflow, которая проводится ежегодно в Москве в конце мая. Еще несколько лет назад для очередной статьи по этому поводу было выбрано название "Docflow — зеркало российского рынка документооборота". Так вот, если считать, что AIIMexpo — это "зеркало мирового", то можно, сравнивая отображения, составить представление и о реальных объектах. Не будем проводить здесь прямых сравнений двух мероприятий, но те из читателей, кто бывал на Docflow, могут сделать это самостоятельно.

AIIMеxpo — это независимое отраслевое мероприятие, его организатор — некоммерческая ECM-ассоциация AIIM (см. врезку). Уже много лет оно проводится в паре с другой аналогичной по формату выставкой-конференцией — On Demand (технологии цифровой печати). Они отлично дополняют друг друга, символизируя полный жизненный цикл управления информацией и в то же время олицетворяя деление общей темы на две части: софтверную (AIIM) и аппаратную (On Demand). Хотя, конечно, вторая часть представлена тут не полностью, например, нет оборудования для хранения данных.

Место проведения AIIM 2007 — Конгресс-центр в Бостоне. Надо сказать, что хотя этот город числится в справочниках "миллионником" по населению, на самом деле он очень компактный (от центра города до аэропорта на его окраине ехать не более 15 минут) и какой-то неамериканский по стилю. Но Convention & Exibition Center сделан в традициях страны — огромный, удобный и, что поразительно, незаметный, встроенный в общий городской ландшафт. Никаких проблем с подъездом, парковками и т. п.

[Фото 1]

Вид на Convention & Exibition Center в Бостоне с одной из самых высоких точек города: с 50-го этажа Prudential Center.

Выставка проходит в центральном зале размером в два футбольных поля, состыкованных торцами. Примечательно: по свидетельству старожилов, еще пару лет назад заметно больше половины площади занимало то, что можно отнести к Hard, а сейчас преобладает уже Soft. Примерное число экспонентов: AIIM — 220 (более 80 — новые участники), On Demand — 180 (около 60 новичков). У центрального входа в зал размещаются стенды Canon и Kodak — «платиновых» (главных) спонсоров обоих мероприятий. Слева и сзади них — не уступающие им по размерам стенды других ведущих поставщиков печатающего оборудования: Konica Minolta, OCE, HP, Xerox, Ricoh. Любопытно, что IBM также представлена здесь лишь своим принтерным направлением, но акцент сделан не на оборудовании, а на услугах, в том числе на хостинге высококачественной печати*.


* В начале 2007 г. IBM заключила сделку о продаже своего Printing Systems Division японской компании Ricoh за 725 млн долл. Это уже вторая операция с "отделением" принтерного направления «Голубого гиганта»: первая привела к появлению в 1991 г. компании Lexmark.

[Фото 2]

Центральная часть выставки AIIMExpo.

Правая половина зала отведена под экспозицию AIIM: Microsoft («платиновый» спонсор), EMC, Adobe, Oracle/Stellent. Из числа ECM-лидеров нет IBM и Open Text, но зато в центре зала размещается стенд с другим знакомым названием — Abbyy. Довольно большой экспозицией представлена GALA — Ассоциация глобализации и локализации ECM-решений, которая занимается очень актуальным направлением для рынка управления контентом.

Параллельно идет программа конференций: предварительная программа (практические занятия), небольшая пленарная часть, основная работа по секциям — AIIMexpo в семь потоков и On Demand в четыре потока. Кроме того, ряд компаний (Microsoft, IBM/Filenet, Adobe, Google) проводит собственные секции.

Посещение выставки — свободное, а вот участие в программе конференции — платное и отнюдь не дешевое (но есть различные опции, в том числе скидки для групп). По оценкам организаторов, общее число посетителей, включая представителей компаний-экспонентов, существенно превышает отметку в 10 тыс. человек.

Ассоциация AIIM

Некоммерческая организация AIIM (Association for Information and Image Management, http://www.aiim.org) — признанный международный авторитет в области управления корпоративным содержанием (Enterprise Content Management, ECM), к которой относятся инструменты и технологии поддержки всего жизненного цикла информации в различных организационных процессах.

Ассоциация была образована более 60 лет назад, в 1943 г., как National Microfilm Association — для продвижения технологий микрофильмирования. Позднее круг ее задач расширился, и она стала называться AIIM. Тем не менее сегодня это название снова не в полной мере отражает содержание ее работы. Поэтому название AIIM сохраняется как историческое, но при этом не расшифровывается. В своих официальных документах ассоциация называет себя AIIM — The Enterprise Content Management Association.

Свою миссию AIIM видит в развитии рынка ECM и продвижении передовых идей и технологий, выступая в роли независимого игрока — посредника между всеми его участниками, включая пользователей, вендоров, системных интеграторов и государственные регулирующие органы. Основная форма работы — проведение обучения и консультаций по всему миру (в первую очередь для заказчиков), издание специализированных журналов и руководств.

Центральное место в работе AIIM занимает проведение ежегодной AIIM Expo & Conference (AIIMexpo) — ведущего отраслевого мероприятия, проходящего обычно весной в одном из городов на восточном побережье США. Последние годы AIIMexpo проводится совместно с On Demand Conference & Expo — ведущим событием в области цифровой печати. Продюсером этого совместного мероприятия выступает Questex Media Group.

Что происходит на ECM-рынке

Свое выступление на открытии AIIMexpo президент AIIM Джон Манчини посвятил повышению эффективности применения ECM-технологий заказчиками за счет выработки целенаправленной стратегии в этом направлении. При этом он опирался на сведения, полученные в ходе проведенного в нынешнем марте общемирового исследования (свыше 1200 опрошенных пользователей из более чем 50 стран). Эти данные позволяют выделить среди организаций четыре основные категории по уровню зрелости применения ECM:

  • ECM отсутствует (еще не занимались реализацией ECM-проектов) — 21%;
  • тактическое ECM (выполнение отдельных ECM-проектов на уровне подразделений) — 29%; промежуточное ECM (интеграция ECM-проектов разных подразделений) — 19%;
  • стратегическое ECM (развернутые решения масштаба предприятия) — 31%.

По критериям AIIM получилось, что последняя группа превосходит первую по эффективности управления электронной информацией в пять раз, а самое главное — отчетливо прослеживалась закономерность улучшения деловых показателей компаний по мере повышения уровня их ECM-зрелости.

Еще интереснее оценка наиболее важных аспектов применения ECM на ближайшие год-полтора. Так, по мнению большинства опрошенных, главной задачей будет повышение эффективности управления электронной почтой (57%), далее идут вопросы соответствия требованиям регулирующих органов (37%) и обеспечения непрерывности бизнеса и управления рисками (36%).

Целую серию материалов и докладов** представила традиционный участник и спонсор мероприятия исследовательская компания InfoTrends (http://www.infotrends.com). В частности, по оценкам ее экспертов, основной объем затрат (до 45%), связанных с использованием ECM-систем, приходится на решение задач, определяемых английским термином capture (захват, фиксация). Довольно часто его трактуют как ввод в систему документов с твердых носителей (бумага, микрофильмы и т. п.) и накопление их в электронном виде. Но фактически сегодня под этим уже понимается более широкий спектр методов поступления информации из внешних источников в ИТ-систему предприятия. Важность разных каналов поступления новой информации в глазах заказчиков (по данным InfoTrends) иллюстрирует рис. 1.

Рис. 1. Как заказчики оценивают важность различных каналов поступления новой информации (источник: Infotrends, 2006).


** С ними можно ознакомиться на сайте компании в разделе Download.

Конечно, все хотели бы использовать максимально структурированные варианты документов, в том числе на базе XML, но в реальности приходится иметь дело с очень широким спектром форматов данных, среди которых превалирует неструктурированный текст (рис. 2).

Рис. 2. Распределение корпоративных документов в ECM-системах заказчиков по типу (источник: Infotrends, 2006).

В одном из докладов InfoTrends прозвучала любопытная идея ввести новую оценку эффективности использования ИТ: вместо широко применяемого ныне показателя TCO (Total Cost of Ownership, общая стоимость владения) был предложен новый — TVO (Total Value to an Organization, добавленная стоимость для организации). По мнению InfoTrends, эта величина должна учитывать улучшение реализации бизнес-процессов компании за счет внедрения новых технологий. Как идея, конечно, это привлекательно, но не очень понятно, как на практике рассчитывать подобные оценки, учитывая, что и с TCO дело обстоит совсем не просто.

Но при всем обилии конкретных данных в различных докладах исследовательских групп наибольшее впечатление произвело пленарное выступление вице-президента подразделения Microsoft Office Business Platform Джеффа Тепера с красноречивым названием: "От бизнес-аналитики к блогам, от Workflow к Wiki: ускорение через доверие". Суть его кратко можно изложить так: мы стали свидетелями появления качественно новых средств коммуникации, которые обеспечивают участие в формировании Интернет-контента не только профессионалов, но и самой широкой общественности; вопрос сегодня заключается в том, как применить эти возможности в корпоративной среде. Как, в частности, разрешить возникающие при этом противоречия между поддержкой "управляемости" бизнес-процессов и использованием персональной активности сотрудников? Как в расширяющемся и слабо регулируемом потоке информации от широких масс отделить "зерна от плевел" для их использования в решении задач повышения эффективности бизнеса?

Что такое ECM

Понятие Enterprise Content Management (ECM) объединяет технологии обработки неструктурированной информации, связанной с реализацией тех или иных организационных процессов. Впрочем, это определение требует некоторого уточнения.

Под неструктурированной информацией подразумеваются документы, а также более общее понятие — содержание, контент (в частности, это может быть информационное наполнение Интернет-сайтов или других хранилищ данных). В качестве отдельной категории выделяются "записи" (records) — сведения, которые должны храниться в неизменном виде. На русский это иногда переводится как "архивные данные", но, по-видимому, это не совсем верно, так как архив ассоциируется с чем-то большим и малоиспользуемым, а записи могут применяться в работе организации постоянно, но в режиме "только для чтения". Хотя ECM традиционно связывают с обработкой неструктурированной информации, в последние годы как отдельное его направление активно развивается работа с формами, которые относятся к категории полуструктурированных документов.

Вот как раскрывается понятие "обработка информации": это ввод (capture), управление, хранение, обеспечение целостности (preserve) и доставка. Особое внимание нужно обратить на термин capture (захват, фиксация), поскольку в русской профессиональной терминологии нет краткого адекватного его перевода. Речь идет о совокупности различных методов поступления информации из внешних источников в информационную систему предприятия, в том числе таких, как ввод вручную, автоматизированное преобразование данных из бумажных носителей в электронный вид (включая оцифровку), преобразование форматов документов. Очень актуальную проблему представляет собой автоматизация потокового ввода.

Наверное, приведенное выше пояснение термина "обработка" неполно. Возможно, здесь же нужно выделить еще два важных элемента: создание содержания (в том числе в режиме групповой работы) в ходе реализации бизнес-процессов или проектов и управление знаниями (включая сюда и поисковые задачи).

От документооборота к ECM

Одна из тем ИТ-дискуссий середины 90-х годов в нашей стране была связана с правомерностью использования термина "документооборот" для обозначения задачи автоматизации… ну, в общем, документооборота. Одним из доводов противников этого слова было то, что оно не имеет адекватного перевода на английский язык и потому может возникнуть путаница в понятиях. В результате пришли к согласию, решив, что "документооборот" и "управление документами" можно считать синонимами.

На самом деле эти дискуссии были связаны не с терминологическими проблемами, а с попытками ответить на ряд принципиальных вопросов: что же мы на самом деле автоматизируем (в рамках этого самого документооборота), как соотносится наш отечественный уровень автоматизации с мировым, в каких направлениях будет расширяться круг задач автоматизации документооборота? А за теоретическими рассуждениями скрывались и чисто практические вопросы, например, для ИТ-компаний: заниматься разработкой своих программных продуктов или продвижением западных технологий? Соответственно для заказчиков вопрос стоял так: на применение каких средств им ориентироваться, отечественных или зарубежных?

Все эти проблемы сохраняют актуальность и сегодня. Сравнивая же в самых общих чертах российский и американский рынки, можно констатировать, что мы с нашим "документооборотом" находимся еще в самом начале пути освоения огромного круга задач, определяемого западным понятием ECM.

Этот тезис, конечно, нуждается в более детальном обсуждении, поэтому попробуем проиллюстрировать его на простом примере автоматизации информационных задач здравоохранения с учетом сегодняшнего состояния дел и того, что хотелось бы иметь (и что технически вполне реализуемо). В настоящее время автоматизация в здравоохранении затронула лишь довольно узкий круг учреждений и узкий круг задач в них: управление регистрационными карточками пациентов, управление аптекой и т. п. А ведь, как известно, основу системы здравоохранения составляет достаточно тривиальное накопление информации о пациентах и опыте их лечения (ведение истории болезни), а также — что уже не столь просто — доставка персональной информации (которая разбросана по разным учреждениям) в любой момент и в любой пункт, где она необходима (с учетом прав доступа), и распространение обобщенного опыта лечения — управление медицинскими знаниями. Вспомним и о том, что врач при приеме посетителя менее 20% времени тратит собственно на осмотр, а остальное — на изучение предыдущих записей и ввод новых сведений.

Если кратко попробовать охарактеризовать различия нашего и западного ECM-рынков, стоило бы выделить следующие моменты.

Во-первых, в России мы в целом только сейчас переходим от решения задач учета документов к собственно автоматизированной работе с документами. Широкое использование термина "электронный документооборот" не должно никого вводить в заблуждение: в видимой перспективе в общем случае будет преобладать смешанный вариант — системы с использованием традиционных бумажных и электронных носителей информации.

Во-вторых, на Западе гораздо сильнее озабочены вопросами стандартизации в области ECM. Очень важную роль играет государственное регулирование: частые ссылки на законы, такие, как акт Сарбэйнса — Оксли или HIPAA — это совсем не для красного словца. И вообще проблема "соответствия" (compliance) в различном его понимании (с точки зрения заказчиков, стандартов, законов) — это одно из ключевых положений ECM. В то же время важно отметить, что регулирующие органы не занимаются мелочной опекой ИТ-отрасли, а именно в целом определяют требования со стороны общества.

И наконец, в круг задач ECM в мире уже давно вошли вопросы управления не только Web-контентом, но электронной почтой.

В этой ситуации можно прогнозировать, что в нашей стране в видимой перспективе сложится ситуация, когда спрос на реализацию ECM-проектов будет опережать предложение и сохранится возможность относительно мирного сосуществования большого числа игроков (а также появления новых). Интересы зарубежных и российских поставщиков будут пересекаться в разумных границах, но все же доля присутствия "заграницы" будет быстро повышаться.

Abbyy на AIIMexpo

Компания Abbyy (http://www.abbyy.ru) принимает участие в AIIMexpo уже много лет, оставаясь единственным представителем российских разработчиков на этой выставке. Уже само расположение стенда компании в центре зала, рядом с ведущими ECM-поставщиками, подчеркивало ее достойные позиции на этом рынке. Технологии и торговая марка Abbyy хорошо знакомы не только ИТ-профессионалам, но и обычным пользователям, и компания уже давно позиционируется как мировой лидер в области технологий распознавания, потокового ввода данных и лингвистики. В официальных материалах выставки в кратком представлении фирмы подчеркивалось, что ее технологии во встроенном варианте используются во многих решениях других поставщиков ПО и оборудования.

На AIIMexpo Abbyy представила новую версию системы потокового ввода данных FlexiCapture 8.0 Professional, универсального решения для массового ввода и обработки счетов-фактур, накладных, резюме, договоров и других распространенных типов бумажных документов. Особенность этого продукта — возможность обрабатывать разные типы документов в едином потоке, без предварительной ручной сортировки и не набирая данные вручную. Главное новшество версии 8.0 — возможность извлекать данные из многостраничных таблиц в сложных документах.

В качестве примера использования технологии можно привести оформление кредита. Обычно клиент банка, подавая заявление, заполняет еще несколько формуляров, а также предоставляет копию паспорта, копии документов о движимом и недвижимом имуществе. Подобные пакеты разнородных документов Abbyy FlexiCapture обрабатывает автоматически. Классификация документов и извлечение данных реализованы на основе новой технологии интеллектуального распознавания документов. Кроме того, в процессе обработки задействованы технологии Abbyy для распознавания печатного текста, рукописного текста, штрихкодов, а также меток и галочек, которые часто присутствуют в бланках и формулярах.

Востребованность и применимость технологии Abbyy FlexiCapture была продемонстрирована на прошедшей в рамках AIIMexpo традиционной церемонии AIIM Awards, где ежегодно отмечаются персоны, внесшие наибольший вклад в продвижение идей ECM, и проекты, демонстрирующие лучший отраслевой опыт применения технологий. В этом году в номинации "Лучшие практики" (категория "малые организации" — до 100 сотрудников) лауреатом стала компания Trendset с проектом автоматизации обработки документов на основе технологий Abbyy. Trendset предоставляет услуги биллинга и бухгалтерского обслуживания грузоперевозок и является клиентом Abbyy. В этой организации FlexiCapture используется для обработки потока бумажных документов, состоящего из счетов, прилагаемых к ним накладных, уведомлений о доставке и другой сопроводительной документации.

По оценкам ИТ-директора Trendset Джея Джонсона, внедрение FlexiCapture повысило эффективность работы, сократив потребность в сортировке данных и ручном вводе. Общие затраты времени на обработку одного документа снизились на 40%, а число сотрудников в центральном офисе, занятых платежными документами, сократилось с 35 до 21 человека.

Что касается России, то, как пояснил Арам Пахчанян, главный менеджер компании Abbyy по продукту FlexiCapture, представлявший его на AIIMexpo 2007, до недавнего времени использовать технологии распознавания при обработке финансовых документов могли себе позволить в основном лишь банки, причем достаточно крупные. Но сейчас реальный интерес к этим технологиям проявляют предприятия различных секторов экономики, в том числе средние и даже малые. Такие средства особенно актуальны для организаций, предоставляющих финансовые услуги в режиме аутсорсинга. В России предварительная демонстрация FlexiCapture 8.0 Professional состоялась 25 мая в Москве на выставке Docflow 2007, а начало продаж нового продукта запланировано на нынешнее лето.