Компания ABBYY сообщила о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Созданный на базе новейших технологий SDK имеет широкий набор возможностей, среди которых улучшенная поддержка азиатских языков (CJK), технология ADRT для качественного восстановления внешнего вида и структуры документа, а также поддержка MRC-сжатия для форматов PDF и PDF/A.

Поддержка множества языков. Инструментарий поддерживает 198 языков распознавания, включая языки на базе кириллического и латинского алфавитов (в том числе европейские готические шрифты) и такие сложные для распознавания языки, как корейский, японский, китайский, вьетнамский, тайский и иврит. Кроме того, SDK распознает многоязычные документы, причем в одном и том же документе могут быть использованы языки различных видов письменности (например, китайский и немецкий, иврит и французский). Все это позволяет использовать решение ABBYY в создании приложений для международного рынка.

Технология адаптивного распознавания документов. Запатентованная ABBYY технология ADRT позволяет обрабатывать документ как единое целое. Используя специальный алгоритм, система распознает такие элементы структуры, как колонтитулы, сноски, нумерация страниц и подписи. В результате многостраничные документы обрабатываются более эффективно – повышается качество и скорость обработки данных, минимизируется время на сборку отдельных страниц в единый документ.

Точное распознавание штрихкодов. Решение ABBYY распознает более 15 видов одномерных и двумерных штрихкодов (включая PDF 417, Aztec, DataMatrix и QR Code) независимо от их положения на странице и ориентации.

Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием. SDK предоставляет широкий спектр возможностей для работы с PDF: создание PDF-файлов с возможностью поиска и применением тегов, извлечение метаданных, сохранение гиперссылок и внутренних ссылок документа, поддержка различных средств безопасности. В ABBYY FineReader Engine 9.0 for Linux реализована технология MRC-сжатия (Mixed Raster Content) для форматов PDF и PDF/A, в результате которого визуальные характеристики файла не страдают. Это позволяет без проблем решать задачи архивирования и хранения документов.

Поддержка множества форматов. Решение ABBYY поддерживает графические форматы PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в следующих форматах: RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF.

В отличие от OCR-решений open source, инструментарий ABBYY сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке) и постоянно обновляется. Разработанный на основе собственных технологий ABBYY, SDK прошел тестирование и обеспечивает распознавание самого высокого качества.