«Лаборатория Касперского» успешно запатентовала в России технологию борьбы со спамом, обеспечивающую быстроту и высокий уровень детектирования нежелательных сообщений в изображениях. Известно, что современные системы фильтрации спама легко детектируют текстовый спам, Поэтому спамеры часто скрывают тексты нежелательных сообщений в изображениях. Задача фильтрации графического спама значительно сложнее, чем текстового – антиспам-система должна не только установить, является ли текст спамом, но и предварительно зафиксировать наличие самого текста в изображении.

Большинство методов выявления текста в изображениях основаны на машинном распознавании графических образов, однако качественное их машинное распознавание требует единообразия размеров, стилей и расположения считываемых символов. Имея в виду это ограничение, спамеры намеренно искажают и зашумливают изображения, чтобы затруднить и замедлить процесс детектирования текстов.

Технология «Лаборатории Касперского» позволяет обнаруживать тексты и спам в растровых изображениях без машинного распознавания графических образов. Такой подход обеспечивает высокую скорость детектирования и позволяет находить тексты практически на любом языке. В ее основе лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов. Специальные фильтры обеспечивает устойчивость системы к шумовым элементам и разбиению текста рамками и линиями, а особый способ выявления строк – к таким встречающимся в графическом спаме искажениям, как повороты текста и написание его волной. Кроме детектирования текста в изображениях, запатентованная система способна определять, является ли обнаруженный текст спамом, сравнивая его сигнатуру с шаблонами спама, хранящимися в базе данных.

Новая антиспам-технология «Лаборатории Касперского» разработана Евгением Смирновым. Выдача патента на неё одобрена Федеральной службой по интеллектуальной собственности, патентам и товарным знакам 13 января 2009 года.