Technologia firmy Kaspersky Lab została zaprojektowana w celu zapewnienia skutecznego wykrywania tekstu i spamu w obrazach rastrowych bez konieczności stosowania maszynowego rozpoznawania obrazów. Podejście to zapewnia szybkie wykrywanie oraz możliwość rozpoznawania tekstu w prawie każdym języku. Nowa technologia antyspamowa firmy Kaspersky Lab została rozwinięta przez Jewgienija Smirnowa. Federalny Urząd ds. Własności Intelektualnej, Patentów i Znaków Handlowych przyznał jej patent 13 stycznia 2009 roku.
– Z jednej strony nasza nowa metoda całkiem dobrze radzi sobie w wykrywaniu obrazów, które zawierają tekst w niemal każdym języku – powiedział Jewgienij Smirnow, twórca technologii i menedżer ds. rozwoju technologii antyspamowych w Kaspersky Lab. – Z drugiej strony, nie próbujemy czytać tekstu przy użyciu rozpoznawania maszynowego, dlatego metoda ta ma wystarczająco niskie wymagania dotyczące zasobów, aby mogła być wykorzystana w wysoce wydajnym filtrze spamowym firmy Kaspersky Lab – dodał.
Nowa opatentowana przez Kaspersky Lab technologia opiera się na probabilistycznym i statystycznym podejściu. To, czy obraz zawiera tekst, określa rozmieszczenie graficznych wzorów słów i linii, jak również zawartość liter i słów w tych wzorach. Dzięki wyspecjalizowanym filtrom na system nie mają wpływu elementy “szumu” ani złamania tekstu w obrębie obrazów, natomiast wykorzystanie unikatowej metody wykrywania wierszy tekstu przeciwdziała stosowanym w spamie graficznym technikom zaciemniania, takim jak zniekształcanie obrazu i obracanie. Nowy system potrafi również skutecznie rozpoznać, czy wykryty tekst jest spamem poprzez porównanie jego sygnatury z zawartymi w bazach danych szablonami spamu.
– Wynalazek ten ma istotne znaczenie dla branży antyspamowej” – powiedział Nadieżda Kaszenko, menedżer ds. praw patentowych w firmie Kaspersky Lab. – Warto wspomnieć, że istnieje wiele różnych technologii wykrywania spamowych wiadomości tekstowych, ale bardzo niewiele rozwiązań rozpoznaje spamową wiadomość tekstową w obrazie. Rozwiązania te są bardzo skomplikowane i nieefektywne, ponieważ najpierw muszą znaleźć tekst w obrazie, a dopiero później zdecydować, czy to spam. Metoda Jewgienija Smirnowa jest unikatowa. Jest to technologia nowej generacji, dlatego mogliśmy wystąpić o przyznanie jej prawa patentowego – dodał.