Wyniki projektu

Projekt finansowany ze środków:

Założenia opracowywanej metody i prototypu narzędzia

Źródłem informacji dla systemu są ogólnodostępne zasoby (np. artykuły i komentarze na stronach www, posty na forach dyskusyjnych, ogłoszenia) pochodzące z Internetu płytkiego oraz głębokiego. Projekt przewiduje także przetwarzanie danych słabo ustrukturyzowanych będących tekstem w języku naturalnym.
Przetwarzane przez system dane pochodzą z wielu źródeł, charakteryzujących się różnym stopniem ustrukturyzowania treści.
Zdefiniowane źródła są stale monitorowane w celu wykrycia treści, mogących świadczyć o wystąpieniu poszukiwanego zagrożenia.
Informacje o cechach konkretnej klasy zagrożenia przechowywane są w postaci metaprofili zagrożeń, które umożliwiają zdefiniowanie treści do pozyskania z monitorowanych źródeł.
Profile zagrożeń są budowane i podlegają ewolucji automatycznie z wykorzystaniem zdefiniowanych przez specjalistów reguł.
Udział specjalistów dziedzinowych jest niezbędny jedynie podczas definiowania metod działania systemu, zamiast w procesie monitorowania wystąpienia określonej klasy zagrożeń.

Unikalne możliwości proponowanego rozwiązania

Ekstrakcja informacji z tekstów słabo ustrukturyzowanych, np. serwisów społecznościowych, portali aukcyjnych.
Integracja pozyskanych informacji pochodzących z różnych źródeł, zarówno ogólnodostępnych źródeł internetowych, jak i wewnętrznych baz danych.
Automatyczne wykrywanie zagrożeń manifestujących się w monitorowanych źródłach.
Wykrywany rodzaj zagrożenia uzależniony jest jedynie od zdefiniowanych przez ekspertów reguł budowania profilu. Tym samym rozwiązanie jest uniwersalne i może służyć do wykrywania różnych zagrożeń.

SMC - Semantyczny Monitoring Cyberprzestrzeni