Wyniki projektu
Założenia opracowywanej metody i prototypu narzędzia
- Źródłem informacji dla systemu są ogólnodostępne zasoby (np. artykuły i komentarze na stronach www, posty na forach dyskusyjnych, ogłoszenia) pochodzące z Internetu płytkiego oraz głębokiego. Projekt przewiduje także przetwarzanie danych słabo ustrukturyzowanych będących tekstem w języku naturalnym.
- Przetwarzane przez system dane pochodzą z wielu źródeł, charakteryzujących się różnym stopniem ustrukturyzowania treści.
- Zdefiniowane źródła są stale monitorowane w celu wykrycia treści, mogących świadczyć o wystąpieniu poszukiwanego zagrożenia.
- Informacje o cechach konkretnej klasy zagrożenia przechowywane są w postaci metaprofili zagrożeń, które umożliwiają zdefiniowanie treści do pozyskania z monitorowanych źródeł.
- Profile zagrożeń są budowane i podlegają ewolucji automatycznie z wykorzystaniem zdefiniowanych przez specjalistów reguł.
- Udział specjalistów dziedzinowych jest niezbędny jedynie podczas definiowania metod działania systemu, zamiast w procesie monitorowania wystąpienia określonej klasy zagrożeń.
Unikalne możliwości proponowanego rozwiązania
- Ekstrakcja informacji z tekstów słabo ustrukturyzowanych, np. serwisów społecznościowych, portali aukcyjnych.
- Integracja pozyskanych informacji pochodzących z różnych źródeł, zarówno ogólnodostępnych źródeł internetowych, jak i wewnętrznych baz danych.
- Automatyczne wykrywanie zagrożeń manifestujących się w monitorowanych źródłach.
- Wykrywany rodzaj zagrożenia uzależniony jest jedynie od zdefiniowanych przez ekspertów reguł budowania profilu. Tym samym rozwiązanie jest uniwersalne i może służyć do wykrywania różnych zagrożeń.