REKLAMA
BEZPIECZEŃSTWO Sztuczna inteligencja w służbie OSINT (operacje wywiadowcze)

Sztuczna inteligencja w służbie OSINT (operacje wywiadowcze)

Przystępując do analizy możliwości wykorzystania sztucznej inteligencji w tak specyficznej kategorii wywiadu, jakim jest wywiad ze źródeł otwartych (ang. Open Source Intelligence – OSINT), zacząć należy od określenia podstawowych pojęć, jakich będziemy używać w kontekście prezentowanego w artykule materiału.

Przede wszystkim:

  • wywiad ze źródeł otwartych (OSINT) opiera się wyłącznie na publicznie dostępnych informacjach, takich jak zawartość otwartej sieci internetowej,

natomiast

  • termin „sztuczna inteligencja” (ang. artificial intelligence – AI) opisuje tu technologie, które mogą algorytmicznie podejmować świadome, nieprzypadkowe decyzje.

Ogólnie rzecz biorąc, sztuczna inteligencja (AI) to inteligencja wykazywana przez urządzenia stworzone sztucznie (w przeciwieństwie do inteligencji naturalnej). Termin ten utworzył John McCarthy, używając go po raz pierwszy w 1956 r. na konferencji w Dartmouth. W potocznym rozumieniu jest ona często używana w kontekście „prawdziwej sztucznej inteligencji”. W informatyce i kognitywistyce[1] oznacza także tworzenie modeli i programów symulujących choćby częściowo zachowania inteligentne. Sztuczna inteligencja jest także przedmiotem rozważań filozofii (filozofia sztucznej inteligencji) oraz przedmiotem zainteresowania nauk społecznych. Andreas Kaplan i Michael Haenlein[2] definiują ją jako „zdolność systemu do prawidłowej interpretacji danych zewnętrznych, uczenia się na podstawie takich danych i wykorzystywania tych zdobytych informacji do osiągania określonych celów i zadań poprzez elastyczną adaptację”. Współcześnie sztuczna inteligencja ma dwa podstawowe znaczenia:

  • jest to hipotetyczna inteligencja realizowana w procesie technicznym, a nie naturalnym;
  • jest to nazwa technologii i dziedzina badań naukowych informatyki i kognitywistyki, czerpiąca także z osiągnięć psychologii, neurologii, matematyki i filozofii.

Głównym zadaniem badań nad sztuczną inteligencją w tym drugim znaczeniu jest konstruowanie maszyn i programów komputerowych zdolnych do realizacji wybranych funkcji umysłu i ludzkich zmysłów, niepoddających się numerycznej algorytmizacji. Problemy takie bywają nazywane AI-trudnymi i zalicza się do nich m.in.:

  • podejmowanie decyzji w warunkach braku wszystkich danych,
  • analiza i synteza języków naturalnych,
  • rozumowanie logiczne/racjonalne,
  • automatyczne dowodzenie twierdzeń,
  • komputerowe gry logiczne np. szachy,
  • inteligentne roboty,
  • systemy eksperckie i diagnostyczne.

Sztuczna inteligencja jest powiązana z obszarami uczenia maszynowego, logiki rozmytej, widzenia komputerowego, obliczeń ewolucyjnych, sieci neuronowych, robotyki i sztucznego życia. Szybko znajduje swoje miejsce w kluczowych obszarach działalności człowieka. Jak wynika z informacji opublikowanych przez firmę Accenture, wkrótce będzie na nią przypadało 25% wszystkich wydatków na technologie (1). Sztuczna inteligencja, która ludzką inteligencję rozszerza o efektywne przetwarzanie i precyzyjną analizę danych, umożliwia podejmowanie lepiej umotywowanych decyzji, natomiast automatyzacja usprawnia działania. Do ekspansji tych nowych technologii przyczyniły się trzy czynniki. Pierwszym z nich jest chmura, która zapewniła dostęp do dużej mocy obliczeniowej na żądanie. Drugim – rosnąca w zawrotnym tempie ilość danych (tylko w ciągu ostatnich dwóch lat zostało utworzonych 90% danych na całym świecie), która przekroczyła masę krytyczną wymaganą do stosowania inteligentnych algorytmów będących podstawą sztucznej inteligencji i automatyzacji. Trzecim czynnikiem są nowe narzędzia, które firma może łatwo wdrożyć i zintegrować ze swoim środowiskiem informatycznym.

Termin „sztuczna inteligencja” (AI) stał się wszechobecny w sferze bezpieczeństwa. Jeśli wierzyć broszurom sprzedażowym, praktycznie każdy produkt związany z techniką zabezpieczeń, pojawiający się obecnie na rynku, ma pewien poziom funkcjonalności AI. Wiele rodzajów rozwiązań dotyczących szeroko rozumianego bezpieczeństwa zachwala zalety sztucznej inteligencji, w tym analizę zagrożeń. Ale jakie korzyści naprawdę przynosi sztuczna inteligencja w wywiadzie typu OSINT, w procesie zbierania i analizowania informacji ze źródeł ogólnie dostępnych?

Odpowiedzi na to pytanie poszukiwali m.in. uczestnicy konferencji Recorded Future User Network (RFUN), która odbyła się pod koniec 2019 r. w Waszyngtonie[3]. W czasie konferencji jej uczestnicy odnosili się głównie do referatu Nathana McKeldina z Sił Lądowych USA, dotyczącego zastosowania sztucznej inteligencji w prowadzeniu wywiadu z otwartych źródeł informacji (OSINT). Z przebiegu konferencji wyniknęło, że AI ma wiele zastosowań w OSINT, wykorzystywanym zarówno do celów wojskowych, jak i cywilnych. W szczególności umożliwia analitykom gromadzenie, analizowanie i przeszukiwanie ogromnych zbiorów danych, które w innym przypadku byłyby niewykorzystane.

Aby jednak gruntownie rozpoznać znaczenie sztucznej inteligencji dla pracy wywiadowczej ze źródłami otwartymi, należy jasno sprecyzować, co zaliczamy do tego rodzaju źródeł i co nazywamy wywiadem ze źródeł otwartych. W Polsce nie ma regulacji prawnych, które jasno określałyby, co uważamy za OSINT. Dlatego warto przytoczyć określenia obowiązujące w przepisach amerykańskich (prawo publiczne USA, 109-163, rozdz. 931), które w zasadzie oddają istotę tego, co pod pojęciem OSINT rozumiemy również w naszym kraju. Tak więc Wywiad ze Źródeł Otwartych (ang. Open Source Intelligence – OSINT) to:

  • informacje opracowane na podstawie publicznie dostępnych danych (informacji);
  • gromadzone, wykorzystywane i rozpowszechniane w odpowiednim czasie odpowiednim odbiorcom;
  • spełniające określone potrzeby wywiadu.

Kluczową frazą jest tutaj wyrażenie „publicznie dostępne”. OSINT opiera się na informacjach przeznaczonych do powszechnego użytku, co oznacza, że do ich pozyskiwania nie są wymagane żadne tajne techniki ani łamanie zabezpieczeń. Informacje dostępne publicznie wg podręcznika Departamentu Obrony USA nr 5240.01 (z sierpnia 2016 r.) definiowane są jako informacje:

  • opublikowane lub wyemitowane do publicznego użytku;
  • dostępne publicznie na żądanie;
  • dostępne publicznie on-line lub w inny sposób;
  • dostępne publicznie w formie subskrypcji lub zakupu;
  • mogące być oglądane lub usłyszane przez przypadkowego widza lub słuchacza;
  • udostępniane podczas otwartych dla publiczności spotkań;
  • uzyskiwane poprzez odwiedzenie dowolnego miejsca lub udział w jakimkolwiek wydarzeniu otwartym dla publiczności.

Mówiąc najprościej, jeśli zwykła osoba może uzyskać dostęp do informacji, nie robiąc nic nielegalnego, można rozsądnie zaklasyfikować je jako „publicznie dostępne”. Tak więc w przypadku OSINT nie mamy żadnego problemu z dostępem do informacji. Za to największym problemem, przed jakim stają „zbieracze” OSINT, jest ogromna ilość dostępnych danych. Wyobrażenie o skali problemu mogą dać statystyki globalnego ruchu internetowego z 2018 r. zaczerpnięte z Internet Live Stats. Tylko w 2018 r. na całym świecie:

  • wysłano 67 105 618 987 773 e-maili,
  • przeszukiwano Google 1 648 103 202 209 razy,
  • opublikowano 1 557 976 566 postów na blogu,
  • wysłano 193 923 407 330 tweetów,
  • obejrzano 1 787 898 764 637 filmów w YouTube,
  • przesłano 20 581 035 026 zdjęć na Instagram.

Ze względu na ogromną ilość dostępnych danych praca z OSINT może przypominać próbę znalezienia igły w stogu siana. I to z tego właśnie powodu zastosowanie jednej z form sztucznej inteligencji, jaką jest analiza wspomagana maszynowo, ma dla OSINT kluczowe znaczenie. Poza tym mechanizmy sztucznej inteligencji mogą zostać wykorzystane na przykład przy:

  • agregacji[4] danych: pobieranie nieustrukturyzowanych danych z internetu i umieszczanie ich w ustrukturyzowanym środowisku, dzięki czemu można je przeszukiwać, filtrować, sortować i przetwarzać;
  • wizualizacji: używanie technologii do porównywania różnych aspektów zbiorów danych (np. geograficznych, czasowych itd.);
  • analizie tekstowej: przeglądanie wiadomości i śledzenie ich rozpowszechniania w internecie w celu ustalenia, czy są one prawdopodobne i prawdziwe, czy fałszywe (stanie się to szczególnie ważne, ponieważ fałszywe wiadomości, propaganda i tzw. głębokie podróbki (ang. deep fakes) stają się coraz większym problemem;
  • zautomatyzowanym alarmowaniu i raportowaniu: pobieranie danych wyjściowych i szybkie udostępnianie ich docelowym odbiorcom jako bezpośredni produkt wywiadowczy lub jako zasób tzw. technologii zapytań, opartej na sztucznej inteligencji, takich jak wyświetlacze head-up (HUD)[5].

Analiza wspomagana maszynowo. Ten rodzaj analizy jest jednym z najprostszych zastosowań sztucznej inteligencji w zbieraniu informacji, czyli również w OSINT. Jej zastosowanie pozwala na wielokrotne zwiększenie wydajności człowieka-analityka. Analiza wspomagana maszynowo jest rozwiązaniem z obszaru sztucznej inteligencji, które może być zastosowane do analizy zbiorów danych. Zadania te mógłby wykonać człowiek, ale AI zrobi to znacznie szybciej i na znacznie większych zbiorach danych. Innymi słowy, analizę wspomaganą maszynowo można potraktować jako „ułatwienie”, które odciąża człowieka przy realizacji czasochłonnych zadań analitycznych. Na przykład można ją użyć do przeanalizowania dużej ilości dokumentów i automatycznego opracowania na tej podstawie wniosków, dotyczących np. ludzi, miejsc i rzeczy.

Z kolei inny mechanizm wykorzystywany w ramach AI, wizualizacja maszynowa (MV) to technologia znajdująca zastosowanie w automatycznej inspekcji, zarządzaniu procesami i sterowaniu robotami.

Sztuczna inteligencja w usprawnianiu operacji wywiadowczych. Wzmocnienie cyklu wywiadowczego

Cyklem wywiadowczym nazywanym również procesem zadaniowo-informacyjnym w wywiadzie w literaturze przedmiotu zwykło się nazywać procesy opisujące gromadzenie, obróbkę, analizę i rozpowszechnianie informacji wywiadowczej wśród zainteresowanych podmiotów. W klasycznym ujęciu cykl wywiadowczy przyjęto dzielić na pięć części składowych:

  1. planowanie i stawianie zadań;
  2. gromadzenie – zdobywanie danych;
  3. opracowanie (obróbka) danych wywiadowczych – przekształcenie ich w informację wywiadowczą;
  4. analiza i synteza informacji wywiadowczej – przekształcenie jej w wiedzę (raporty, wnioski i rekomendacje);
  5. dystrybucja (dostarczanie ich do zainteresowanych odbiorców).

Mówiąc najprościej, cykl wywiadowczy jest swego rodzaju pętlą sprzężenia zwrotnego, która zaczyna się od sformułowania zestawu potrzeb informacyjnych (zadań wywiadowczych), zaś kończy się, kiedy potrzeby te zostaną zaspokojone przez dostarczenie odbiorcom produktu (informacji).

W zasadzie można uznać, że cykl wywiadowczy w przedstawionej wyżej postaci istnieje tak długo, jak istnieje wywiad i trwają wojny. Jeszcze do niedawna był to bardzo trudny proces, realizowany całkowicie manualnie. Jednak w ciągu ostatnich lat opracowano szereg programów i udogodnień pozwalających na automatyzację przynajmniej jego części. Swego rodzaju rewolucja nastąpiła jednak dopiero wraz z rozwojem sztucznej inteligencji. Oto kilka przykładów, w jaki sposób sztuczna inteligencja może zostać włączona w cykl wywiadowczy.

W pierwszej fazie cyklu jako narzędzie AI wprowadzana jest analiza wspomagana maszynowo. Dzieje się tak, ponieważ ważne jest, aby utrzymać ludzkie zaangażowanie w pętli[1], zwłaszcza gdy wyniki całego procesu będą wykorzystywane do informowania ośrodka decyzyjnego o rezultatach operacji wywiadowczych. Poniżej przyjrzymy się, jak analiza wspomagana maszynowo poprawia praktyki OSINT.

Poza tym istnieje wiele innych zastosowań inteligentnych technologii w całym cyklu wywiadowczym. Od zautomatyzowanego gromadzenia danych za pośrednictwem dronów i czujników wyposażonych w sztuczną inteligencję (w świecie rzeczywistym), robotów internetowych[2] (w cyberprzestrzeni), aż po zautomatyzowane i półinteligentne mechanizmy dystrybucji informacji przekazywanej do docelowego odbiorcy sztuczna inteligencja będzie coraz częściej wykorzystywana w celu wzmocnienia i przyspieszenia cyklu wywiadowczego.

W rzeczywistości sztuczna inteligencja ma do odegrania poważną rolę w procesie usprawnienia przebiegu cyklu wywiadowczego. Na diagramie poniżej przedstawiono mechanizmy sztucznej inteligencji, które mogą być wykorzystane do wspomagania cyklu wywiadowczego na jego poszczególnych etapach.

[1] Chodzi o pętlę sprzężenia zwrotnego wykorzystywaną w procesie gromadzenia, analizy i dystrybucji informacji w ramach cyklu wywiadowczego.

[2] Robot internetowy, robot indeksujący – program zbierający informacje o strukturze, stronach i treściach znajdujących się w internecie. Efekty pracy robota mogą być różne, w zależności od jego przeznaczenia, na przykład może on skanować wybrane witryny w celu zbudowania bazy adresów e-mail, natomiast roboty zbierające treści dla wyszukiwarek działają szerzej: badają zawartość witryny, sprawdzają kod strony, zbierają dodatkowe informacje o stronie, monitorują aktualizacje, tworzą mirrory stron.

Uwagę zwraca dodanie uczenia maszynowego w środku cyklu. Chodzi o to, że dotąd w tradycyjnym cyklu wywiadowczym, aby proces ten był systematycznie udoskonalany, pętlę sprzężenia zwrotnego realizują ludzie. W przyszłości uczenie maszynowe będzie wykonywać tę funkcję automatycznie i iteracyjnie[1], ucząc się algorytmów gromadzenia i analizy danych, ustalając, co działa, a co nie, na podstawie analiz ogromnych zbiorów danych, dokonywanych przez sztuczną inteligencję.

Przykład OSINT wykorzystującego AI w procesie zadaniowania, gromadzenia informacji, jej przetwarzania, analizy i dystrybucji przedstawiono poniżej. W tym hipotetycznym scenariuszu analityk wojskowy używa OSINT opartego na sztucznej inteligencji do rozwiązania rzeczywistego problemu – śledzenia aktywności grup ekstremistycznych.

Proces ten mógłby przebiegać w następujący sposób:

  1. analityk otrzymuje zautomatyzowane dane wyjściowe z zestawu procesów sztucznej inteligencji zaprojektowanych w celu wyróżnienia trendów i informacji, które mogą być interesujące;
  2. zauważa powtarzanie się określonego symbolu związanego z ekstremistyczną aktywnością i zmusza „roboty” (internetowe) do pracy w poszukiwaniu innych instancji;
  3. crawlery[2] zbierają informacje z mediów społecznościowych, publicznie dostępnych repozytoriów kodu, mediów polskojęzycznych, mediów obcojęzycznych i tysięcy innych źródeł;
  4. zebrane informacje są przepuszczane przez systemy oparte na sztucznej inteligencji, które generują wyniki według z góry określonych założeń (takie jak profile ewentualnych ekstremistów i/lub czasy i lokalizacje geograficzne, związane z wystąpieniami symbolu ekstremizmu);
  5. dane wywiadowcze są automatycznie sporządzane w formie raportu, który może być wykorzystany przez dowódców lub operatorów terenowych do przygotowania działań wojskowych (związanych ze zwalczaniem rozpoznanych terrorystów) pod względem informacyjnym.

W tym przykładzie cały proces (cykl wywiadowczy), od gromadzenia danych po dystrybucję informacji, jest ułatwiony dzięki sztucznej inteligencji. Rozwiązania związane z analizą zagrożeń, takie jak platforma Recorded Future Platform[3], są już wykorzystywane do realizacji procesów wywiadowczych, bardzo podobnych do tego opisanego wyżej, zarówno do celów wojskowych, jak i szeroko rozumianego cyberbezpieczeństwa.

Możliwości i zagrożenia ze strony AI dla przyszłości OSINT

W przyszłości sztuczna inteligencja może w dalszym ciągu wywierać poważny wpływ na rozwój wywiadu z otwartych źródeł informacji (OSINT). Z pozytywnego punktu widzenia AI może wspierać technologie tzw. osobistych asystentów, dzięki szybkiemu dostępowi do otwartych lub niejawnych baz danych, takich jak Siri z poświadczeniem bezpieczeństwa. Wyobraźmy sobie operatora w terenie, który pyta: „Hej Siri[4], kiedy ostatnio (organizacja ekstremistyczna) była aktywna w tym obszarze?” i otrzymuje natychmiastową, dokładną odpowiedź.

Podobnie sztuczna inteligencja może „zasilać” różne przenośne technologie, takie jak inteligentna soczewka kontaktowa, która śledzi ruch oczu, czyta dokumenty, odkrywa relacje, wydaje zalecenia, dostarcza analiz i przekazuje wszystko do zobrazowania na wyświetlaczu typu head-up (HUD), czyli coś w rodzaju dzisiejszej Google Glass[5], nowej generacji wbudowanej w wizjer taktyczny.

Oczywiście nie wszystkie zastosowania AI będą bezwarunkowo zmierzały we właściwym kierunku. Z perspektywy kontradyktoryjności poważnym problemem może być wykorzystanie AI w tworzeniu „fałszywych wiadomości” i „głębokich podróbek” (ang. fake news i deep fakes). Może to pozwolić np. na szybkie stworzenie stosunkowo przekonującego fałszywego dźwięku lub obrazu, jak np. klip z przemówieniem prezydenta, którego w rzeczywistości nigdy nie wygłosił. Wykorzystanie sztucznej inteligencji do tworzenia fałszywych informacji lub szerzej do dezinformacji będzie z pewnością wielkim problemem dla wywiadu ze źródeł otwartych. Powstanie konieczność rozróżniania informacji prawdziwych i fałszywych na poziomie zarówno gromadzenia danych, jak i podczas ich przetwarzania i analizy. Problemy te już się uwidoczniły podczas amerykańskich kampanii prezydenckich z lat 2016 i 2020, a sprawy staną się jeszcze bardziej mętne. W szczególności fałszywe filmy są coraz lepsze i już teraz bardzo trudno jest je zidentyfikować. Na szczęście pojawiają się również aplikacje dla sztucznej inteligencji do rozróżniania prawdziwych i fałszywych mediów realizowane poprzez analizę ich cech charakterystycznych i śledzenie ich propagacji w internecie.

Tak więc sztuczna inteligencja ma do odegrania ogromną rolę dla przyszłości gromadzenia i analizowania danych wywiadowczych ze źródeł otwartych, dla potrzeb zarówno instytucji związanych z wywiadem państwowym, jak i wywiadem gospodarczym, a jej wykorzystanie z biegiem czasu stanie się coraz bardziej powszechne. Jednak według zgodnych opinii ekspertów i analityków wywiadu nic nie będzie w stanie zastąpić zdolności analityka do określenia tego, co w danej informacji jest istotne, a co nie.

Autorzy: radca prawny Robert Nogacki, płk rez. dr inż. Krzysztof Surdyk

Profesjonalny Wywiad Gospodarczy „Skarbiec” Sp. z o.o.

[1] Iteracja – czynność powtarzania tej samej operacji w pętli z góry określoną liczbę razy lub aż do spełnienia określonego warunku. Mianem iteracji określa się także operacje wykonywane wewnątrz takiej pętli.

[2] Crawler (robot internetowy lub robot indeksujący) – jest to program, którego zadaniem jest zbieranie informacji o stronach internetowych, takich jak struktura, kod źródłowy czy treści.

[3] Platforma Recorded Future Security Intelligence – umożliwia zautomatyzowane prowadzenie wywiadu ze źródeł otwartych, a jednocześnie zakłócanie działań przeciwników na dużą skalę. Łączy analitykę z ludzką wiedzą, celem prowadzenia analizy różnorodnych źródeł otwartych, dark web-u, źródeł technicznych i oryginalnych badań naukowych. Dzięki dynamicznemu kategoryzowaniu, łączeniu i analizowaniu danych wywiadowczych w czasie rzeczywistym, platforma zapewnia łatwy dostęp do informacji umożliwiających proaktywne zmniejszanie ryzyka za pośrednictwem sześciu odrębnych modułów dostosowanych do potrzeb konkretnych instytucji wywiadowczych.

[4] Siri (SIRR-ee) – to wirtualny asystent będący częścią systemów operacyjnych Apple Inc. iOS, iPadOS, watchOS, macOS i tvOS. Asystent używa zapytań głosowych, sterowania opartego na gestach, śledzenia ostrości i interfejsu użytkownika w języku naturalnym, aby odpowiadać na pytania, wydawać polecenia i wykonywać czynności, delegując żądania do zestawu usług internetowych. Oprogramowanie dostosowuje się do indywidualnych zastosowań językowych użytkowników, wyszukiwań i preferencji, przy ciągłym użyciu. Zwracane wyniki są zindywidualizowane. Siri to produkt uboczny projektu opracowanego pierwotnie przez SRI International.

[5] Google Glass – okulary o rozszerzonej rzeczywistości stworzone przez firmę Google. Okulary te mają m.in. funkcje standardowego smartfonu, ale mają być obsługiwane głosem poprzez przetwarzanie języka naturalnego. Wiadomo, że okulary mają funkcję wysyłania dźwięku bezpośrednio do czaszki, z wykorzystaniem przewodnictwa kostnego i bez użycia słuchawek.

[1] Kognitywistyka – dziedzina nauki zajmująca się obserwacją i analizą działania zmysłów, mózgu i umysłu, w szczególności ich modelowaniem. Na jej określenie używane są też pojęcia: nauki kognitywne (ang. Cognitive Sciences) bądź nauki o poznaniu.

[2] A. Kaplan, M. Haenlein, Siri, Siri, in my hand: Who’s the fairest in the land? On the interpretations, illustrations, and implications of artificial intelligence, Business Horizons, Volume 62, Issue 1, January–February 2019, Pages 15-25.

[3] How Artificial Intelligence Is Shaping the Future of Open Source Intelligence, By The Recorded Future Team on January 9, 2019, https://www.recordedfuture.com/open-source-intelligence-future/.

[4] Agregacja oznacza proces łączenia części w większą całość.

[5] HUD (skrót od ang. Head-Up Display) – wyświetlacz przezierny prezentujący informacje na specjalnej szybie bez zasłaniania widoku. Początkowo technika ta miała zastosowanie militarne, służyła do prezentacji danych w samolotach bojowych. Obecnie jest używana także dla celów cywilnych w wielu zastosowaniach rzeczywistości rozszerzonej (AR).