Technologia wypiera sondaże. Polscy naukowcy dzięki zaawansowanej analizie danych mogą dokładniej prognozować wyniki wyborów

Badacze z Uniwersytetu Warszawskiego wykorzystują zaawansowaną analizę danych do prognozowania wyników wyborów, nastrojów społecznych czy trendów gospodarczych. W tym celu wyszukują i przetwarzają ogólnodostępne artykuły, wpisy na blogach i forach, a dzięki dużo większej próbie badawczej uzyskiwane przez nich wyniki są dokładniejsze nawet od oficjalnych sondaży czy prognoz. Ta metoda może również znaleźć zastosowanie w biznesie, m.in. do prognozowania rozwoju trendów technologicznych czy branż, w które warto inwestować.

– Technologie informacyjne przebojem wdarły się do medioznawstwa i analizy mediów. Trudno przecenić ich rolę w kontekście użyteczności dla nadawców, ale i dla nas. Wyniki, które otrzymujemy, mogą być zastosowane wszędzie, poczynając od aspektów politycznych. Możemy dość dokładnie diagnozować nastroje, odpowiadać na pytanie o kierunek procesów gospodarczych, możemy powiedzieć, gdzie są pieniądze albo która z dyscyplin czy specjalności technologicznych rozwija się najszybciej. Takie wyniki uzyskiwaliśmy i one zgadzają się z rzeczywistością – mówi agencji informacyjnej Newseria Biznes dr hab. inż. Wiesław Cetera, adiunkt w Katedrze Technologii Informacyjnych Mediów.

Według danych Gemius w maju tego roku było w Polsce 27,4 mln internautów. Analiza ich aktywności, wpisów na forach i blogach oraz artykułów w mediach pozwala badaczom z Uniwersytetu Warszawskiego z dużą dokładnością prognozować nastroje społeczne, wyniki wyborów prezydenckich czy parlamentarnych, a nawet kierunki zmian gospodarczych. Sporządzona przez nich prognoza dotycząca wyborów parlamentarnych w 2011 roku i prezydenckich w 2015 roku była trafniejsza od oficjalnych sondaży. Jest to możliwe dzięki znacznie większej próbie badawczej.

 Metoda, którą stosujemy, różni się od badań ankietowych dokładnością i szerszym zakresem. Badania ankietowe dotyczą wybranej grupy, populacji liczącej przykładowo tysiąc osób. My jesteśmy w stanie zbadać nawet 10 mln wpisów. Z tej wielkości próby wyłania się zdecydowanie dokładniejszy wynik i to ma kapitalne znaczenie, rezygnujemy z badania sondażowego na rzecz prawie pełnego przeglądu – podkreśla dr hab. inż. Wiesław Cetera.

Badacze z Centrum Rafinacji Informacji na UW wykorzystują własny program, który wyszukuje w ogólnodostępnych źródłach konkretne słowa i frazy. Następnie analizuje czy padają w pozytywnym czy negatywnym kontekście. Wyniki takich badań mogą znaleźć zastosowanie również w biznesie, np. w celu prognozowania rozwoju trendów technologicznych czy branż, w które warto inwestować.

 Możemy powiedzieć na przykład, co najlepiej sprzyja wizerunkowi danej marki. O Polsce najlepiej w ostatnim czasie mówiono, kiedy Polacy ściągali Francuzkę z K2. Wtedy pozytywnych opinii było najwięcej. Możemy też zbadać, kiedy było ich najmniej. Krzywa nastrojów jest bardzo pulsująca i my możemy określić, z jakiego powodu. Gdyby odbiorcy częściej korzystali z takich danych, z pewnością wiele decyzji – również na poziomie firm i organizacji – byłoby innych – mówi dr hab. inż. Wiesław Cetera.

Zaawansowana analiza wykorzystywana przez naukowców z Uniwersytetu Warszawskiego może również posłużyć do identyfikacji zagrożeń terrorystycznych.

– Od tego zresztą zaczęła się analiza big data. Trzeba jednak mieć dostęp do innych danych, bo identyfikacja trendów gospodarczych może być łatwo wykonana za pomocą ogólnodostępnych danych – mówi dr hab. inż. Wiesław Cetera.