Analiza publicznie dostępnych w sieci danych – blogów, forów internetowych, artykułów – pozwala dokładniej niż badania sondażowe przewidzieć wyniki demokratycznych wyborów. Pokazują to w swoich badaniach naukowcy z Uniwersytetu Warszawskiego.

W samej Polsce jest teraz ponad 27 mln internautów. Publicznie udostępniają oni co dzień w sieci ogromne ilości komentarzy, postów na blogach, plików, dokumentów. Jeśli wie się, jak w tych danych wyszukiwać konkretnych informacji, uzyskuje się niespotykany wcześniej wgląd w to, co ludzie ci myślą, jakie mają poglądy, co jest dla nich ważne, a co mniej.

Analizując publicznie dostępne w internecie treści, można np. z kilkudniowym wyprzedzeniem przewidzieć wyniki wyborów parlamentarnych czy prezydenckich. I to z dokładnością większą niż sondażownie. Pokazali to naukowcy z Wydziału Dziennikarstwa Informacji i Bibliologii Uniwersytetu Warszawskiego. Badacze próbują też – analizując Big Data – przewidzieć trendy gospodarcze czy kierunki rozwoju technologii.

„Odpowiedzi na pytanie, co ludziom w duszy gra, uzyskujemy drogą całkowicie legalną” – komentuje uczestnik badań dr hab. Wiesław Cetera. I podkreśla, że wszystkie dane wykorzystywane w badaniach, dostępne są publicznie, dla każdego. Badacze jedynie zbierają i „obrabiają” te informacje.

„Wyszukiwarki internetowe wyświetlają mniej niż 0,1 proc. informacji cyfrowych dostępnych w sieci. Reszta jest, z różnych powodów, pomijana” – mówi w rozmowie z PAP kierownik badań prof. Włodzimierz Gogołek. Dlatego jego zespół wykorzystuje własne roboty – programy, które przeczesują zadane im źródła informacji w poszukiwaniu konkretnych słów. „Przed wyborami prezydenckimi w 2015 r. skierowaliśmy roboty do wszystkich źródeł polskich informacji, które pisały na temat wyborów. To były np. gazety, książki, fora, blogi, publiczne posty na Facebooku” – mówi badacz. Roboty poszukiwały stron, na których padały słowa związane z wyborami, np.: „wybory” „Duda” i „Komorowski”.

W zebranych tekstach – po odpowiedniej obróbce – wyszukiwano tzw. sentymentów. W uproszczeniu chodzi o emocje, jakie łączone były z poszukiwanymi słowami. Pozytywnymi sentymentami były np. słowa „zadziwiać”, „cel”, „lubić”, „pewny”, „wygrana”. A negatywnymi sentymentami np. „winien”, „zniszczenie”, „upadek”. Sprawdzano, jakie sentymenty pojawiały się w otoczeniu słów „Duda” oraz „Komorowski”. I na tej podstawie wyliczano poparcie dla każdego z kandydatów.

„Tydzień przed wyborami wiedzieliśmy, kto wygra. Nasze wyniki były dokładniejsze niż udostępnione przez CBOS” – chwali się prof. Gogołek. System przetestowano już podczas wyborów parlamentarnych w 2011 r. i w 2015 r., a także podczas wyborów prezydenckich w 2015 r.

