Czas pandemii w polskich mediach społecznościowych: dyskurs i afekty – nowy projekt badawczy Instytutu Socjologii Collegium Civitas
Naukowcy z Instytutu Socjologii Collegium Civitas, pod kierunkiem dra Marka Troszyńskiego, analizują dyskurs w polskich mediach społecznościowych (SM) dotyczący koronawirusa. Celem badania jest zmapowanie tematyki postów w SM odnoszących się do pandemii jako zbiorowego doświadczenia.
Od momentu wybuchu pandemii temat koronawirusa zdominował całkowicie dyskurs publiczny oficjalny i nieoficjalny, naukowy, polityczny i ekonomiczny. Polskie społeczeństwo przeszło przyspieszoną transformację cyfrową, przenosząc do sieci swoje życie zawodowe i towarzyskie. Internet stał się podstawowym medium komunikacji społecznej i wyrazistym odbiciem nastrojów i reprezentacji społecznych. Bardzo szybko pojawiła się konieczność (a wręcz przymus) refleksji, w tym refleksji badawczej nad tym, co się dzieje wokół nas i w naszych domach. Dlatego zespół badaczy z Instytutu Socjologii Collegium Civitas postanowił przyjrzeć się dyskursowi generowanemu przez media społecznościowe (SM), świadomie pomijając media tradycyjne.
Celem badania jest zmapowanie tematyki postów w SM odnoszących się do pandemii jako zbiorowego doświadczenia. Jak zauważa kierownik projektu, dr Marek Troszyński, dyrektor działającego w Collegium Civitas Obserwatorium Cywilizacji Cyfrowej: „Wpisy w mediach społecznościowych traktujemy jako tworzone przez internautów, jednak nie skupiamy swojej uwagi na autorach, najczęściej anonimowych. Zebrane teksty są elementami dyskursu publicznego, a więc oddziałują na potencjalnego czytelnika, narzucają ważność poszczególnych obszarów tematycznych. Mapują i odwzorowują zbiorową mentalność, wraz z jej zasadniczymi tematami, obrazami i afektami”.
Projekt opiera się na połączeniu metod jakościowej analizy treści z analizą ilościową danych językowych, która wykorzystuje narzędzia NLP (Natural Language Processing), np. topic modeling. Na potrzeby projektu naukowcy zebrali teksty z polskojęzycznego Facebooka, Twittera i komentarze w portalach zawierające słowa-klucze: koronawirus lub covid. Analiza obejmuje wpisy od 1. marca 2020 do 30 kwietnia 2020. Łącznie zebrano aż 11 674 944 wzmianek różnej objętości, traktowanych jako odrębne przekazy.
W pierwszym etapie badania ze zbioru wyjściowego wylosowano 50 tys. tekstów (w rozkładzie miesięcznym: 25.000/marzec i 25.000/kwiecień). Teksty zostały poddane analizie narzędziami NLP. Kluczowym efektem analizy było statystyczne wyodrębnienie 10 obszarów tematycznych (topic modeling), które pojawiały się regularnie w zbiorze wypowiedzi. Teksty z poszczególnych obszarów zostały poddane interpretacji przez badaczy, co pozwoliło na wskazanie rzeczywistej tematyki wyróżnionych podzbiorów oraz ukrytych struktur semantyczno-afektywnych.
W drugim etapie badania zbiór wylosowanych tekstów zostanie poddany rekodowaniu pod kątem słów kluczowych zaproponowanych odgórnie przez badaczy. Będą one dotyczyły interesujących nas obszarów życia publicznego: społecznych wyobrażeń na temat przyszłości, zmian politycznych, kryzysu klimatycznego, nowych form pracy i edukacji, migracji i niepełnosprawności w czasach pandemii.