Badacze z Polskiej Akademii Nauk przeanalizowali setki przemówień sejmowych i senackich, identyfikując momenty, w których politycy używali języka agresji – zarówno wprost, jak i w subtelnej, zakamuflowanej formie. Efekt tych prac to pierwsza w Polsce publiczna baza takich wypowiedzi, mająca pomóc w zrozumieniu brutalizacji debaty publicznej oraz w szkoleniu algorytmów rozpoznających agresję w języku polskim

W polskim parlamencie agresja rzadko przybiera postać krzyków czy jawnych obelg. Znacznie częściej ukryta jest w ironii, sarkazmie, pytaniach retorycznych lub metaforach.

Autorzy projektu – dr Justyna Sarzyńska-Wawer z Instytutu Psychologii PAN oraz dr hab. Aleksander Wawer z Instytutu Podstaw Informatyki PAN – podkreślają, że w sejmowych i senackich wystąpieniach granica między ostrą krytyką a atakiem osobistym jest cienka, a rozpoznanie intencji nadawcy wymaga uważnej analizy. Wyjaśniają, że agresja językowa to atak na poczucie wartości odbiorcy lub podmiotu wypowiedzi, wyrażany poprzez negatywne oceny i emocje. W polityce może być narzędziem autopromocji, sposobem prowokowania przeciwników, próbą wzmocnienia własnego wizerunku, ale też oznaką braku kontroli emocji.

Z badań cytowanych przez naukowców wynika, że agresywny język obniża wiarygodność mówcy – niezależnie od jego płci, poglądów czy przynależności partyjnej. W erze mediów społecznościowych, gdzie oficjalne wystąpienia mieszają się z prywatnymi komentarzami, ostre sformułowania szybko opuszczają mury parlamentu, tracąc pierwotny kontekst. To sprawia, że monitorowanie i analiza języka polityki stają się szczególnie istotne.

Jak powstała baza i do czego służy

Podstawę projektu stanowiły stenogramy z posiedzeń Sejmu VIII i IX kadencji oraz Senatu IX i X kadencji, obejmujące lata 2016 i 2022, zaczerpnięte z międzynarodowego projektu ParlaMint. Wybrano dwa lata, aby uchwycić różne składy izb i style debaty. Ponieważ fragmentów agresywnych jest niewiele, badacze w pierwszym etapie zastosowali preselekcję automatyczną.

Wykorzystano dwa podejścia: analizę z użyciem słownika negatywnego słownictwa, obejmującego ponad 5,4 tys. wyrazów i wyrażeń nacechowanych emocjonalnie, oraz metodę opartą na specjalnym słowniku agresji przygotowanym na potrzeby badania. Ten drugi zawierał m.in. określenia braku kompetencji, kłamstwa, obelgi, sformułowania budujące podział „my-oni” oraz słowa odnoszące się do tematów szczególnie kontrowersyjnych, takich jak LGBT czy aborcja.

Skuteczność obu metod była różna. Słownik agresji pozwalał wykryć agresywne fragmenty w niemal 40 proc. analizowanych wypowiedzi, podczas gdy metoda oparta na słownictwie negatywnym – w 23 proc., a losowy wybór – w 21 proc.

Po preselekcji zespół ręcznie przeanalizował 638 fragmentów, oznaczając w nich elementy agresji, odwołania do autorytetu, wyrażenia pewności lub relatywizmu. Wśród przykładów znalazły się zarówno subtelne przytyki, jak i bezpośrednie zarzuty kłamstwa.

W jednym z wystąpień poseł mówił z mównicy: „Pierwszy problem tej ustawy to kłamstwo. To zresztą symboliczne, że w rocznicę swoich rządów PiS mówi Polakom: Nie daliśmy rady, okłamaliśmy was, oszukaliśmy. Kłamał prezydent, kłamała premier, nie będzie żadnej kwoty wolnej od podatku, nie będzie żadnej kwoty w wysokości 8 tys., po prostu oszukaliśmy was”.

Od analizy do narzędzia

Tak przygotowana baza posłużyła do przetestowania dwóch modeli sztucznej inteligencji rozpoznających agresję: rekurencyjnej sieci neuronowej oraz wstępnie wytrenowanego modelu językowego. Oba poradziły sobie dobrze, jednak model językowy osiągnął lepsze wyniki pod względem precyzji i czułości.

Badacze udostępnili także demonstracyjną wersję narzędzia, które potrafi automatycznie wykrywać agresywne fragmenty w języku polskim – co może pomóc w dalszych badaniach nad stylem debaty parlamentarnej i monitorowaniu zmian w czasie.

Nowa baza umożliwia naukowcom śledzenie, jak zmienia się język polskiej polityki w kolejnych latach i jakie strategie językowe dominują w wystąpieniach parlamentarzystów. Może posłużyć do analiz porównawczych między partiami, kadencjami czy indywidualnymi politykami, a w zestawieniu z danymi z mediów społecznościowych – pokazać, jak język parlamentu przenika do internetu.

Dla inżynierów AI to gotowy materiał do trenowania systemów automatycznie wykrywających agresję w języku polskim – nie tylko w parlamencie, ale też w komentarzach internetowych czy debatach telewizyjnych. Dla dziennikarzy i organizacji pozarządowych to narzędzie pozwalające monitorować poziom brutalizacji debaty publicznej. A dla polityków – lustro pokazujące, w jaki sposób używane przez nich słowa mogą być odbierane jako atak.

„To jedyne tego typu narzędzie dla języka polskiego. Mamy nadzieję, że pomoże promować bardziej konstruktywny język debaty” – podkreślają twórcy projektu.

Źródło:
Justyna Sarzyńska-Wawer, Aleksander Wawer, The corpus of aggressive language in Polish parliamentary debates, Language Resources and Evaluation (2025). DOI: 10.1007/s10579-025-09870-z

Przejdź do treści