„Hańba w Sejmie” – zastosowanie modeli generatywnych do analizy debat parlamentarnych
Streszczenie
W ciągu ostatniego dziesięciolecia nastąpił wyraźny wzrost obecności skrajnej retoryki politycznej
w debacie parlamentarnej w Polsce. Jednym z aspektów postępującej radykalizacji języka jest nadużywanie słów o wysokim negatywnym natężeniu emocjonalnym w celu opisania zdarzeń występujących w codziennej polityce, co prowadzi do degradacji ich znaczenia. Jak wskazują badania, brutalizacja języka debaty wywołuje negatywne konsekwencje na poziomie elit politycznych i elektoratu,
prowadząc do zmniejszonej efektywności działania parlamentu, zaostrzenia konfliktów między partiami i ich zwolennikami oraz do alienacji politycznej obywateli.
W artykule przedstawiam możliwości wykorzystania stenogramów parlamentarnych do analizy
przemian dyskursu politycznego, w tym wykorzystane algorytmy przeszukiwania korpusów tekstów oraz analizy ukrytych tematów. Jako przykład wykorzystuję zbiór przemówień sejmowych
z lat 1991‒2016 odnoszących się do idei hańby, zdrady, niesławy i skandalu. Opieram się głównie
na generatywnym modelu tematycznym, wykorzystującym metodę ukrytej alokacji Dirichleta i jej
rozszerzeniu – strukturalny model tematyczny, będących nienadzorowanymi metodami ekstrakcji
tematów z dużych korpusów tekstów. Wyniki przeprowadzonych analiz potwierdzają wzrost radykalnego słownictwa w czasie, a także określają charakterystyki jego użytkowników oraz najczęściej
występujące konteksty (polityka historyczna, kontrola nad mediami, polityka zagraniczna). Over the last decade there has been a clear increase in extreme political rhetoric in the parliamentary debate in Poland. One
aspect of the progressive radicalization of the language is overuse of words having a high negative emotional intensity to describe
events in everyday politics, which leads to the degradation of their importance. As research shows, brutalization of the language of the
debate has negative consequences at the levels of the political elite and the electorate, leading to reduced efficiency of the parliament,
the exacerbation of conflicts between parties and among their supporters, and the political alienation of citizens.
In this article, I present the possibilities of using the transcripts of parliamentary discourse to analyze the changes of the political
discourse, including the algorithms used for searching text corpora and analysis of the latent topics. As an example, I use a set of
parliamentary speeches from the years 1991-2016 related to the idea of shame, betrayal, disgrace and scandal. I base my analyses on
generative topic modeling employing on the method of latent Dirichlet allocation and its extension—Structural Topic Model, both
being unsupervised methods of extracting topics from large text corpora. The results of the analysis confirm the increase in usage of
radical vocabulary in time, and also describe the characteristics of its users and the most common contexts the extreme vocabulary
tend to appear (identity politics, control over the media, foreign policy).
Collections