Artykuł przedstawia analizę leksyki występującej w wypowiedziach użytkowników języka polskiego należących do dwóch grup wiekowych: 18–25 oraz 65–80 lat. Celem badania jest identyfikacja i porównanie słów charakterystycznych dla obu pokoleń z wykorzystaniem metod lingwistyki korpusowej. Materiał badawczy stanowi korpus współczesnego języka mówionego liczący ponad 2,5 mln wyrazów, obejmujący teksty pochodzące m.in. z korpusu Spokes, napisów z serwisu YouTube, relacji biograficznych Archiwum Historii Mówionej oraz wystąpień sejmowych. Do analizy wybrano po 25 tekstów z każdej grupy wiekowej. Do wyłonienia leksemów charakterystycznych zastosowano miarę TF-IDF (Term Frequency – Inverse Document Frequency), obliczoną w środowisku R z wykorzystaniem pakietów tidytext i dplyr. Wyniki pokazują wyraźne różnice w warstwie leksykalnej wypowiedzi obu pokoleń. W grupie młodszej dominują elementy typowe dla mowy potocznej, takie jak wulgaryzmy, pauzy wypełnione oraz zwroty fatyczne. W wypowiedziach osób starszych częściej pojawiają się leksemy odnoszące się do przeszłości, doświadczeń biograficznych oraz relacji rodzinnych. Analiza wskazuje jednak, że różnice te wynikają nie tylko z wieku mówców, lecz także z odmiennych sytuacji komunikacyjnych reprezentowanych w badanym korpusie.
Możesz również Rozpocznij zaawansowane wyszukiwanie podobieństw dla tego artykułu.