Narzędzia CLARIN-PL w przetwarzaniu języka naturalnego – relacja z warsztatów w Collegium Civitas

1 grudnia na zaproszenie Instytutu Socjologii im E. Wnuk-Lipińskiego oraz Sekcji Badań Komunikacji Społecznej PTS nasza uczelnia miała przyjemność gościć badaczy z Politechniki Wrocławskiej: dr. hab. inż. Macieja Piaseckiego, prof. PWr, dr. Marcina Oleksego oraz dr. Jana Wieczorka, którzy poprowadzili dla naukowców i studentów otwarte warsztaty na temat zastosowania narzędzi CLARIN-PL do przetwarzania języka naturalnego.
CLARIN (ang. Common Language Resources & Technology Infrastructure) to ogólnoeuropejska infrastruktura naukowa, która umożliwia badaczom z dziedziny nauk humanistycznych i społecznych pracę z bardzo dużymi zbiorami tekstów, m.in. poprzez tworzenie narzędzi i aplikacji do przeszukiwania korpusów językowych czy analizowania lub modyfikowania tekstów.
Uczestnicy szkolenia dyskutowali o metodach przetwarzania języka naturalnego (ang. Natural Language Processing), szczególnie w obszarze wyodrębniania z tekstów nazw własnych, ekstrakcji terminów (słów kluczowych dla danego korpusu), różnych metodach modelowania tematycznego i grupowania tekstów podobnych semantycznie. Poznali także dobre praktyki towarzyszące przygotowaniu własnych danych tekstowych do analizy narzędziami CLARIN-PL.
Serdecznie dziękujemy prowadzącym szkolenie, którzy podzielili się specjalistyczną wiedzą z uczestnikami warsztatów, oraz dr. Markowi Troszyńskiemu, który koordynował organizację wydarzenia w Collegium Civitas.