Przejdź do głównego menu Przejdź do sekcji głównej Przejdź do stopki

Nr 13 (2019)

Artykuły

Narzędzia do analizy mowy – przegląd dostępnych programów i bibliotek

DOI: https://doi.org/10.25312/2391-5137.13/2019_14kp  [Google Scholar]
Opublikowane: 25.03.2020

Abstrakt

Artykuł przedstawia zestawienie popularnych narzędzi do analizy mowy w formie programów dostępnych do pobrania i w formie bibliotek w różnych językach programowania. W pierwszej części zestawione zostały programy służące do wizualizacji sygnału mowy, edytowania, analizy (na przykład pomiarów częstotliwości podstawowej, intensywności czy formantów) oraz anotacji (segmentacji, transkrypcji i etykietowania nagrań). W drugiej części przedstawiono wybrane biblioteki dostępne na stronie GitHub, które służą do akustycznej, fonetyczno-fonologicznej oraz prozodycznej analizy nagrań. Wszystkie narzędzia zostały opisane z uwzględnieniem ich funkcji i możliwości, źródeł, autorów, licencji, na jakich są udostępniane. W ostatnim rozdziale artykułu podjęto próbę ewaluacji opisanych programów, biorąc pod uwagę liczbę i użyteczność ich funkcjonalności.

Bibliografia

  1. Bachan J., Wagner A., Klessa K., Demenko G. (2015), Consistency of Prosodic Annotation of Spontaneous Speech for Technology Needs, Proceedings of the 7th Language & Technology Conference. [Google Scholar]
  2. Giannakopoulos T. (2015), pyAudioAnalysis: An Open-Source PythonLibrary for Audio Signal Analysis, https://journals.plos.org/plosone/article/file?id=10.1371/journal.pone.0144610&-type=printable [dostęp: 6.12.2019]. [Google Scholar]
  3. Leech G. (2005), Adding Lingusitic Annotation, [in:] M. Wynne, Developing Linguistic Corpora: a Guide to Good Practice, Oxford. [Google Scholar]
  4. Łukasik M. (2009), Anotacja korpusów tekstów specjalistycznych, „Języki Specjalistyczne 9. Wyraz – tekst – interpretacja”. [Google Scholar]
  5. Orozco-Arroyave J.R., Vásquez-Correa J.C., Vargas-Bonilla J.F., Arora R., Dehak N., Nidadavolu P., Nöth E. (2018), NeuroSpeech: An open-source software for Parkinson’s speech analysis, “Digital Signal Processing”, July. [Google Scholar]
  6. Rykowski J. (2014), Metody i narzędzia rozpoznawania mowy w zastosowaniach niekomercyjnych, „Napędy i Sterowanie”, R. 16, nr 6. [Google Scholar]
  7. Wagner A., Bachan J., Klessa K., Demenko G. (2015), Przegląd wybranych aspektów analizy prozodii mowy spontanicznej na potrzeby technologii mowy, „Prace Filologiczne”, t. LXVI. [Google Scholar]

Downloads

Download data is not yet available.