Název: | Evaluation of Wav2Vec Speech Recognition for Speakers with Cognitive Disorders |
Autoři: | Švec, Jan Polák, Filip Bartoš, Aleš Zapletalová, Michaela Víta, Martin |
Citace zdrojového dokumentu: | ŠVEC, J. POLÁK, F. BARTOŠ, A. ZAPLETALOVÁ, M. VÍTA, M. Evaluation of Wav2Vec Speech Recognition for Speakers with Cognitive Disorders. In Text, Speech, and Dialogue 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings. Cham: Springer International Publishing, 2022. s. 501-512. ISBN: 978-3-031-16269-5 , ISSN: 0302-9743 |
Datum vydání: | 2022 |
Nakladatel: | Springer International Publishing |
Typ dokumentu: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85139028569 http://hdl.handle.net/11025/50929 |
ISBN: | 978-3-031-16269-5 |
ISSN: | 0302-9743 |
Klíčová slova v dalším jazyce: | Spoken dialog systems;Degenerative diseases;Dementia;Tests |
Abstrakt v dalším jazyce: | In this paper, we present a spoken dialog system used for collecting data for future research in the field of dementia prediction from speech. The dialog system was used to collect the speech data of patients with mild cognitive deficits. The core task solved by the dialog system was the spoken description of the vivid shore picture for one minute. The patients also performed other simple speech-based tasks. All utterances were recorded and manually transcribed to obtain a ground-truth reference. We describe the architecture of the dialog system as well as the results of the first speech recognition experiments. The zero-shot Wav2Vec 2.0 speech recognizer was used and the recognition accuracy on word- and character-level was evaluated. |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © Springer Nature Switzerland AG |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference papers (NTIS) Konferenční příspěvky / Conference Papers (KKY) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Svec_Polak_Bartos_Zapletalova_Vita_Evaluation_of_Wav2Vec_Speech_Recognition_TSD_2022.pdf | 1,32 MB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/50929
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.