Název: | Czech Speech Synthesis with Generative Neural Vocoder |
Autoři: | Vít, Jakub Hanzlíček, Zdeněk Matoušek, Jindřich |
Citace zdrojového dokumentu: | VÍT, J., HANZLÍČEK, Z., MATOUŠEK, J. Czech Speech Synthesis with Generative Neural Vocoder. In: Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings. Cham: Springer, 2019. s. 307-315. ISBN 978-3-030-27946-2 , ISSN 0302-9743. |
Datum vydání: | 2019 |
Nakladatel: | Springer |
Typ dokumentu: | konferenční příspěvek conferenceObject |
URI: | 2-s2.0-85072849542 http://hdl.handle.net/11025/36715 |
ISBN: | 978-3-030-27946-2 |
ISSN: | 0302-9743 |
Klíčová slova v dalším jazyce: | Speech synthesis, LSTM-based speech synthesis, WaveRNN, Neural vocoder, Unit selection |
Abstrakt: | In recent years, new neural architectures for generating high-quality synthetic speech on a per-sample basis were introduced. We describe our application of statistical parametric speech synthesis based on LSTM neural networks combined with a generative neural vocoder for the Czech language. We used a traditional LSTM architecture for generating vocoder parametrization from linguistic features. We replaced a standard vocoder with a WaveRNN neural network. We conducted a MUSHRA listening test to compare the proposed approach with the unit selection and LSTM-based parametric speech synthesis utilizing a standard vocoder. In contrast with our previous work, we managed to outperform a well-tuned unit selection TTS system by a great margin on both professional and amateur voices. |
Práva: | Plný text není přístupný. © Springer |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference papers (NTIS) Konferenční příspěvky / Conference Papers (KKY) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Vit2019_Chapter_CzechSpeechSynthesisWithGenera.pdf | 401,08 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/36715
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.