Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorTihelka, Daniel
dc.contributor.authorMatoušek, Jindřich
dc.contributor.authorTihelková, Alice
dc.date.accessioned2022-03-28T10:00:27Z-
dc.date.available2022-03-28T10:00:27Z-
dc.date.issued2021
dc.identifier.citationTIHELKA, D. MATOUŠEK, J. TIHELKOVÁ, A. How Much End-to-End is Tacotron 2 End-to-End TTS System. In Text, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedings. Cham: Springer International Publishing, 2021. s. 511-522. ISBN: 978-3-030-83526-2 , ISSN: 0302-9743cs
dc.identifier.isbn978-3-030-83526-2
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85115273150
dc.identifier.urihttp://hdl.handle.net/11025/47247
dc.format12 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringer International Publishingen
dc.relation.ispartofseriesText, Speech, and Dialogue 24th International Conference, TSD 2021, Olomouc, Czech Republic, September 6–9, 2021, Proceedingsen
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© Springeren
dc.titleHow Much End-to-End is Tacotron 2 End-to-End TTS Systemen
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.rights.accessrestrictedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedIn recent years, the concept of end-to-end text-to-speech synthesis has begun to attract the attention of researchers. The motivation is simple – replacing the individual modules that TTS traditionally built on with a powerful deep neural network simplifies the architecture of the entire system. However, how capable are such end-to-end systems of dealing with classic tasks such as G2P, text normalisation, homograph disambiguation and other issues inseparably linked to text-to-speech systems? In the present paper, we explore three free implementations of the Tacotron 2-based speech synthesizers, focusing on their abilities to transform the input text into correct pronunciation, not only in terms of G2P conversion but also in han- dling issues related to text analysis and the prosody patterns used.en
dc.subject.translatedEnd-to-end speech synthesisen
dc.subject.translatedTacotron 2en
dc.subject.translatedWaveRNNen
dc.subject.translatedMelGanen
dc.subject.translatedText processingen
dc.subject.translatedHomograph disambiguationen
dc.subject.translatedProsody patternsen
dc.identifier.doi10.1007/978-3-030-83527-9_44
dc.type.statusPeer-revieweden
dc.identifier.obd43933411
dc.project.IDGA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítícs
dc.project.ID90140/Velká výzkumná infrastruktura_(J) - e-INFRA CZcs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference papers (KAJ)
Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Tihelka2021_Chapter_HowMuchEnd-to-EndIsTacotron2En.pdf222,38 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47247

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD