On building phonetically and prosodically rich speech corpus for text-to-speech synthesis

Matoušek, Jindřich; Romportl, Jan

Název:	On building phonetically and prosodically rich speech corpus for text-to-speech synthesis
Další názvy:	Vytváření foneticky a prozodicky bohatých řečových korpusů v úloze syntézy řeči z textu
Autoři:	Matoušek, Jindřich Romportl, Jan
Citace zdrojového dokumentu:	MATOUŠEK, Jindřch; ROMPORTL, Jan. On building phonetically and prosodically rich speech corpus for text-to-speech synthesis. In: Proceedings of the second IASTED international conference on Computational intelligence: 20-22 November 2006, San Francisco, USA. San Francisco: ACTA Press, 2006, p. 442-447. ISBN 0-88986-602-3.
Datum vydání:	2006
Nakladatel:	ACTA Press
Typ dokumentu:	článek article
URI:	http://www.kky.zcu.cz/cs/publications/MatousekJ_2006_Onbuilding http://hdl.handle.net/11025/17022
ISBN:	0-88986-602-3
Klíčová slova:	zpracování přirozeného jazyka;syntéza řeči z textu;výběr vět;řečový korpus;prozodie
Klíčová slova v dalším jazyce:	natural language processing;speech synthesis;sentence selection;speech corpus;prosody
Abstrakt:	Článek navrhuje metodu přípravy a pořízení řečového korpusu pro úlohu syntézy řeči z textu s dynamickým výběrem jednotek řízenou pomocí symbolické prozodie. Soustředí se na algoritmus výběru foneticky a prozodicky bohatých vět. Foneticky přepsané věty jsou obohaceny o symbolický popis na hrubé prozodické úrovni s respektováním typu prozodému, ve kterém se fony objevují. Výsledný algoritmus pak vybírá věty s ohledem na fonetická i prozodická kritéria. Abychom též pokryli i supravětné prozodické jevy, náhodně jsme vybrali odstavce a nahráli je. Nový řečový korpus se může využít k syntéze řeči s dynamickým výběrem jednotek a také k trénování datově orientovaného prozodického parseru.
Abstrakt v dalším jazyce:	This paper proposes a way of preparing and recording a speech corpus for unit selection text-to-speech speech synthesis driven by symbolic prosody. The research is focused on a phonetically and prosodically rich sentence selection algorithm. Symbolic description on a deep prosody level is used to enrich the phonetic representation of sentences (by respecting the prosodeme types phones appear in). The resulting algorithm then selects sentences with respect to both phonetic and prosodic criteria. To cover supra-sentential prosody phenomena, paragraphs were selected at random and recorded as well. The new speech corpus can be utilised in unit selection speech synthesis and also for training a data-driven prosodic parser.
Práva:	© Jindřich Matoušek - Jan Romportl
Vyskytuje se v kolekcích:	Články / Articles (MMI) Články / Articles (KKY) Články / Articles (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
MatousekJ_2006_Onbuilding.pdf	Plný text	138,96 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17022

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace