Název: | Discriminative training of gender-dependent acoustic models |
Další názvy: | Diskriminativní modelování gender-dependent akustických modelů |
Autoři: | Vaněk, Jan Psutka, Josef V. Zelinka, Jan Pražák, Aleš Psutka, Josef |
Citace zdrojového dokumentu: | VANĚK, Jan; PSUTKA, Josef V.; ZELINKA, Jan; PRAŽÁK, Aleš; PSUTKA, Josef. Discriminative training of gender-dependent acoustic models. In: Text, speech and dialogue. Berlin: Springer, 2009, p. 331-338. (Lecture notes in computer science; 5729). ISBN 978-3-642-04207-2. |
Datum vydání: | 2009 |
Nakladatel: | Springer |
Typ dokumentu: | článek article |
URI: | http://hdl.handle.net/11025/16959 http://www.kky.zcu.cz/cs/publications/VanekJan_2009_Discriminative |
ISBN: | 978-3-642-04207-2 |
Klíčová slova: | akustické modelování;HMM;diskriminativní modelování;genderově závislé modely |
Klíčová slova v dalším jazyce: | acoustics modeling;HMM;discriminative training;gender-dependent models |
Abstrakt: | Hlavním cílem tohoto článku je prozkoumat metody modelování gender-dependent akustických modelů, které budou brát v úvahu nedokonalou funkci detektoru řečníka. Takovéto metody se uplatní zejména v úlohách automatického rozpoznávání řeči v reálném čase, kde detekovaná informace o řečníkovy bývá často zpožděná nebo chybná. Cílem je minimalizovat vliv této chybovosti na výsledek rozpoznávání. Článek rovněž popisuje automatický algoritmus pro tvorbu těchto modelů, kterým lze standardní gender-dependent modely ještě vylepšit. Idea tohoto přístupu spočívá v tom, že někteří muži mají hlas akusticky spíše se podobající hlasu ženskému a naopak. Tento algoritmus dokáže rovněž zkorigovat případné chyby v úvodní informaci o pohlaví řečníků. |
Abstrakt v dalším jazyce: | The main goal of this paper is to explore the methods of gender-dependent acoustic modeling that would take the possibly of imperfect function of a gender detector into consideration. Such methods will be beneficial in real-time recognition tasks (eg. real-time subtitling of meetings) when the automatic gender detection is delayed or incorrect. The goal is to minimize an impact to the correct function of the recognizer. The paper also describes a technique of unsupervised splitting of training data, which can improve gender-dependent acoustic models trained on the basis of manual markers (male/female). The idea of this approach is grounded on the fact that a significant amount of "masculine" female and "feminine" male voices occurring in training corpora and also on frequent errors in manual markers. |
Práva: | © Jan Vaněk - Josef V. Psutka - Jan Zelinka - Aleš Pražák - Josef Psutka |
Vyskytuje se v kolekcích: | Články / Articles (KIV) Články / Articles (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
VanekJan_2009_Discriminative.pdf | Plný text | 109,9 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/16959
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.