Discriminative training of gender-dependent acoustic models

Vaněk, Jan; Psutka, Josef V.; Zelinka, Jan; Pražák, Aleš; Psutka, Josef

Název:	Discriminative training of gender-dependent acoustic models
Další názvy:	Diskriminativní modelování gender-dependent akustických modelů
Autoři:	Vaněk, Jan Psutka, Josef V. Zelinka, Jan Pražák, Aleš Psutka, Josef
Citace zdrojového dokumentu:	VANĚK, Jan; PSUTKA, Josef V.; ZELINKA, Jan; PRAŽÁK, Aleš; PSUTKA, Josef. Discriminative training of gender-dependent acoustic models. In: Text, speech and dialogue. Berlin: Springer, 2009, p. 331-338. (Lecture notes in computer science; 5729). ISBN 978-3-642-04207-2.
Datum vydání:	2009
Nakladatel:	Springer
Typ dokumentu:	článek article
URI:	http://hdl.handle.net/11025/16959 http://www.kky.zcu.cz/cs/publications/VanekJan_2009_Discriminative
ISBN:	978-3-642-04207-2
Klíčová slova:	akustické modelování;HMM;diskriminativní modelování;genderově závislé modely
Klíčová slova v dalším jazyce:	acoustics modeling;HMM;discriminative training;gender-dependent models
Abstrakt:	Hlavním cílem tohoto článku je prozkoumat metody modelování gender-dependent akustických modelů, které budou brát v úvahu nedokonalou funkci detektoru řečníka. Takovéto metody se uplatní zejména v úlohách automatického rozpoznávání řeči v reálném čase, kde detekovaná informace o řečníkovy bývá často zpožděná nebo chybná. Cílem je minimalizovat vliv této chybovosti na výsledek rozpoznávání. Článek rovněž popisuje automatický algoritmus pro tvorbu těchto modelů, kterým lze standardní gender-dependent modely ještě vylepšit. Idea tohoto přístupu spočívá v tom, že někteří muži mají hlas akusticky spíše se podobající hlasu ženskému a naopak. Tento algoritmus dokáže rovněž zkorigovat případné chyby v úvodní informaci o pohlaví řečníků.
Abstrakt v dalším jazyce:	The main goal of this paper is to explore the methods of gender-dependent acoustic modeling that would take the possibly of imperfect function of a gender detector into consideration. Such methods will be beneficial in real-time recognition tasks (eg. real-time subtitling of meetings) when the automatic gender detection is delayed or incorrect. The goal is to minimize an impact to the correct function of the recognizer. The paper also describes a technique of unsupervised splitting of training data, which can improve gender-dependent acoustic models trained on the basis of manual markers (male/female). The idea of this approach is grounded on the fact that a significant amount of "masculine" female and "feminine" male voices occurring in training corpora and also on frequent errors in manual markers.
Práva:	© Jan Vaněk - Josef V. Psutka - Jan Zelinka - Aleš Pražák - Josef Psutka
Vyskytuje se v kolekcích:	Články / Articles (KIV) Články / Articles (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
VanekJan_2009_Discriminative.pdf	Plný text	109,9 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/16959

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace