Název: Detection of Overlapping Speech for the Purposes of Speaker Diarization
Další názvy: Detekce překrývající se řeči pro účely diarizace řečníků
Autoři: Kunešová, Marie
Hrúz, Marek
Zajíc, Zbyněk
Radová, Vlasta
Citace zdrojového dokumentu: KUNEŠOVÁ, M.., HRÚZ, M.., ZAJÍC, Z.., RADOVÁ, V.. Detection of Overlapping Speech for the Purposes of Speaker Diarization. In: Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, Turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 247-257. ISBN 978-3-030-26060-6 , ISSN 0302-9743.
Datum vydání: 2019
Nakladatel: Springer
Typ dokumentu: konferenční příspěvek
conferenceObject
URI: 2-s2.0-85071473786
http://hdl.handle.net/11025/36621
ISBN: 978-3-030-26060-6
ISSN: 0302-9743
Klíčová slova: Překrývající se řeč, Diarizace řečníků, Konvoluční neuronová síť
Klíčová slova v dalším jazyce: Overlapping speech, Speaker diarization, Convolutional neural network
Abstrakt: Přítomnost překrývající se řeči má značný negativní vliv na úspěšnost systémů pro diarizaci řečníků. Tento článek se věnuje aplikaci konvoluční neuronové síť pro detekci takovýchto řečových intervalů a následnému vyhodnocení z hlediska potenciálního zlepšení diarizace řečníků. Síť je trénována na speciálně vytvořených umělých datech, zatímco vyhodnocení je prováděno na datasetech AMI Corpus a SSPNet Conflict Corpus.
Abstrakt v dalším jazyce: The presence of overlapping speech has a significant negative impact on the performance of speaker diarization systems. In this paper, we employ a convolutional neural network for the detection of such speech intervals and evaluate it in terms of the potential improvements to speaker diarization. We train the network on specifically-created synthetic data, while the evaluation is performed on the AMI Corpus and the SSPNet Conflict Corpus.
Práva: Plný text není přístupný.
© Springer
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Kunesova2019_Chapter_DetectionOfOverlappingSpeechFo.pdf411,78 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36621

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD