Title: Investigation of segmentation in i-vector based speaker diarization of telephone speech
Other Titles: Segmentace v systému pro diarizaci řečníka založeném na i-vektorech pro telefonní řeč
Authors: Zajíc, Zbyněk
Kunešová, Marie
Radová, Vlasta
Citation: ZAJÍC, Zbyněk; KUNEŠOVÁ, Marie; RADOVÁ, Vlasta. Investigation of segmentation in i-vector based speaker diarization of telephone speech. In: SPECOM 2016 Proceedings: 18th International Conference on Speech and Computer, 23-27 August 2016, Budapest. Budapest: Moskow state linguistic university, 2016, p. 411-418. ISBN 978-3-319-43957-0 (Print); 978-3-319-43958-7 (Online).
Issue Date: 2016
Publisher: Springer
Document type: konferenční příspěvek
conferenceObject
URI: http://www.kky.zcu.cz/cs/publications/ZbynekZajic_2016_Investigationof
http://hdl.handle.net/11025/25663
ISBN: 978-3-319-43957-0 (Print)
978-3-319-43958-7 (Online)
Keywords: diarizace řečníka;detekce změny řečníka;segmentace;i-vektor
Keywords in different language: speaker diarization;speaker change detection;segmentation;i-vector
Abstract: Článek se zabývá přínosem detekce změny řečníka (SCD) v úloze diarizace pro telefonní konverzace. Porovnali jsme úspěšnost diarizačního systému založeného na i-vektorech používající naivní segmentaci (konstantní délka okna) a SCD. Experimenty na CallHome korpusu dokázali lepší úspěšnost diarizace s pomocí SCD, ale rozdíly mezi testovanými přístupy byly nakonec smazány použítím resegmentace.
Abstract in different language: The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation.
Rights: © Springer International Publishing Switzerland
Appears in Collections:Konferenční příspěvky / Conference Papers (KKY)

Files in This Item:
File Description SizeFormat 
Zajic.pdfPlný text404,58 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/25663

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.