Title: | Investigation of segmentation in i-vector based speaker diarization of telephone speech |
Other Titles: | Segmentace v systému pro diarizaci řečníka založeném na i-vektorech pro telefonní řeč |
Authors: | Zajíc, Zbyněk Kunešová, Marie Radová, Vlasta |
Citation: | ZAJÍC, Zbyněk; KUNEŠOVÁ, Marie; RADOVÁ, Vlasta. Investigation of segmentation in i-vector based speaker diarization of telephone speech. In: SPECOM 2016 Proceedings: 18th International Conference on Speech and Computer, 23-27 August 2016, Budapest. Budapest: Moskow state linguistic university, 2016, p. 411-418. ISBN 978-3-319-43957-0 (Print); 978-3-319-43958-7 (Online). |
Issue Date: | 2016 |
Publisher: | Springer |
Document type: | konferenční příspěvek conferenceObject |
URI: | http://www.kky.zcu.cz/cs/publications/ZbynekZajic_2016_Investigationof http://hdl.handle.net/11025/25663 |
ISBN: | 978-3-319-43957-0 (Print) 978-3-319-43958-7 (Online) |
Keywords: | diarizace řečníka;detekce změny řečníka;segmentace;i-vektor |
Keywords in different language: | speaker diarization;speaker change detection;segmentation;i-vector |
Abstract: | Článek se zabývá přínosem detekce změny řečníka (SCD) v úloze diarizace pro telefonní konverzace. Porovnali jsme úspěšnost diarizačního systému založeného na i-vektorech používající naivní segmentaci (konstantní délka okna) a SCD. Experimenty na CallHome korpusu dokázali lepší úspěšnost diarizace s pomocí SCD, ale rozdíly mezi testovanými přístupy byly nakonec smazány použítím resegmentace. |
Abstract in different language: | The goal of this paper is to evaluate the contribution of speaker change detection (SCD) to the performance of a speaker diarization system in the telephone domain. We compare the overall performance of an i-vector based system using both SCD-based segmentation and a naive constant length segmentation with overlapping segments. The diarization system performs K-means clustering of i-vectors which represent the individual segments, followed by a resegmentation step. Experiments were done on the English part of the CallHome corpus. The final results indicate that the use of speaker change detection is beneficial, but the differences between the two segmentation approaches are diminished by the use of resegmentation. |
Rights: | © Springer International Publishing Switzerland |
Appears in Collections: | Konferenční příspěvky / Conference Papers (KKY) |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/25663
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.