Title: | Identity Extraction from Clusters of Multi-modal Observations |
Other Titles: | Extrakce identity z klastrů multimodálních pozorování |
Authors: | Hrúz, Marek Salajka, Petr Gruber, Ivan Hlaváč, Miroslav |
Citation: | HRÚZ, M.., SALAJKA, P.., GRUBER, I.., HLAVÁČ, M.. Identity Extraction from Clusters of Multi-modal Observations. In: Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 171-179. ISBN 978-3-030-26060-6 , ISSN 0302-9743. |
Issue Date: | 2019 |
Publisher: | Springer |
Document type: | konferenční příspěvek conferenceObject |
URI: | 2-s2.0-85071451671 http://hdl.handle.net/11025/36619 |
ISBN: | 978-3-030-26060-6 |
ISSN: | 0302-9743 |
Keywords: | extrakce identity, aglomerační shlukování, rozpoznání tváře, čtení textu |
Keywords in different language: | Identity extraction, Agglomerative clustering, Face recognition,Text reading |
Abstract: | V tomto článku představujeme metodu extrakce identity z televizních zpravodajských vysílání. Identitu definujeme jako soubor multimodálních pozorování. V našem případě je to tvář osoby a jméno osoby. Metoda je založena na aglomeračním seskupování pozorování. Výsledné shluky představují individuální identity, které se objevily ve vysílání. Pro vyhodnocení přesnosti našeho systému jsme ručně označili televizní zpravodajství v hodnotě přibližně jednoho roku. Výsledkem bylo celkem 10301 multimodálních pozorování a 2563 jedinečných identit. Naše metoda dosáhla míry pokrytí 90,69% a míry přesnosti 94,69%. Vzhledem k jednoduchosti navrhovaného algoritmu jsou tyto výsledky velmi uspokojivé. Navržený systém je navíc modulární a tak lze snadno přidat nové modality. |
Abstract in different language: | In this paper, we present a method for identity extraction from TV News Broadcasts. We define the identity as a set of multi-modal observations. In our case it is the face of a person and a name of a person. The method is based on agglomerative clustering of observations. The resulting clusters represent individual identities, that appeared in the broadcasts. To evaluate the accuracy of our system, we hand labelled approximately one year worth of TV News broadcasts. This resulted in total of 10301 multi-modal observations and 2563 unique identities. Our method achieved a coverage measure of 90.69 % and precision measure of 94.69 %. Given the simplicity of the proposed algorithm, these results are very satisfactory. Furthermore, the designed system is modular and new modalities can be easily added. |
Rights: | Plný text není přístupný. © Springer |
Appears in Collections: | Konferenční příspěvky / Conference Papers (KKY) OBD |
Files in This Item:
File | Size | Format | |
---|---|---|---|
Hruz2019_Chapter_IdentityExtractionFromClusters.pdf | 770,47 kB | Adobe PDF | View/Open Request a copy |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/36619
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.