Identity Extraction from Clusters of Multi-modal Observations

Hrúz, Marek; Salajka, Petr; Gruber, Ivan; Hlaváč, Miroslav

Název:	Identity Extraction from Clusters of Multi-modal Observations
Další názvy:	Extrakce identity z klastrů multimodálních pozorování
Autoři:	Hrúz, Marek Salajka, Petr Gruber, Ivan Hlaváč, Miroslav
Citace zdrojového dokumentu:	HRÚZ, M.., SALAJKA, P.., GRUBER, I.., HLAVÁČ, M.. Identity Extraction from Clusters of Multi-modal Observations. In: Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 171-179. ISBN 978-3-030-26060-6 , ISSN 0302-9743.
Datum vydání:	2019
Nakladatel:	Springer
Typ dokumentu:	konferenční příspěvek conferenceObject
URI:	2-s2.0-85071451671 http://hdl.handle.net/11025/36619
ISBN:	978-3-030-26060-6
ISSN:	0302-9743
Klíčová slova:	extrakce identity, aglomerační shlukování, rozpoznání tváře, čtení textu
Klíčová slova v dalším jazyce:	Identity extraction, Agglomerative clustering, Face recognition,Text reading
Abstrakt:	V tomto článku představujeme metodu extrakce identity z televizních zpravodajských vysílání. Identitu definujeme jako soubor multimodálních pozorování. V našem případě je to tvář osoby a jméno osoby. Metoda je založena na aglomeračním seskupování pozorování. Výsledné shluky představují individuální identity, které se objevily ve vysílání. Pro vyhodnocení přesnosti našeho systému jsme ručně označili televizní zpravodajství v hodnotě přibližně jednoho roku. Výsledkem bylo celkem 10301 multimodálních pozorování a 2563 jedinečných identit. Naše metoda dosáhla míry pokrytí 90,69% a míry přesnosti 94,69%. Vzhledem k jednoduchosti navrhovaného algoritmu jsou tyto výsledky velmi uspokojivé. Navržený systém je navíc modulární a tak lze snadno přidat nové modality.
Abstrakt v dalším jazyce:	In this paper, we present a method for identity extraction from TV News Broadcasts. We define the identity as a set of multi-modal observations. In our case it is the face of a person and a name of a person. The method is based on agglomerative clustering of observations. The resulting clusters represent individual identities, that appeared in the broadcasts. To evaluate the accuracy of our system, we hand labelled approximately one year worth of TV News broadcasts. This resulted in total of 10301 multi-modal observations and 2563 unique identities. Our method achieved a coverage measure of 90.69 % and precision measure of 94.69 %. Given the simplicity of the proposed algorithm, these results are very satisfactory. Furthermore, the designed system is modular and new modalities can be easily added.
Práva:	Plný text není přístupný. © Springer
Vyskytuje se v kolekcích:	Konferenční příspěvky / Conference Papers (KKY) OBD

Soubory připojené k záznamu:

Soubor	Velikost	Formát
Hruz2019_Chapter_IdentityExtractionFromClusters.pdf	770,47 kB	Adobe PDF	Zobrazit/otevřít Vyžádat kopii

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36619

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace