Název: Collection and preprocessing of czech sign language corpus for sign language recognition
Další názvy: Tvorba a předzpracování korpusu českého znakového jazyka pro automatické rozpoznávání znakového jazyka
Autoři: Campr, Pavel
Hrúz, Marek
Trojanová, Jana
Citace zdrojového dokumentu: Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08): 28-29-30 May 2008. Marrakech: ELRA, 2008, p. [1-4]. ISBN 2-9517408-4-0.
Datum vydání: 2008
Nakladatel: ELRA
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/CamprP_2008_Collectionand
http://hdl.handle.net/11025/17204
ISBN: 2-9517408-4-0
Klíčová slova: automatické rozpoznávání znakové řeči;česká znaková řeč;zpracování obrazu
Klíčová slova v dalším jazyce: sign language recognition;czech sign language;image processing
Abstrakt: Tento článek popisuje tvorbu, nahrávání a předzpracování korpusu českého znakového jazyka. Korpus slouží pro trénování a testování automatických systémů pro rozpoznávání znakového jazyka. Tento korpus UWB-07-SLP-P obsahuje videonahrávky 4 znakujících osob, které jsou nasnímány za 3 pohledů. Dva z nich zachytávají celou osobu, třetí je zaměřena na obličej. Každý znakující provedl 378 znaků, každý pětkrát opakován. Korpus obsahuje celkem 21853 videosouborů v délce 11,1 hodin. Každý znak je předzpracován a jsou dostupné základní příznaky, jako např. trajektorie rukou v 3D prostoru.
Abstrakt v dalším jazyce: This paper discusses the design, recording and preprocessing of a Czech sign language corpus. The corpus is intended for training and testing of sign language recognition (SLR) systems. The UWB-07-SLR-P corpus contains video data of 4 signers recorded from 3 different perspectives. Two of the perspectives contain whole body and provide 3D motion data, the third one is focused on signer’s face and provide data for face expression and lip feature extraction. Each signer performed 378 signs with 5 repetitions. The corpus consists of several types of signs: numbers (35 signs), one and two-handed finger alphabet (64), town names (35) and other signs (244). Each sign is stored in a separate AVI file. In total the corpus consists of 21853 video files in total length of 11.1 hours. Additionally each sign is preprocessed and basic features such as 3D hand and head trajectories are available. The corpus is mainly focused on feature extraction and isolated SLR rather than continuous SLR experiments.
Práva: © Pavel Campr - Marek Hrúz - Jana Trojanová
Vyskytuje se v kolekcích:Články / Articles (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
CamprP_2008_Collectionand.pdfPlný text979,77 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17204

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.