Název: Sledování pohybu objektu ve 3D pomocí hloubkového snímače
Další názvy: Movement tracking of an object in 3D using depth sensor
Autoři: Berka, Filip
Vedoucí práce/školitel: Hrúz Marek, Ing. Ph.D.
Oponent: Bureš Lukáš, Ing.
Datum vydání: 2016
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/23639
Klíčová slova: kinect;opencv;sledování ruky;počítačové vidění;klasifikace;náhodhný rozhodovací les
Klíčová slova v dalším jazyce: kinect;opencv;hand tracking;computer vision;classification;random decision forest
Abstrakt: Tato práce se zabývá sledováním ruky v hloubkových obrazech. V teoretické části je nejprve popsán použitý senzor Kinect v2. Dále práce popisuje algoritmy počítačového vidění a strojového učení, které byly použity v části praktické. Praktická část popisuje postup při řešení úlohy a shrnuje dosažené výsledky. Úloha byla řešena metodou klasifikace pixelů hloubkových obrazů do tříd ruky a pozadí náhodným rozhodovacím lesem. Postup při řešení spočíval ve vytvoření trénovací množiny hloubkových obrazů a označení pixelů, které byly součástí ruky. Toto označení pak sloužilo jako informace učitele. Analýzou změny hloubky v okolí takto označených pixelů byly vytvořeny příznakové vektory. Ty byly dále použity k trénování klasifikátorů. Pro nejsložitější uvažované nastavení klasifikátoru bylo na testovací množině dosaženo téměř 90 % F1-score. Klasifikátory byly též aplikovány na hloubkové obrazy plynoucí z Kinectu v reálném čase.
Abstrakt v dalším jazyce: This thesis concerns with hand tracking in depth images. In the theoretical part at first there is a description of Kinect v2 sensor which was used to acquire the depth images. Then it describes algorithms of computer vision and machine learning which were used in the practical part. The practical part of the thesis describes solution of the problem and summarizes achieved results. The problem was solved by classification of depth image pixels into the hand class and the background class using Random Decision Forest. The solution is based on creation of a dataset of depth images and labeling of pixels which were part of the hand. This labeling was used as the teacher information. Analysing the change in depth in the neighbourhoods of labeled pixels the feature vectors were created. They were then used to train the classifiers. For the most complicated considered settings of the classifier nearly 90 % F1-score was reached on the test set. The classifiers were also used on the depth images streaming from Kinect in real-time.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
Diplomka_Berka.pdfPlný text práce9,99 MBAdobe PDFZobrazit/otevřít
berka-v.pdfPosudek vedoucího práce578,75 kBAdobe PDFZobrazit/otevřít
berka-o.pdfPosudek oponenta práce1,06 MBAdobe PDFZobrazit/otevřít
berka-p.pdfPrůběh obhajoby práce403,75 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23639

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.