Název: Rekonstrukce pózy lidské ruky z hloubkového obrazu
Další názvy: Depth-based hand pose estimation
Autoři: Herbig, Milan
Vedoucí práce/školitel: Krňoul Zdeněk, Ing. Ph.D.
Oponent: Hrúz Marek, Ing. Ph.D.
Datum vydání: 2016
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/23643
Klíčová slova: regrese;odhad parametrů;rekonstrukce pózy;3d model;strojové učení;konvoluční neuronová síť
Klíčová slova v dalším jazyce: regression;parameter estimation;pose reconstruction;3d model;machine learning;convolutional neural network
Abstrakt: Téma práce je zaměřeno na aplikaci state-of-the-art konvolučních neuronových sítí za účelem rekonstrukce pózy lidské ruky z hloubkových dat pořízených kamerou Microsoft Kinect v2. V práci se věnuji současným metodám a přístupům k rekonstrukci pózy, problémům spojeným s trénováním neuronových sítí, tvorbě trénovacích dat, jejich normalizaci a konečně návrhu samotné architektury neuronové sítě pro účely regrese pózy lidské ruky. V závěru diskutuji dosažené výsledky. Výstupem práce je jednak navržená architektura konvoluční neuronové sítě a jednak natrénovaný model. Zároveň jsem vytvořil modul pro snímání a segmentaci hloubkových dat z kamery včetně modulu pro vizualizaci výsledků rekonstrukce. Celý systém běží v reálném čase s využitím výpočtů na grafické kartě.
Abstrakt v dalším jazyce: This thesis explores possibilities and contributions of state-of-the-art convolutional neural networks to hand pose estimation problem. Hand pose is estimated from depth images recorded by Microsoft Kinect v2 depth camera. Current hand estimation methods and neural networks in general are discussed. The focus is set on problems during neural network training, data creation and normalization. Whole chapter is devoted to regression convolution neural network model design. Finally, observed results are discussed in the last chapter. This work produces both proposed and trained neural network model. Also, for real-word testing and demonstration purposes, both segmentation and visualization modules were developed. It is worth noting that whole pipeline runs in real time on GPU.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
dipl_prace_final.pdfPlný text práce9,75 MBAdobe PDFZobrazit/otevřít
herbig-v.pdfPosudek vedoucího práce799,1 kBAdobe PDFZobrazit/otevřít
herbig-o.pdfPosudek oponenta práce664,35 kBAdobe PDFZobrazit/otevřít
herbig-p.pdfPrůběh obhajoby práce437,35 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23643

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.