Název: | Rekonstrukce pózy lidské ruky z hloubkového obrazu |
Další názvy: | Depth-based hand pose estimation |
Autoři: | Herbig, Milan |
Vedoucí práce/školitel: | Krňoul Zdeněk, Ing. Ph.D. |
Oponent: | Hrúz Marek, Ing. Ph.D. |
Datum vydání: | 2016 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/23643 |
Klíčová slova: | regrese;odhad parametrů;rekonstrukce pózy;3d model;strojové učení;konvoluční neuronová síť |
Klíčová slova v dalším jazyce: | regression;parameter estimation;pose reconstruction;3d model;machine learning;convolutional neural network |
Abstrakt: | Téma práce je zaměřeno na aplikaci state-of-the-art konvolučních neuronových sítí za účelem rekonstrukce pózy lidské ruky z hloubkových dat pořízených kamerou Microsoft Kinect v2. V práci se věnuji současným metodám a přístupům k rekonstrukci pózy, problémům spojeným s trénováním neuronových sítí, tvorbě trénovacích dat, jejich normalizaci a konečně návrhu samotné architektury neuronové sítě pro účely regrese pózy lidské ruky. V závěru diskutuji dosažené výsledky. Výstupem práce je jednak navržená architektura konvoluční neuronové sítě a jednak natrénovaný model. Zároveň jsem vytvořil modul pro snímání a segmentaci hloubkových dat z kamery včetně modulu pro vizualizaci výsledků rekonstrukce. Celý systém běží v reálném čase s využitím výpočtů na grafické kartě. |
Abstrakt v dalším jazyce: | This thesis explores possibilities and contributions of state-of-the-art convolutional neural networks to hand pose estimation problem. Hand pose is estimated from depth images recorded by Microsoft Kinect v2 depth camera. Current hand estimation methods and neural networks in general are discussed. The focus is set on problems during neural network training, data creation and normalization. Whole chapter is devoted to regression convolution neural network model design. Finally, observed results are discussed in the last chapter. This work produces both proposed and trained neural network model. Also, for real-word testing and demonstration purposes, both segmentation and visualization modules were developed. It is worth noting that whole pipeline runs in real time on GPU. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
dipl_prace_final.pdf | Plný text práce | 9,75 MB | Adobe PDF | Zobrazit/otevřít |
herbig-v.pdf | Posudek vedoucího práce | 799,1 kB | Adobe PDF | Zobrazit/otevřít |
herbig-o.pdf | Posudek oponenta práce | 664,35 kB | Adobe PDF | Zobrazit/otevřít |
herbig-p.pdf | Průběh obhajoby práce | 437,35 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/23643
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.