Full metadata record
DC pole | Hodnota | Jazyk |
---|---|---|
dc.contributor.advisor | Šmídl Luboš, Ing. Ph.D. | |
dc.contributor.author | Lytvyniuk, Anton | |
dc.contributor.referee | Švec Jan, Ing. Ph.D. | |
dc.date.accepted | 2022-8-30 | |
dc.date.accessioned | 2022-11-10T14:45:46Z | - |
dc.date.available | 2021-10-15 | |
dc.date.available | 2022-11-10T14:45:46Z | - |
dc.date.issued | 2022 | |
dc.date.submitted | 2022-8-15 | |
dc.identifier | 90063 | |
dc.identifier.uri | http://hdl.handle.net/11025/50144 | - |
dc.description.abstract | S rozvojem hlubokého strojového učení roste i jeho využití v chytrých zařízeních, proto existuje velká potřeba provozování modelů v kontextu omezené výpočetní síly. Jednou z významných úloh v oblasti rozpoznávání řeči a komunikace člověk-stroj je detekce klíčových slov (keyword spotting, KWS). Tato práce vyšetřuje různé architektury neuronových sítí a porovnává učení s učitelem a učení částečně s učitelem. Zjistilo se, že z navržených sítí nejlepších výsledků dosahuje síť ResNet8 a že model před-trénovaný na datové sadě LibriSpeech Light se dobře přenáší na úlohu KWS. | cs |
dc.format | 50 s. | |
dc.language.iso | cs | |
dc.publisher | Západočeská univerzita v Plzni | |
dc.relation.isreferencedby | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=90063 | - |
dc.rights | Plný text práce je přístupný bez omezení | |
dc.subject | rozpoznávání řeči | cs |
dc.subject | rozpoznávání klíčových slov | cs |
dc.subject | hluboká neuronová síť | cs |
dc.subject | učení částečně s učitelem | cs |
dc.subject | malý výpočetní výkon. | cs |
dc.title | Rozpoznávání a detekce klíčových slov | cs |
dc.title.alternative | Keyword detection and recognition | en |
dc.type | bakalářská práce | |
dc.thesis.degree-name | Bc. | |
dc.thesis.degree-level | Bakalářský | |
dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | |
dc.thesis.degree-program | Kybernetika a řídicí technika | |
dc.description.result | Obhájeno | |
dc.description.abstract-translated | With the development of deep machine learning its usage becomes increasingly popular in smart devices, consequently there is a significant need of operating such models in the context of limited computational power. One of the frequent tasks in the domain of speech recognition and human-machine communication is keyword spotting (KWS). This paper investigates multiple neural network architectures and compares supervised and self-supervised learning approaches. We show that the ResNet8 architecture achieves the best results and that the model pretrained on LibriSpeech Light dataset transfers well to the KWS task. | en |
dc.subject.translated | speech recognition | en |
dc.subject.translated | keyword spotting | en |
dc.subject.translated | deep neural network | en |
dc.subject.translated | self-supervised learning | en |
dc.subject.translated | low footprint. | en |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Bakalarka_Lytyniuk.pdf | Plný text práce | 1,36 MB | Adobe PDF | Zobrazit/otevřít |
Lytvyniuk_V.pdf | Posudek vedoucího práce | 428,92 kB | Adobe PDF | Zobrazit/otevřít |
Lytvyniuk_O.pdf | Posudek oponenta práce | 451,73 kB | Adobe PDF | Zobrazit/otevřít |
Lytvyniuk_P.pdf | Průběh obhajoby práce | 219,43 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/50144
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.