Neuronové sítě pro klasifikaci audio signálu

Stránský, Martin

Název:	Neuronové sítě pro klasifikaci audio signálu
Další názvy:	Neural networks for audio signal classification
Autoři:	Stránský, Martin
Vedoucí práce/školitel:	Švec Jan, Ing. Ph.D.
Oponent:	Šmídl Luboš, Ing. Ph.D.
Datum vydání:	2022
Nakladatel:	Západočeská univerzita v Plzni
Typ dokumentu:	bakalářská práce
URI:	http://hdl.handle.net/11025/50156
Klíčová slova:	wav2vec2.0;transformer;automatické rozpoznávání řeči;neuronové sítě;transkripce textu;transfer learning.
Klíčová slova v dalším jazyce:	wav2vec2.0;ctc;transformers;automatic speech recognition;neural networks;text transcription;transfer learning
Abstrakt:	Tématem bakalářské práce je seznámení se a následná aplikace neuronových sítí v oblasti audiosignálů. Jejím obsahem je problematika využití dostupných architektur neuronových sítí ve spojitosti s audiosignály a jejich popis. Následně je popsána úloha, jejímž cílem bylo zjistit dopad využití různých druhů textové reprezentace anotace (ortografické versus normované) trénovacích audionahrávek pro dotrénování předtrénovaného modelu. Model je následně otestován na testovacím balíku dat a jsou vyhodnoceny důsledky zvoleného trénovacího postupu na jeho výslednou přesnost, diskutován je i dopad dodatečné úpravy výstupu modelu na celkový výsledek. Bylo provedeno několik experimentů, jejichž výsledky jsou následně okomentovány a vyhodnoceny. Na získaných výsledcích je zformulována hypotéza o možnostech využití různých forem dat v závislosti na jejich dostupnosti.
Abstrakt v dalším jazyce:	The aim of this thesis is to cover both the necessary fundamentals of the neural networks and how can they can be used in the real application in the field of audio signal processing. In the first part, the fundamentals of deep learning are covered, the terms explained and the development of selected neural network models and architectures briefly described, pointing out some of the caveats of the not-state-of-the-arts methods as these have led to the currently used methods. The significance of the current extensive development in the whole field of machine learning, mainly the emergence of transfer learning, the shift of the paradigm it means and possible social consequences are also stressed. The fundamentals provided are then used to explain the currently developed tools and lastly exploited in a real task. The following part describes the pre-trained model used which served as the basis for the fine-tuning process for the selected task and evaluates the results obtained though this process. In the conclusion a hypothesis about possible approaches varying on the available annotated data in order to obtain best results in similar applications is formulated upon these results.
Práva:	Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
BP_portal.pdf	Plný text práce	1,87 MB	Adobe PDF	Zobrazit/otevřít
Stransky_V.pdf	Posudek vedoucího práce	919,1 kB	Adobe PDF	Zobrazit/otevřít
Stransky_O.pdf	Posudek oponenta práce	641,77 kB	Adobe PDF	Zobrazit/otevřít
Stransky_P.pdf	Průběh obhajoby práce	202,17 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/50156

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace