Název: Neuronové sítě pro klasifikaci audio signálu
Další názvy: Neural networks for audio signal classification
Autoři: Stránský, Martin
Vedoucí práce/školitel: Švec Jan, Ing. Ph.D.
Oponent: Šmídl Luboš, Ing. Ph.D.
Datum vydání: 2022
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/50156
Klíčová slova: wav2vec2.0;transformer;automatické rozpoznávání řeči;neuronové sítě;transkripce textu;transfer learning.
Klíčová slova v dalším jazyce: wav2vec2.0;ctc;transformers;automatic speech recognition;neural networks;text transcription;transfer learning
Abstrakt: Tématem bakalářské práce je seznámení se a následná aplikace neuronových sítí v oblasti audiosignálů. Jejím obsahem je problematika využití dostupných architektur neuronových sítí ve spojitosti s audiosignály a jejich popis. Následně je popsána úloha, jejímž cílem bylo zjistit dopad využití různých druhů textové reprezentace anotace (ortografické versus normované) trénovacích audionahrávek pro dotrénování předtrénovaného modelu. Model je následně otestován na testovacím balíku dat a jsou vyhodnoceny důsledky zvoleného trénovacího postupu na jeho výslednou přesnost, diskutován je i dopad dodatečné úpravy výstupu modelu na celkový výsledek. Bylo provedeno několik experimentů, jejichž výsledky jsou následně okomentovány a vyhodnoceny. Na získaných výsledcích je zformulována hypotéza o možnostech využití různých forem dat v závislosti na jejich dostupnosti.
Abstrakt v dalším jazyce: The aim of this thesis is to cover both the necessary fundamentals of the neural networks and how can they can be used in the real application in the field of audio signal processing. In the first part, the fundamentals of deep learning are covered, the terms explained and the development of selected neural network models and architectures briefly described, pointing out some of the caveats of the not-state-of-the-arts methods as these have led to the currently used methods. The significance of the current extensive development in the whole field of machine learning, mainly the emergence of transfer learning, the shift of the paradigm it means and possible social consequences are also stressed. The fundamentals provided are then used to explain the currently developed tools and lastly exploited in a real task. The following part describes the pre-trained model used which served as the basis for the fine-tuning process for the selected task and evaluates the results obtained though this process. In the conclusion a hypothesis about possible approaches varying on the available annotated data in order to obtain best results in similar applications is formulated upon these results.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_portal.pdfPlný text práce1,87 MBAdobe PDFZobrazit/otevřít
Stransky_V.pdfPosudek vedoucího práce919,1 kBAdobe PDFZobrazit/otevřít
Stransky_O.pdfPosudek oponenta práce641,77 kBAdobe PDFZobrazit/otevřít
Stransky_P.pdfPrůběh obhajoby práce202,17 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/50156

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.