Název: Detekce hlasivkových pulsů v řečovém signálu pomocí strojového učení
Další názvy: Machine learning based glottal closure instant detection
Autoři: Vraštil, Michal
Vedoucí práce/školitel: Matoušek Jindřich, Doc. Ing. Ph.D.
Oponent: Tihelka Daniel, Ing. Ph.D.
Datum vydání: 2020
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/41541
Klíčová slova: uzávěr hlasivek;hlasivkový puls;detekce;klasifikace;extreme gradient boosting;python;konvoluční neuronová síť;kontextový klasifikátor
Klíčová slova v dalším jazyce: glottal closure instant;pitch mark;detection;classification;extreme gradient boosting;convolutional neural net;python;context aware classifier
Abstrakt: Tématem této diplomové práce je detekce hlasivkových pulsů v řečovém signálu pomocí metod strojového učení. Klade si za cíl vylepšit úspěšnost klasifikace výchozího algoritmu, a to především přidáním nových příznaků, nalezením dalších vhodných metod předzpracování řečového signálu a implementací kontextového klasifikátoru. V úvodu této práce je stručně popsána fyziologická tvorba řečového signálu a hlasivkových pulsů, jejich zpracování počítačem a význam a přínos jejich přesné detekce. Následně je představen výchozí algoritmus a čtenář je seznámen s postupem nalezení nových příznaků a nových metod předzpracování. Hlavního přínosu pro úspěšnost klasifikace je dosaženo implementací tzv. kontextového (angl. Context aware) klasifikátoru, který je pak použit pro zbytek práce. V závěru je vylepšený algoritmus porovnán s výchozím algoritmem a s dalšími vybranými algoritmy. Dále je pak ověřena jeho úspěšnost na datech, které prošly simulovaným telefonním kanálem a na datech stejně upravených, které byly navíc zašumělé bílým šumem.
Abstrakt v dalším jazyce: The topic of this diploma thesis is the detection of glottal closure instants from the speech signal using machine learning methods. It aims to improve the success of the classification of the initial algorithm, especially by adding new features and finding other suitable methods of speech signal preprocessing. The introduction of this work briefly describes the physiological production of speech and glottal closure instants, their computer processing and the importance and benefits of their accurate detection. Subsequently, the initial algorithm is introduced and the reader is introduced to the process of finding new features and new methods of preprocessing. The main benefit for the success of the classification is achieved by the implementation of the Context aware classifier, which is then used for the rest of the work. Finally, the improved algorithm is compared with the initial algorithm. Furthermore, its success is verified on data that have passed through the simulated telephone channel and on data that have been modified in the same way with added white noise.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
VrastilMDiplomka.pdfPlný text práce1,56 MBAdobe PDFZobrazit/otevřít
vrastil-v.pdfPosudek vedoucího práce944,86 kBAdobe PDFZobrazit/otevřít
vrastil-o.pdfPosudek oponenta práce833,45 kBAdobe PDFZobrazit/otevřít
vrastil-p.pdfPrůběh obhajoby práce363,92 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41541

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.