Název: | Rozpoznávání řeči pacientů po totální laryngektomii komunikujících pomocí elektrolarynxu |
Další názvy: | Speech recognition of patients after total laryngectomy communicating by electrolarynx |
Autoři: | Stanislav, Petr |
Datum vydání: | 2020 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | disertační práce |
URI: | http://hdl.handle.net/11025/41889 |
Klíčová slova: | rozpoznávání řeči;totální laryngektomie;elektrolarynx;duration model;tdnn;dnn |
Klíčová slova v dalším jazyce: | automatic speech recognition;total laryngectomy;electrolarynx;duration model;tdnn;dnn |
Abstrakt: | Předkládaná disertační práce se zabývá problematikou rozpoznávání řeči pacientů, kteří podstoupili totální laryngektomii, a k produkci hlasu využívají elektrolarynx. V první části práce jsou přiblíženy důvody ztráty hlasu a metody, které jsou v současnosti využívány pro jeho rehabilitaci spolu s~jejich principy. Významnou pomoc s rehabilitací hlasu mohou poskytnout řečové technologie zpracovávající přirozenou řeč. Z tohoto důvodu jsou v práci popsány metody, které jsou využívány pro konstrukci automatických systémů rozpoznávání řeči (ASR). S ohledem na specifika řeči generované za pomoci elektrolarynxu je v práci prezentován postup pro sestavení speciálního řečového korpusu složeného z nahrávek hlasu pacienta po totální laryngektomii. Specifická řečová data slouží následně pro otestování robustnosti obecného systému rozpoznávání řeči. Získané výsledky však indikují potřebu navrhnout speciální ASR systém s individuálními požadavky vzhledem ke specifikům rozpoznávané řeči. Následně je navrženo několik postupů úpravy akustických dat za účelem zvýšení přesnosti rozpoznávání. Jako nejúčinnější se ukázalo protažení neznělých fonémů, proto byl vyvíjený ASR systém rozšířen o modul zohledňující právě toto protažení. V práci je popsáno nemalé množství experimetů, které byly provedeny za účelem ověření dílčích hypotéz. |
Abstrakt v dalším jazyce: | This dissertation thesis deals with speech recognition of patients who have undergone total laryngectomy and who use electrolarynx for voice production. In the first part of the thesis, the reasons of voice loss and methods that are currently used for its rehabilitation together with their principles are described. Significant help with voice rehabilitation can be provided by speech technologies processing natural speech. For this reason, the methods that are used for the construction of automatic speech recognition systems (ASR) are described. Regarding the specifics of speech generated with the help of electrolarynx, the paper presents a procedure for assembling a special speech corpus consisting of recordings of the patient's voice after total laryngectomy. The specific speech data is then used to test the robustness of the general speech recognition system. However, the obtained results indicate the need to design a special ASR system with individual requirements due to the specifics of the speech. Subsequently, several methods for adjusting acoustic data are proposed to increase recognition accuracy. The elongation of voiceless phonemes proved to be the most effective, so the developed ASR system was extended by a module taking into account this elongation. The work describes a considerable number of experiments, which were conducted to verify partial hypotheses. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Disertační práce / Dissertations (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
stanislav-thesis_online.pdf | Plný text práce | 6,97 MB | Adobe PDF | Zobrazit/otevřít |
posudky-odp-stanislav.pdf | Posudek oponenta práce | 532,38 kB | Adobe PDF | Zobrazit/otevřít |
protokol-odp-stanislav.pdf | Průběh obhajoby práce | 609,59 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/41889
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.