Název: | Využití prostoro-časové struktury příznakových vektorů pro adaptaci neuronových sítí |
Další názvy: | Spatio-temporal structure of feature vectors in neural network adaptation |
Autoři: | Trmal, Jan |
Vedoucí práce/školitel: | Müller, Luděk |
Datum vydání: | 2012 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | disertační práce |
URI: | http://hdl.handle.net/11025/5409 |
Klíčová slova: | akustické modelování;neuronové sítě;adaptace;rozpoznávání řeči;na řečníku adaptivní trénování |
Klíčová slova v dalším jazyce: | acoustic modeling;neural networks;adaptation;speech recognition;speaker adaptive training |
Abstrakt: | Tato práce se zabývá metodikou adaptace neuronových sítí a na řečníku adaptivním trénováním neuronových sítí pro systémy automatického rozpoznávání řeči. Obě tyto technologie, tedy jak adaptace, tak na řečníku adaptivní trénování jsou v oboru rozpoznávání řeči často využívány v rámci GMM/HMM modelovacího frameworku. Zde představují jednu z dalších přístupů k zlepšování přesnosti rozpoznávání, často za cenu pouze zanedbatelného navýšení výpočetních nároků. Zásadní předpoklad těchto dvou technik, tedy znalost identity řečníka jak během trénování, tak i během rozpoznávání je poměrně realistický a poměrně snadno zajistitelný. Je tedy žádoucí, aby byly vyvinuty ekvivalentní techniky i pro hybridní systémy rozpoznávání řeči. Cílem této práce je vyvinout a otestovat metodu adaptace a metodu na řečníku adaptivního tréningu a experimentálně ohodnotit její vliv na přesnost rozpoznávače. |
Abstrakt v dalším jazyce: | This doctoral thesis aims at research in the field of the neural networks adaptation and in the field of speaker adaptive training, with special attention to the application of both in the field of automatic speech recognition. Both these technologies, i.e. the adaptation and the speaker adaptive training are often used in the area of speech recognition in the context of the GMM/HMM modeling framework. In that context, they pose one possible approach to improving recognition accuracy, often at a cost of an insignificant increase of computational complexity. The crucial assumptions of both these techniques, i.e. of the speaker adaptation and of the speaker adaptive training, are realistic and can be ensured relatively easily. Therefore, it is desirable to have similar techniques developed even for hybrid (i.e. non-GMM/HMM) speech recognition systems. The goal of this thesis was to develop such method and to experimentally evaluate its influence on the accuracy of the speech recognition system. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Disertační práce / Dissertations (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
main.pdf | Plný text práce | 1,29 MB | Adobe PDF | Zobrazit/otevřít |
posudek-skolitel-trmal.pdf | Posudek vedoucího práce | 46,97 kB | Adobe PDF | Zobrazit/otevřít |
posudky-odp-trmal.pdf | Posudek oponenta práce | 301,5 kB | Adobe PDF | Zobrazit/otevřít |
protokol-odp-trmal.pdf | Průběh obhajoby práce | 55,58 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/5409
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.