Název: | Automatická detekce a vizualizace chyb konkatenační syntézy řeči |
Další názvy: | Automatic Detection and Visualization of Artefacts in Concatenative Speech Synthesis |
Autoři: | Vít, Jakub |
Vedoucí práce/školitel: | Matoušek, Jindřich |
Oponent: | Legát, Milan |
Datum vydání: | 2013 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/7442 |
Klíčová slova: | syntéza řeči;metoda výběru jednotek;detekce chyb;klasifikace |
Klíčová slova v dalším jazyce: | speech synthesis;unit selection;error detection;classification |
Abstrakt: | Syntéza řeči je již v dnešní době schopna vytvářet syntetickou řeč vysoké kvality. Konkatenační metoda s výběrem jednotek je známa právě pro svou schopnost vytvářet kvalitní syntetickou řeč, která je velmi přirozená. Nevýhodou této metody je fakt, že špatné napojení jednotek může vést k náhlému propadu kvality řeči, což je velmi rušivé. V této práci je představen návrh automatického systému, který by tyto jevy dokázal automaticky detekovat. Nejdříve je představen program, který dokáže analyzovat syntetickou řeč. Poté jsou na základě poslechových testů sestavena objektivní označení rušivých úseků. Z nich je trénován SVM klasifikátor. Ten je poté schopen označovat podobná místa v nových syntetických promluvách s velkou úspěšností. V provedených experimentech se úspěšnost pohybovala v rozmezí 70 až 80 %. |
Abstrakt v dalším jazyce: | Nowadays, speech synthesis is able to produce high-quality synthetic speech. Unit selection method produces very natural speech, but it may suffer from sudden quality drops at concatenation points, which is very disturbing. In this thesis, an automatic speech synthesis error detection system is presented. Firstly, a program for speech analysis is introduced. Then, based on data gathered during listening tests, an SVM is trained. Using this classifier, errors can be labeled automaticaly in any new synthetic speech. Finnally, few experiments were carried out with a success rate between 70-80 %. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Diplomova prace - Jakub Vit.pdf | Plný text práce | 6,11 MB | Adobe PDF | Zobrazit/otevřít |
vit-v.pdf | Posudek vedoucího práce | 437,88 kB | Adobe PDF | Zobrazit/otevřít |
vit-o.pdf | Posudek oponenta práce | 602,58 kB | Adobe PDF | Zobrazit/otevřít |
vit-p.pdf | Průběh obhajoby práce | 204,53 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/7442
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.