Full metadata record
DC FieldValueLanguage
dc.contributor.advisorMatoušek Jindřich, Doc. Ing. Ph.D.
dc.contributor.authorVladař, Lukáš
dc.contributor.refereeTihelka Daniel, Ing. Ph.D.
dc.date.accepted2023-9-7
dc.date.accessioned2024-01-15T23:11:23Z-
dc.date.available2022-10-1
dc.date.available2024-01-15T23:11:23Z-
dc.date.issued2023
dc.date.submitted2023-8-24
dc.identifier93171
dc.identifier.urihttp://hdl.handle.net/11025/55133-
dc.description.abstractHlavním cílem této práce je popsat, jaký vliv má množství použitých trénovacích dat na kvalitu syntetické řeči generované natrénovaným neurálním syntetizérem a jak lze kvalitu výsledné řeči ovlivnit použitím předtrénovaných neurálních modelů. Teoretická část práce popisuje základní přístupy použitelné pro umělé generování řeči, zvláštní pozornost je věnována především moderním metodám neurální syntézy řeči. Zmíněny jsou také možnosti hodnocení syntetické řeči. V praktické části jsou pak popsány experimenty, které byly provedeny s neurálním modelem VITS. V rámci těchto experimentů byly s využitím poslechových testů a objektivní míry MCD porovnávány modely, které se lišily jednak množstvím dat použitých k jejich natrénování, ale také způsobem inicializace parametrů při trénování.cs
dc.format65
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectsyntéza řečics
dc.subjectttscs
dc.subjectvitscs
dc.subjecttrénovací datacs
dc.subjecttransfer learningcs
dc.subjectposlechové testycs
dc.titleAnalýza velikosti dat pro neurální syntézu řečics
dc.title.alternativeData Size Analysis for Neural Speech Synthesisen
dc.typediplomová práce
dc.thesis.degree-nameIng.
dc.thesis.degree-levelNavazující
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-programAplikované vědy a informatika
dc.description.resultObhájeno
dc.description.abstract-translatedThe aim of this thesis is to describe the impact of the amount of used training data on the quality of the speech generated by a neural synthesizer. Another goal is to answer how the use of pretrained neural models can affect the quality of the final speech. The theoretical part of the thesis covers basic approaches applicable to artificial speech production, the main attention is given especially to modern methods of neural speech synthesis. Furthermore, some options of the synthetic speech evaluation are mentioned. The practical part describes experiments performed on the VITS neural model. During these experiments models trained using different amounts of data and different methods of parameter initialization were compared using listening tests and the MCD objective measure.en
dc.subject.translatedspeech synthesisen
dc.subject.translatedttsen
dc.subject.translatedvitsen
dc.subject.translatedtraining dataen
dc.subject.translatedtransfer learningen
dc.subject.translatedlistening testsen
Appears in Collections:Diplomové práce / Theses (KKY)

Files in This Item:
File Description SizeFormat 
DP_Vladar_Lukas.pdfPlný text práce10,45 MBAdobe PDFView/Open
PosudekOponentaSTAG.pdfPosudek oponenta práce63,46 kBAdobe PDFView/Open
PosudekVedoucihoSTAG.pdfPosudek vedoucího práce63,25 kBAdobe PDFView/Open
Prubeh obhajoby Vladar.pdfPrůběh obhajoby práce83,3 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/55133

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.