Název: Acoustic analysis of czech expressive recordings from a single speaker in terms of various communicative functions
Další názvy: Akustická analýza českých expresivních nahrávek jednoho řečníka z pohledu různých komunikačních funkcí
Autoři: Grůber, Martin
Citace zdrojového dokumentu: GRŮBER, Martin. Acoustic analysis of czech expressive recordings from a single speaker in terms of various communicative functions. In: IEEE international symposium on signal processing and information technology. Vietnam: IEEE Press, 2011, p. 267-272. ISBN 978-1-4673-0753-6.
Datum vydání: 2011
Nakladatel: IEEE Press
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/GruberM_2011_AcousticAnalysisof
http://hdl.handle.net/11025/17191
ISBN: 978-1-4673-0753-6
Klíčová slova: akustická analýza;expresivní syntéza řeči;komunikační funkce
Klíčová slova v dalším jazyce: acoustic analysis;expressive speech synthesis;communication function
Abstrakt: Tato práce popisuje rozsáhlou akustickou analýzu řečových nahrávek, které byly namluveny jednou českou ženskou mluvčí s využitím různých expresivních řečnických stylů. Nahrávání expresivně zabarvených textů bylo provedeno formou dialogu mezi člověkem a počítačem na dané téma. Řeč člověka (mluvčího) byla nahrána a později pečlivě ručně přepsána. Řečové nahrávky také byly anotovány pomocí poslechového testu. Cílem těchto anotací bylo přiřadit každé promluvě odpovídající řečnický styl (tzv. komunikační funkci). Na základě takového označení byly expresivní nahrávky rozděleny do různých skupin a akusticky analyzovány. Zejména jsme kladli důraz na některé rysy, které mají vliv na vnímání řeči, jako F0, doba trvání fonémů, formantové frekvence a RMS energie. Snažili jsme se odhalit některé akustické rozdíly mezi jednotlivými řečnickými styly, které by nám mohly pomoci vylepšit expresivní syntézu řeči v dané omezené oblasti.
Abstrakt v dalším jazyce: This paper presents an extensive acoustic analysis of utterances which were recorded by a single Czech female speaker using various expressive speaking styles. The recording of the expressive utterances was performed as a dialogue between a human and a computer on a given topic. Speech of the human speaker was captured and later carefully transcribed by human annotators. It was also annotated using a listening test. The aim of the annotations was to label each utterance with a corresponding speaking style (referred to as a communicative function). Based on such a labeling, the expressive recordings were classified into various groups and acoustically analyzed. In particular, we placed emphasis on some features which are supposed to influence the perception of speech, such as F0, phoneme duration, formant frequencies or energy. We made an effort to reveal some acoustic differences between the various speaking styles that could help us to improve expressive speech synthesis in a given limited domain.
Práva: © Martin Grůber
Vyskytuje se v kolekcích:Články / Articles (NTIS)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
GruberM_2011_AcousticAnalysisof.pdfPlný text177,8 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/17191

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.