Název: | Parameterization of the input in training the HVS semantic parser |
Další názvy: | Parametrizace vstupu při trénování HVS sémantického parseru |
Autoři: | Švec, Jan Jurčíček, Filip Müller, Luděk |
Citace zdrojového dokumentu: | ŠVEC, Jan; JURČÍČEK, Filip; MÜLLER, Luděk. Parameterization of the input in training the HVS semantic parser. In: Text, speech nad dialoque. Berlin: Springer, 2007, p. 415-422. (Lecture notes in computer science; 4629). ISBN 978-3-540-74627-0. |
Datum vydání: | 2007 |
Nakladatel: | Springer |
Typ dokumentu: | článek article |
URI: | http://www.kky.zcu.cz/cs/publications/SvecJ_2007_Parameterizationof http://hdl.handle.net/11025/16971 |
ISBN: | 978-3-540-74627-0 |
Klíčová slova: | sémantické parsování;model se skrytým stavovým vektorem;porozumění řeči |
Klíčová slova v dalším jazyce: | semantic parsing;hidden vector state model;language understanding |
Abstrakt: | Cílem tohoto článku je popis rozšíření původního sémantického parseru se skrytým stavovým vektorem. Nejprve je popsáno statistické sémantické parsování a jeho dekompozice na sémantický a lexikální model. Následně popisujeme původní parser se skrytým stavovým vektorem. Poté popisujeme modifikaci jeho lexikálního modelu tak, že je možné na vstupu parseru použít posloupnost příznakových vektorů namísto posloupnosti slov. Příznakové vektory vytváříme na základě automaticky generovaných lingvistických příznaků (lemma a morfologická značka původního slova). Rovněž popisujeme vliv zahrnutí původního slova do příznakového vektoru. Na závěr práce vyhodnocujeme modifikovaný sémantický parser na českém korpusu obsahujícím dialogy týkající se příjezdů a odjezdů vlaků. Přesnost sémantického parseru vzrostla statisticky významným způsobem v porovnání s výchozím systémem – původním parserem se skrytým stavovým vektorem. |
Abstrakt v dalším jazyce: | The aim of this paper is to present an extension of the hidden vector state semantic parser. First, we describe the statistical semantic parsing and its decomposition into the semantic and the lexical model. Subsequently, we present the original hidden vector state parser. Then, we modify its lexical model so that it supports the use of the input sequence of feature vectors instead of the sequence of words. We compose the feature vector from the automatically generated linguistic features (lemma form and morphological tag of the original word). We also examine the effect of including the original word into the feature vector. Finally, we evaluate the modified semantic parser on the Czech Human-Human train timetable corpus. We found that the performance of the semantic parser improved significantly compared with the baseline hidden vector state parser. |
Práva: | © Jan Švec - Filip Jurčíček - Luděk Müller |
Vyskytuje se v kolekcích: | Články / Articles (KKY) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
SvecJ_2007_Parameterizationof.pdf | Plný text | 161,79 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/16971
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.