Název: Parameterization of the input in training the HVS semantic parser
Další názvy: Parametrizace vstupu při trénování HVS sémantického parseru
Autoři: Švec, Jan
Jurčíček, Filip
Müller, Luděk
Citace zdrojového dokumentu: ŠVEC, Jan; JURČÍČEK, Filip; MÜLLER, Luděk. Parameterization of the input in training the HVS semantic parser. In: Text, speech nad dialoque. Berlin: Springer, 2007, p. 415-422. (Lecture notes in computer science; 4629). ISBN 978-3-540-74627-0.
Datum vydání: 2007
Nakladatel: Springer
Typ dokumentu: článek
article
URI: http://www.kky.zcu.cz/cs/publications/SvecJ_2007_Parameterizationof
http://hdl.handle.net/11025/16971
ISBN: 978-3-540-74627-0
Klíčová slova: sémantické parsování;model se skrytým stavovým vektorem;porozumění řeči
Klíčová slova v dalším jazyce: semantic parsing;hidden vector state model;language understanding
Abstrakt: Cílem tohoto článku je popis rozšíření původního sémantického parseru se skrytým stavovým vektorem. Nejprve je popsáno statistické sémantické parsování a jeho dekompozice na sémantický a lexikální model. Následně popisujeme původní parser se skrytým stavovým vektorem. Poté popisujeme modifikaci jeho lexikálního modelu tak, že je možné na vstupu parseru použít posloupnost příznakových vektorů namísto posloupnosti slov. Příznakové vektory vytváříme na základě automaticky generovaných lingvistických příznaků (lemma a morfologická značka původního slova). Rovněž popisujeme vliv zahrnutí původního slova do příznakového vektoru. Na závěr práce vyhodnocujeme modifikovaný sémantický parser na českém korpusu obsahujícím dialogy týkající se příjezdů a odjezdů vlaků. Přesnost sémantického parseru vzrostla statisticky významným způsobem v porovnání s výchozím systémem – původním parserem se skrytým stavovým vektorem.
Abstrakt v dalším jazyce: The aim of this paper is to present an extension of the hidden vector state semantic parser. First, we describe the statistical semantic parsing and its decomposition into the semantic and the lexical model. Subsequently, we present the original hidden vector state parser. Then, we modify its lexical model so that it supports the use of the input sequence of feature vectors instead of the sequence of words. We compose the feature vector from the automatically generated linguistic features (lemma form and morphological tag of the original word). We also examine the effect of including the original word into the feature vector. Finally, we evaluate the modified semantic parser on the Czech Human-Human train timetable corpus. We found that the performance of the semantic parser improved significantly compared with the baseline hidden vector state parser.
Práva: © Jan Švec - Filip Jurčíček - Luděk Müller
Vyskytuje se v kolekcích:Články / Articles (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
SvecJ_2007_Parameterizationof.pdfPlný text161,79 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/16971

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.