Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorSkorkovská, Lucie
dc.contributor.authorIrcing, Pavel
dc.contributor.authorPražák, Aleš
dc.contributor.authorLehečka, Jan
dc.date.accessioned2015-12-14T08:12:04Z
dc.date.available2015-12-14T08:12:04Z
dc.date.issued2011
dc.identifier.citationSKORKOVSKÁ, Lucie; IRCING, Pavel; PRAŽÁK, Aleš; LEHEČKA, Jan. Automatic topic identification for large scale language modeling data filtering. In:Text, speech and dialogue. Berlin: Springer, 2011, p. 64-71. (Lecture notes in computer science; 6836). ISBN 978-3-642-23537-5.en
dc.identifier.isbn978-3-642-23537-5
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/SkorkovskaL_2011_AutomaticTopic
dc.identifier.urihttp://hdl.handle.net/11025/16984
dc.description.abstractTento článek představuje modul pro identifikaci tématu, který je součástí komplexního systému pro získávání, zpracování a ukládání velkého množství textových dat z webových stránek. Modul zpracovává získaná data a přiřazuje jim klíčová slova z hierarchie témat, která byla vytvořena pro tyto účely. Kvalita identifikace tématu je vyhodnocena dvěma způsoby - za použití klasických měr přesnosti a úplnosti, ale také nepřímo, měřením úspěšnosti ASR systému s použitím tématicky orientovaných jazykových modelů vytvořených z takto automaticky filtrovaných dat.cs
dc.format8 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesLecture notes in computer science; 6836en
dc.rights© Lucie Skorkovská - Pavel Ircing - Aleš Pražák - Jan Lehečkacs
dc.subjectidentifikace tématucs
dc.subjectjazykové modelovánícs
dc.subjectautomatické rozpoznávání řečics
dc.titleAutomatic topic identification for large scale language modeling data filteringen
dc.title.alternativeAutomatická identifikace tématu pro filtraci velkého množství dat pro jazykové modelovánícs
dc.typečlánekcs
dc.typearticleen
dc.rights.accessopenAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThe paper presents a module for topic identification that is embedded into a complex system for acquisition and storing large volumes of text data from the Web. The module processes each of the acquired data items and assigns keywords to them from a defined topic hierarchy that was developed for this purposes and is also described in the paper. The quality of the topic identification is evaluated in two ways - using classic precision-recall measures and also indirectly, by measuring the ASR performance of the topic-specific language models that are built using the automatically filtered data.en
dc.subject.translatedtopic identificationen
dc.subject.translatedlanguage modellingen
dc.subject.translatedautomatic speech recognitionen
dc.type.statusPeer-revieweden
Vyskytuje se v kolekcích:Články / Articles (KKY)
Články / Articles (NTIS)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
SkorkovskaL_2011_AutomaticTopic.pdfPlný text172,9 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/16984

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.