Title: Structural metadata annotation: moving beyond english
Other Titles: Anotace strukturálních metadat: za hranice angličtiny
Authors: Strassel, Stephanie
Kolář, Jáchym
Song, Zhiyi
Barclay, Leila
Glenn, Meghan
Issue Date: 2005
Publisher: ISCA
Document type: článek
URI: http://www.kky.zcu.cz/cs/publications/StrasselS_2005_Structuralmetadata
ISSN: 1990-9772
Keywords: MDE;speech-to-text
Keywords in different language: MDE;speech-to-text
Abstract: Cílem extrakce metadat (MDE) je vyvinout technologii, která výstup ze "speech-to-text" systému automaticky zpracuje do formy, která je vhodnější pro následné zpracování. Roku 2003 byl úkol anotace strukturálních metadat v řeči definován pro angličtinu v rámci projektu DARPA EARS. Významnou výzvou je přidání nových jazyků. Tento článek popisuje snahu aplikovat MDE anotaci na data ve 3 velmi rozdílných jazycích: mandarinské čínštině, levantské arabštině a hovorové češtině.
Abstract in different language: The goal of metadata extraction (MDE) is to enable technology that can take raw speech-to-text output and refine it into forms that are more useful to humans and to downstream automatic processes. Starting in 2003, a structural metadata annotation task was defined for English as part of the DARPA EARS Program. A significant challenge for MDE is the addition of new languages. This paper reports on work undertaken to apply MDE annotation to data from three very different languages: Mandarin Chinese, Levantine Arabic, and conversational Czech. Details of annotation task modifications are provided for each language, along with a general overview of data and annotation tools for non-English MDE.
Rights: © Stephanie Strassel - Jáchym Kolář - Zhiyi Song - Leila Barclay - Meghan Glenn
