Initial Experiments on Question Answering from the Intrinsic Structure of Oral History Archives

Chýlek, Adam; Švec, Jan; Šmídl, Luboš

Název:	Initial Experiments on Question Answering from the Intrinsic Structure of Oral History Archives
Další názvy:	Počáteční experimenty s metodami odpovídání na otázky získané z vnitřní struktury archivů orální historie
Autoři:	Chýlek, Adam Švec, Jan Šmídl, Luboš
Citace zdrojového dokumentu:	CHÝLEK, A. ŠVEC, J. ŠMÍDL, L. Initial Experiments on Question Answering from the Intrinsic Structure of Oral History Archives. In 23rd International Conference, SPECOM 2021, St. Petersburg, Russia, September 27–30, 2021, Proceedings. Cham: Springer, 2021. s. 124-133. ISBN: 978-3-030-87801-6 , ISSN: 0302-9743
Datum vydání:	2021
Nakladatel:	Springer
Typ dokumentu:	konferenční příspěvek ConferenceObject
URI:	2-s2.0-85116382673 http://hdl.handle.net/11025/47253
ISBN:	978-3-030-87801-6
ISSN:	0302-9743
Klíčová slova:	odpovídání na otázky;datové sady;transfromery;archiv MALACH
Klíčová slova v dalším jazyce:	Question answering;Datasets;Transformers;The MALACH archive
Abstrakt:	Velké zvukové archivy s mluveným obsahem jsou přirozenými kandidáty pro systémy odpovídající na otázky. Archivy orální historie obecně obsahují mnoho faktů a příběhů, které by bylo jinak těžké získat bez poslechu mnoha hodin nahrávek. Snažíme se učinit archiv přístupnějším tím, že umožňujeme hledat odpovědi na otázky položené v přirozeném jazyce. V tomto článku popisujeme výzvy, které naše datová sada představuje. Navrhujeme náš počáteční přístup, který využívá otázky a odpovědi získané ze samotného archivu a hodnotíme výkon v experimentech s modely s předem natrénovanou jazykovou reprezentací a s předtrénovanými modely odpovědí na otázky.
Abstrakt v dalším jazyce:	Large audio archives with spoken content are natural candidates for question answering systems. Oral history archives generally contain many facts and stories that would be otherwise hard to obtain without listening to hours of recordings. We strive for making the archive more accessible by allowing natural language question answering. In this paper, we present challenges our dataset poses. We propose our initial approach that uses questions and answers mined from the archive itself and evaluate the performance in experiments with pretrained language representation and question answering models.
Práva:	Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © Springer
Vyskytuje se v kolekcích:	Konferenční příspěvky / Conference Papers (KKY) OBD

Soubory připojené k záznamu:

Soubor	Velikost	Formát
Chýlek2021_Chapter_InitialExperimentsOnQuestionAn.pdf	208,69 kB	Adobe PDF	Zobrazit/otevřít Vyžádat kopii

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/47253

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace