Název: | Initial Experiments on Question Answering from the Intrinsic Structure of Oral History Archives |
Další názvy: | Počáteční experimenty s metodami odpovídání na otázky získané z vnitřní struktury archivů orální historie |
Autoři: | Chýlek, Adam Švec, Jan Šmídl, Luboš |
Citace zdrojového dokumentu: | CHÝLEK, A. ŠVEC, J. ŠMÍDL, L. Initial Experiments on Question Answering from the Intrinsic Structure of Oral History Archives. In 23rd International Conference, SPECOM 2021, St. Petersburg, Russia, September 27–30, 2021, Proceedings. Cham: Springer, 2021. s. 124-133. ISBN: 978-3-030-87801-6 , ISSN: 0302-9743 |
Datum vydání: | 2021 |
Nakladatel: | Springer |
Typ dokumentu: | konferenční příspěvek ConferenceObject |
URI: | 2-s2.0-85116382673 http://hdl.handle.net/11025/47253 |
ISBN: | 978-3-030-87801-6 |
ISSN: | 0302-9743 |
Klíčová slova: | odpovídání na otázky;datové sady;transfromery;archiv MALACH |
Klíčová slova v dalším jazyce: | Question answering;Datasets;Transformers;The MALACH archive |
Abstrakt: | Velké zvukové archivy s mluveným obsahem jsou přirozenými kandidáty pro systémy odpovídající na otázky. Archivy orální historie obecně obsahují mnoho faktů a příběhů, které by bylo jinak těžké získat bez poslechu mnoha hodin nahrávek. Snažíme se učinit archiv přístupnějším tím, že umožňujeme hledat odpovědi na otázky položené v přirozeném jazyce. V tomto článku popisujeme výzvy, které naše datová sada představuje. Navrhujeme náš počáteční přístup, který využívá otázky a odpovědi získané ze samotného archivu a hodnotíme výkon v experimentech s modely s předem natrénovanou jazykovou reprezentací a s předtrénovanými modely odpovědí na otázky. |
Abstrakt v dalším jazyce: | Large audio archives with spoken content are natural candidates for question answering systems. Oral history archives generally contain many facts and stories that would be otherwise hard to obtain without listening to hours of recordings. We strive for making the archive more accessible by allowing natural language question answering. In this paper, we present challenges our dataset poses. We propose our initial approach that uses questions and answers mined from the archive itself and evaluate the performance in experiments with pretrained language representation and question answering models. |
Práva: | Plný text je přístupný v rámci univerzity přihlášeným uživatelům. © Springer |
Vyskytuje se v kolekcích: | Konferenční příspěvky / Conference Papers (KKY) OBD |
Soubory připojené k záznamu:
Soubor | Velikost | Formát | |
---|---|---|---|
Chýlek2021_Chapter_InitialExperimentsOnQuestionAn.pdf | 208,69 kB | Adobe PDF | Zobrazit/otevřít Vyžádat kopii |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/47253
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.