Název: Text Line Segmentation in Historical Newspapers
Další názvy: Segmentace řádek textu v historických novinách
Autoři: Lenc, Ladislav
Martínek, Jiří
Král, Pavel
Citace zdrojového dokumentu: LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743
Datum vydání: 2022
Nakladatel: Springer Nature Switzerland AG
Typ dokumentu: konferenční příspěvek
ConferenceObject
URI: 2-s2.0-85149639546
http://hdl.handle.net/11025/54900
ISBN: 978-3-031-23479-8
ISSN: 0302-9743
Klíčová slova: segmentace obrazových dokumentů;analýza rozložení stránky;plně konvoluční neuronové sítě;FCN
Klíčová slova v dalším jazyce: document image segmentation;layout analysis;fully convolutional network;FCN
Abstrakt: Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely.
Abstrakt v dalším jazyce: The paper deals with text line segmentation in historical newspapers. We propose a novel approach which decomposes this problem into two steps: text-block and text-line segmentation. The method should solve issues that may appear in a more commonly used one-step approach. The particular tasks are handled using fully convolutional neural networks. The approach is evaluated on two standard corpora, Europeana and RDCL 2019, and on a novel dataset created from data available in Porta fontium portal. This dataset is freely available for research purposes.
Práva: Plný text je přístupný v rámci univerzity přihlášeným uživatelům
© The Author(s)
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference papers (NTIS)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
978-3-031-23480-4_3.pdf291,32 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/54900

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD