Title: Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network
Other Titles: Semantická segmentace historických dokumentů pomocí plně-konvolučních neuronových sítí
Authors: Gruber, Ivan
Hlaváč, Miroslav
Hrúz, Marek
Železný, Miloš
Citation: GRUBER, I.., HLAVÁČ, M.., HRÚZ, M.., ŽELEZNÝ, M.. Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network. In Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 142-149. ISBN 978-3-030-26060-6 , ISSN 0302-9743.
Issue Date: 2019
Publisher: Springer
Document type: konferenční příspěvek
conferenceObject
URI: 2-s2.0-85071504871
http://hdl.handle.net/11025/36618
ISBN: 978-3-030-26060-6
ISSN: 0302-9743
Keywords: rozpoznávání znaků, segmentace, OCR, strojové učení, generování obrázků, počítačové vidění
Keywords in different language: character recognition, segmentation, OCR, mechine learning, generating images, computer vision
Abstract: Tento článek prezentuje metodu semantické segmentace znaků ve full-textových dokumentů z období poválečného Československa. Naneštěstí, standardní OCR algoritmy mají problémy s přesným čtením těchto dokumentů vzhledem k jejich zašumění. Z tohoto důvodu jsme se rozhodli vyvinout metodu, která by zlepšila tyto nespokojivé výsledky. Náš přístup, inspirován U-Net architekturou, je založen na plně-konvolučních neuronových sítích. Využíváme generátor syntetických obrázků pro získání trénovacího setu pro naši metodu. Dosáhli jsme přesnosti rozpoznávání 99.53% pro tato syntetická data. Pro reálná data jsou poskytnuty kvalitativní výsledky.
Abstract in different language: This paper presents a method for character semantic segmentation in full-text documents from post World War II Czechoslovakia. Unfortunately, standard optical character recognition algorithms have problems to accurately read these documents due to their noisy nature. Therefore we were looking for some ways to improve these unsatisfactory results. Our approach is based on fully-convolutional neural network inspired by U-Net architecture. We are utilizing a synthetic image generator for obtaining a training set for our method. We reached 99.53% recognition accuracy for synthetic data. For real data, we are providing qualitative results.
Rights: Plný text není přístupný.
© Springer
Appears in Collections:Konferenční příspěvky / Conference Papers (KKY)
OBD

Files in This Item:
File SizeFormat 
Gruber2019_Chapter_SemanticSegmentationOfHistoric.pdf422,66 kBAdobe PDFView/Open    Request a copy


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/36618

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

search
navigation
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD