Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network

Gruber, Ivan; Hlaváč, Miroslav; Hrúz, Marek; Železný, Miloš

Full metadata record

DC pole	Hodnota	Jazyk
dc.contributor.author	Gruber, Ivan
dc.contributor.author	Hlaváč, Miroslav
dc.contributor.author	Hrúz, Marek
dc.contributor.author	Železný, Miloš
dc.date.accessioned	2020-03-09T11:00:22Z	-
dc.date.available	2020-03-09T11:00:22Z	-
dc.date.issued	2019
dc.identifier.citation	GRUBER, I.., HLAVÁČ, M.., HRÚZ, M.., ŽELEZNÝ, M.. Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network. In Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 142-149. ISBN 978-3-030-26060-6 , ISSN 0302-9743.	en
dc.identifier.isbn	978-3-030-26060-6
dc.identifier.issn	0302-9743
dc.identifier.uri	2-s2.0-85071504871
dc.identifier.uri	http://hdl.handle.net/11025/36618
dc.description.abstract	Tento článek prezentuje metodu semantické segmentace znaků ve full-textových dokumentů z období poválečného Československa. Naneštěstí, standardní OCR algoritmy mají problémy s přesným čtením těchto dokumentů vzhledem k jejich zašumění. Z tohoto důvodu jsme se rozhodli vyvinout metodu, která by zlepšila tyto nespokojivé výsledky. Náš přístup, inspirován U-Net architekturou, je založen na plně-konvolučních neuronových sítích. Využíváme generátor syntetických obrázků pro získání trénovacího setu pro naši metodu. Dosáhli jsme přesnosti rozpoznávání 99.53% pro tato syntetická data. Pro reálná data jsou poskytnuty kvalitativní výsledky.	cs
dc.format	8 s.	cs
dc.format.mimetype	application/pdf
dc.language.iso	en	en
dc.publisher	Springer	en
dc.relation.ispartofseries	Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings	en
dc.rights	Plný text není přístupný.	cs
dc.rights	© Springer	en
dc.subject	rozpoznávání znaků, segmentace, OCR, strojové učení, generování obrázků, počítačové vidění	cs
dc.title	Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network	en
dc.title.alternative	Semantická segmentace historických dokumentů pomocí plně-konvolučních neuronových sítí	cs
dc.type	konferenční příspěvek	cs
dc.type	conferenceObject	en
dc.rights.access	closedAccess	en
dc.type.version	publishedVersion	en
dc.description.abstract-translated	This paper presents a method for character semantic segmentation in full-text documents from post World War II Czechoslovakia. Unfortunately, standard optical character recognition algorithms have problems to accurately read these documents due to their noisy nature. Therefore we were looking for some ways to improve these unsatisfactory results. Our approach is based on fully-convolutional neural network inspired by U-Net architecture. We are utilizing a synthetic image generator for obtaining a training set for our method. We reached 99.53% recognition accuracy for synthetic data. For real data, we are providing qualitative results.	en
dc.subject.translated	character recognition, segmentation, OCR, mechine learning, generating images, computer vision	en
dc.identifier.doi	10.1007/978-3-030-26061-3_15
dc.type.status	Peer-reviewed	en
dc.identifier.obd	43927269
dc.project.ID	DG16P02B048/Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimů	cs
Vyskytuje se v kolekcích:	Konferenční příspěvky / Conference Papers (KKY) OBD

Soubory připojené k záznamu:

Soubor	Velikost	Formát
Gruber2019_Chapter_SemanticSegmentationOfHistoric.pdf	422,66 kB	Adobe PDF	Zobrazit/otevřít Vyžádat kopii

Zobrazit minimální záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36618

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace