Full metadata record
DC poleHodnotaJazyk
dc.contributor.authorGruber, Ivan
dc.contributor.authorHlaváč, Miroslav
dc.contributor.authorHrúz, Marek
dc.contributor.authorŽelezný, Miloš
dc.date.accessioned2020-03-09T11:00:22Z-
dc.date.available2020-03-09T11:00:22Z-
dc.date.issued2019
dc.identifier.citationGRUBER, I.., HLAVÁČ, M.., HRÚZ, M.., ŽELEZNÝ, M.. Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network. In Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 142-149. ISBN 978-3-030-26060-6 , ISSN 0302-9743.en
dc.identifier.isbn978-3-030-26060-6
dc.identifier.issn0302-9743
dc.identifier.uri2-s2.0-85071504871
dc.identifier.urihttp://hdl.handle.net/11025/36618
dc.description.abstractTento článek prezentuje metodu semantické segmentace znaků ve full-textových dokumentů z období poválečného Československa. Naneštěstí, standardní OCR algoritmy mají problémy s přesným čtením těchto dokumentů vzhledem k jejich zašumění. Z tohoto důvodu jsme se rozhodli vyvinout metodu, která by zlepšila tyto nespokojivé výsledky. Náš přístup, inspirován U-Net architekturou, je založen na plně-konvolučních neuronových sítích. Využíváme generátor syntetických obrázků pro získání trénovacího setu pro naši metodu. Dosáhli jsme přesnosti rozpoznávání 99.53% pro tato syntetická data. Pro reálná data jsou poskytnuty kvalitativní výsledky.cs
dc.format8 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesSpeech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedingsen
dc.rightsPlný text není přístupný.cs
dc.rights© Springeren
dc.subjectrozpoznávání znaků, segmentace, OCR, strojové učení, generování obrázků, počítačové viděnícs
dc.titleSemantic Segmentation of Historical Documents via Fully-Convolutional Neural Networken
dc.title.alternativeSemantická segmentace historických dokumentů pomocí plně-konvolučních neuronových sítícs
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.rights.accessclosedAccessen
dc.type.versionpublishedVersionen
dc.description.abstract-translatedThis paper presents a method for character semantic segmentation in full-text documents from post World War II Czechoslovakia. Unfortunately, standard optical character recognition algorithms have problems to accurately read these documents due to their noisy nature. Therefore we were looking for some ways to improve these unsatisfactory results. Our approach is based on fully-convolutional neural network inspired by U-Net architecture. We are utilizing a synthetic image generator for obtaining a training set for our method. We reached 99.53% recognition accuracy for synthetic data. For real data, we are providing qualitative results.en
dc.subject.translatedcharacter recognition, segmentation, OCR, mechine learning, generating images, computer visionen
dc.identifier.doi10.1007/978-3-030-26061-3_15
dc.type.statusPeer-revieweden
dc.identifier.obd43927269
dc.project.IDDG16P02B048/Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimůcs
Vyskytuje se v kolekcích:Konferenční příspěvky / Conference Papers (KKY)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
Gruber2019_Chapter_SemanticSegmentationOfHistoric.pdf422,66 kBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/36618

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD