Název: Training Strategies for OCR Systems for Historical Documents
Další názvy: Strategie trénování OCR systému pro historické dokumenty
Autoři: Martínek, Jiří
Lenc, Ladislav
Král, Pavel
Citace zdrojového dokumentu: HRUDA, L., DVOŘÁK, J., VÁŠA, L. On evaluating consensus in RANSAC surface registration. Computer Graphics Forum, 2019, roč. 38, č. 5, s. 175-186. ISSN 1467-8659.
Datum vydání: 2019
Nakladatel: Blackwell Publishing
Typ dokumentu: článek
article
URI: 2-s2.0-85070444843
http://hdl.handle.net/11025/35853
ISSN: 1868-4238
Klíčová slova: Konvoluční neuronová sí;, historické dokumenty;Long Short-Term Memory;Neuronová síť;optické rozpoznávání znaků;syntetická data
Klíčová slova v dalším jazyce: Convolutional Neural Network;Historical documents;Long Short-Term Memory;Neural Network;Optical Character Recognition;Synthetic data
Abstrakt: Tento článek prezentuje přehled trénovacích strategií pro systém optického rozpoznávání znaků v historických dokumentech. Hlavní problém je kvalita anotovaných dat a jejich nedostatek. Dále shrneme několik způsobů vytváření syntetických dat. Hlavním úkolem článku je ukázat a porovnat různé možnosti kombinace syntetických a anotovaných dat pro trénování konvoluční rekurentní neuronové sítě.
Abstrakt v dalším jazyce: Random Sample Consensus is a powerful paradigm that was successfully applied in various contexts, including Location Determination Problem, fundamental matrix estimation and global 3D surface registration, where many previously proposed algorithms can be interpreted as a particular implementation of this concept. In general, a set of candidate transformations is generated by some simple procedure, and an aligning transformation is chosen within this set, such that it aligns the largest portion of the input data. We observe that choosing the aligning transformation may also be interpreted as finding consensus among the candidates, which in turn involves measuring similarity of candidate rigid transformations. While it is not difficult to construct a metric that provides reasonable results, most approaches come with certain limitations and drawbacks. In this paper, we investigate possible means of measuring distances in SE(3) and compare their properties both theoretically and experimentally in a model RANSAC registration algorithm. We also propose modifications to existing measures and propose a novel method of locating the consensus transformation based on Vantage Point Tree data structure.
Práva: Plný text je přístupný v rámci univerzity přihlášeným uživatelům.
© Blackwell Publishing
Vyskytuje se v kolekcích:Články / Articles (NTIS)
Články / Articles (KIV)
OBD

Soubory připojené k záznamu:
Soubor VelikostFormát 
aiai_2019_jiri_Martinek 2.pdf1,52 MBAdobe PDFZobrazit/otevřít  Vyžádat kopii


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/35839

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání
navigace
  1. DSpace at University of West Bohemia
  2. Publikační činnost / Publications
  3. OBD