Název: | Segmentace stran rukopisných dokumentů |
Další názvy: | Page Segmentation of Handwritten Documents |
Autoři: | Baloun, Josef |
Vedoucí práce/školitel: | Král Pavel, Doc. Ing. Ph.D. |
Oponent: | Lenc Ladislav, Ing. Ph.D. |
Datum vydání: | 2020 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/41748 |
Klíčová slova: | segmentace;analýza rozvržení;strana;dokument;ručně psané;kronika |
Klíčová slova v dalším jazyce: | segmentation;layout analysis;page;document;handwritten;chronicle |
Abstrakt: | Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada složená ze stran ručně psaných kronik. Dále je navržen prototyp systému pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno váhování chybové funkce a byla automaticky rozšířena trénovací množina. |
Abstrakt v dalším jazyce: | Page layout analysis plays an important role in the process of document retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this thesis, an overview of possible methods for solving this problem is presented and a dataset composed of the pages of handwritten chronicles is created. This thesis also presents a prototype of the system for page layout analysis. The segmentation and classification into text, image and background classes are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved when the prototype was set to the processing of entire pages of documents, the loss function was weighted and the training set was automatically augmented. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
Baloun_Josef_2020_DP.pdf | Plný text práce | 37,81 MB | Adobe PDF | Zobrazit/otevřít |
A18N0044Pposudek-op.PDF | Posudek oponenta práce | 552,29 kB | Adobe PDF | Zobrazit/otevřít |
A18N0044Phodnoceni-ved.pdf | Posudek vedoucího práce | 40,98 kB | Adobe PDF | Zobrazit/otevřít |
A18N0044Pobhajoba.PDF | Průběh obhajoby práce | 386,02 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/41748
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.