Název: | Analýza a segmentace historických obrazových dokumentů |
Další názvy: | Analysis and segmentation of historical document images |
Autoři: | Treml, Filip |
Vedoucí práce/školitel: | Lenc Ladislav, Ing. Ph.D. |
Oponent: | Král Pavel, Doc. Ing. Ph.D. |
Datum vydání: | 2022 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | bakalářská práce |
URI: | http://hdl.handle.net/11025/49352 |
Klíčová slova: | segmentace;síť;neuronová síť;konvoluční neuronová síť;plně konvoluční neuronová síť;unet;u-net;aru-net;arunet;page;anotace;separátor;maska;predikce;obrazový dokument;dataset;europeana;porta fontium;layout evaluation;tensorflow;keras |
Klíčová slova v dalším jazyce: | segmentation;network;neural network;convolution neural network;fully convolution neural network;unet;u-net;aru-net;arunet;page;annotation;separator;mask;prediction;image document;dataset;europeana;porta fontium;layout evaluation;tensorflow;keras |
Abstrakt: | Proces segmentace historických obrazových dokumentů je klíčový pro jejich následné převedení do textové podoby. Cílem segmentačního procesu je nalezení oblastí, které obsahují text a jejich uložení do PAGE xml, obsahující veškeré důležité informace o konkrétní stránce dokumentu. Segmentační proces je složen z mnoha kroků. S využitím plně propojených konvolučních neuronových sítí UNet a AruNet, vytvoříme predikované masky oblastí zájmu a oddělovačů jednotlivých částí. V rámci bakalářské práce budou provedeny experimenty s cílem nalézt vhodné parametry neuronových sítí. Dále bude implementováno rozšíření, které umožní odlišit typy textových oblastí a také lépe oddělit jednotlivé odstavce. |
Abstrakt v dalším jazyce: | Segmentation process of historical document images is important for their conversion into text form. The goal of segmentation process is find areas containing text and save them into a PAGE xml file, which contains all important information about the specific page of the document. Segmentation process consists of many steps. With fully convolution neural networks UNet and Arunet, we create predication masks of areas of interest and separators. As a part of this bachelor thesis, experiments that help to find appropriate parameters of the neural networks will be carried out.The next step will be to implement an extension, which will make it possible to distinguish the types of text blocks and also better separate specific paragraphs. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Bakalářské práce / Bachelor´s works (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
A17B0378P_Treml_Filip_BP.pdf | Plný text práce | 17,51 MB | Adobe PDF | Zobrazit/otevřít |
A17B0378P_Hodnoceni.pdf | Posudek vedoucího práce | 186,18 kB | Adobe PDF | Zobrazit/otevřít |
A17B0378P_Posudek.pdf | Posudek oponenta práce | 38,89 kB | Adobe PDF | Zobrazit/otevřít |
A17B0378P_obhajoba.pdf | Průběh obhajoby práce | 70,18 kB | Adobe PDF | Zobrazit/otevřít |
Zadani_Treml.pdf | VŠKP - příloha | 112,54 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/49352
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.