Generování obrazových dat pro účely trénování hlubokých neuronových sítí

Andrlík, Pavel

Název:	Generování obrazových dat pro účely trénování hlubokých neuronových sítí
Další názvy:	Image data generation for the purpose of deep neural network training
Autoři:	Andrlík, Pavel
Vedoucí práce/školitel:	Hrúz Marek, Ing. Ph.D.
Oponent:	Neduchal Petr, Ing.
Datum vydání:	2020
Nakladatel:	Západočeská univerzita v Plzni
Typ dokumentu:	bakalářská práce
URI:	http://hdl.handle.net/11025/41862
Klíčová slova:	generování dat;syntetická data;rozpoznávání textu;zpravodajské relace;neuronové sítě;obrazová data
Klíčová slova v dalším jazyce:	data generation;synthetic data;text recognition;news sessions;neural network;image data
Abstrakt:	Cílem bakalářské práce je vytvoření a implementace algoritmu pro generování obrázků s texty, imitující texty zpravodajských relací. Tyto obrázky budou následně sloužit pro trénování umělých neuronových sítí pro rozpoznávání textů v obraze. V první části práce jsou analyzovány zpravodajské relace, respektive je zjišťována struktura a rozložení obrazových dat. Dále jsou analyzovány používané texty a znaky včetně používaných fontů. Zjišťováno je také, jaká se nejčastěji objevují slova, speciální nebo v běžném jazyce neobvyklé znaky a symboly a kombinace těchto neobvyklých znaků s používanými slovy nebo druhy textů, jako jsou například jména, místa, povolání, politické strany a podobně. V druhé části se zabývám konkrétním návrhem algoritmu, jeho zobecněním pro možnost použití u různých stanic provozujících zpravodajské relace a v poslední řadě jeho implementací v konkrétním programovacím jazyce. V poslední části je experimentálně ověřena kvalita dosažených výsledků. Jaccardův index (také IoU) rozpoznaných oblastí s textem s použitím stávající natrénované sítě je průměrně 0,7. Dále jsou tyto výsledky diskutovány a podrobněji rozebrány. Úplně na závěr je diskutováno navrhnutí možných vylepšení a budoucí práce navázané na tuto práci.
Abstrakt v dalším jazyce:	The purpose of this bachelor thesis is to create and implement an algorithm for generating images with texts imitating the texts of news sessions. These images will be used to train artificial neural networks for text-in-image recognition. In the first part of the work, the news sessions are analyzed, more precisely the structure and distribution of image data is discovered. In addition to, the used texts and characters, including the used fonts, are analyzed. Ascertained are also the most common words, special or unusual characters and symbols in common language, and combinations of these unusual characters with words or types of text used, such as names, places, professions, political parties, and so on. The second part is focused on a specific design of the algorithm, its generalization for the possibility of using for various news sessions and finally its implementation in a specific programming language. In the last part, the quality of the achieved results is experimentally verified. The Jaccard index (also IoU) of recognized areas with text using the existing trained network is on average 0.7. These results are then discussed and examined. Finally, the proposal of possible improvements and future work related to this work is discussed.
Práva:	Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KKY)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
BP Pavel Andrlik.pdf	Plný text práce	3,63 MB	Adobe PDF	Zobrazit/otevřít
andrlik-p.pdf	Průběh obhajoby práce	305,47 kB	Adobe PDF	Zobrazit/otevřít
andrlik-v.pdf	Posudek vedoucího práce	688,1 kB	Adobe PDF	Zobrazit/otevřít
andrlik-o.pdf	Posudek oponenta práce	757,56 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/41862

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace