Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat

Kamburov, Mario

Název:	Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Další názvy:	Optimal data-mining techniques for semi-structured medical data processing
Autoři:	Kamburov, Mario
Vedoucí práce/školitel:	Klečková Jana, Doc. Dr. Ing.
Oponent:	Včelák Petr, Ing.
Datum vydání:	2016
Nakladatel:	Západočeská univerzita v Plzni
Typ dokumentu:	diplomová práce
URI:	http://hdl.handle.net/11025/23700
Klíčová slova:	dolování znalostí;fulltext;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínská data;semistrukturovaná data;weka;couchdb
Klíčová slova v dalším jazyce:	datamining;fulltext;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka;lucene;couchdb
Abstrakt:	Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází.
Abstrakt v dalším jazyce:	The aim of my thesis was to propose a solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of several datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. In my thesis I am using fulltext search based on CouchDB and Apache Lucene for the purpose of medical spell check and text correction. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.
Práva:	Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:	Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
DP_Kamburov.pdf	Plný text práce	2,66 MB	Adobe PDF	Zobrazit/otevřít
A13N0064Pposudek-op.PDF	Posudek oponenta práce	833,25 kB	Adobe PDF	Zobrazit/otevřít
A13N0064Phodnoceni-ved.PDF	Posudek vedoucího práce	398,37 kB	Adobe PDF	Zobrazit/otevřít
A13N0064Pobhajoba.PDF	Průběh obhajoby práce	204,1 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23700

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace