Název: Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Další názvy: Optimal data-mining techniques for semi-structured medical data processing
Autoři: Kamburov, Mario
Vedoucí práce/školitel: Klečková Jana, Doc. Dr. Ing.
Oponent: Včelák Petr, Ing.
Datum vydání: 2016
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/23700
Klíčová slova: dolování znalostí;fulltext;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínská data;semistrukturovaná data;weka;couchdb
Klíčová slova v dalším jazyce: datamining;fulltext;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka;lucene;couchdb
Abstrakt: Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází.
Abstrakt v dalším jazyce: The aim of my thesis was to propose a solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of several datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. In my thesis I am using fulltext search based on CouchDB and Apache Lucene for the purpose of medical spell check and text correction. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Kamburov.pdfPlný text práce2,66 MBAdobe PDFZobrazit/otevřít
A13N0064Pposudek-op.PDFPosudek oponenta práce833,25 kBAdobe PDFZobrazit/otevřít
A13N0064Phodnoceni-ved.PDFPosudek vedoucího práce398,37 kBAdobe PDFZobrazit/otevřít
A13N0064Pobhajoba.PDFPrůběh obhajoby práce204,1 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23700

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.