Název: | Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat |
Další názvy: | Optimal data-mining techniques for semi-structured medical data processing |
Autoři: | Kamburov, Mario |
Vedoucí práce/školitel: | Klečková Jana, Doc. Dr. Ing. |
Oponent: | Včelák Petr, Ing. |
Datum vydání: | 2016 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/23700 |
Klíčová slova: | dolování znalostí;fulltext;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínská data;semistrukturovaná data;weka;couchdb |
Klíčová slova v dalším jazyce: | datamining;fulltext;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka;lucene;couchdb |
Abstrakt: | Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází. |
Abstrakt v dalším jazyce: | The aim of my thesis was to propose a solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of several datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. In my thesis I am using fulltext search based on CouchDB and Apache Lucene for the purpose of medical spell check and text correction. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DP_Kamburov.pdf | Plný text práce | 2,66 MB | Adobe PDF | Zobrazit/otevřít |
A13N0064Pposudek-op.PDF | Posudek oponenta práce | 833,25 kB | Adobe PDF | Zobrazit/otevřít |
A13N0064Phodnoceni-ved.PDF | Posudek vedoucího práce | 398,37 kB | Adobe PDF | Zobrazit/otevřít |
A13N0064Pobhajoba.PDF | Průběh obhajoby práce | 204,1 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/23700
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.