Název: Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Další názvy: Optimal data-mining techniques for semi-structured medical data processing
Autoři: Kamburov, Mario
Vedoucí práce/školitel: Klečková Jana, Doc. Dr. Ing.
Oponent: Včelák Petr, Ing.
Datum vydání: 2016
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/23654
Klíčová slova: dolování znalostí;naivní bayes;svm;c4.5;k-nejblížších sousedů;algoritmy;medicínské data;semistrukturovaná data;weka
Klíčová slova v dalším jazyce: datamining;naive bayes;svm;c4.5;k-nearest neighbour;algorithms;medical data;semistructured data;weka
Abstrakt: Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování přirozeného jazyka a několik již implementovaných datamining algoritmů pro klasifikace textů. Je zde popsán princip mnou navrženého řešení, který využívá databáze pro ukládání trénovacích dat. Dále je podrobně popsána implementace v jazyce Java s napojením na databázi MySQL, PostgreSQL a IBM DB2 a provedeno ověření na vybrané kolekci medicínských dat. Na konci jsou pak předloženy obsáhlé statistiky průběhu zpracování a porovnávání získaných výsledků. Závěr obsahuje celkové hodnocení práce s doporučením možných budoucích vylepšení.
Abstrakt v dalším jazyce: The aim of my thesis was to propose solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of natural language processing, and several already implemented datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. The implementation of Java program is also described in detail using MySQL, PostgreSQL, and IBM DB2 databases. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP.pdfPlný text práce1,25 MBAdobe PDFZobrazit/otevřít
A13N0064Pposudek-op.PDFPosudek oponenta práce1,71 MBAdobe PDFZobrazit/otevřít
A13N0064Phodnoceni-ved.PDFPosudek vedoucího práce402,61 kBAdobe PDFZobrazit/otevřít
A13N0064Pobhajoba.PDFPrůběh obhajoby práce224,19 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23654

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.