Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorKlečková Jana, Doc. Dr. Ing.
dc.contributor.authorKamburov, Mario
dc.contributor.refereeVčelák Petr, Ing.
dc.date.accepted2016-6-14
dc.date.accessioned2017-02-21T08:27:51Z-
dc.date.available2014-9-1
dc.date.available2017-02-21T08:27:51Z-
dc.date.issued2016
dc.date.submitted2015-6-25
dc.identifier63047
dc.identifier.urihttp://hdl.handle.net/11025/23654
dc.description.abstractCílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování přirozeného jazyka a několik již implementovaných datamining algoritmů pro klasifikace textů. Je zde popsán princip mnou navrženého řešení, který využívá databáze pro ukládání trénovacích dat. Dále je podrobně popsána implementace v jazyce Java s napojením na databázi MySQL, PostgreSQL a IBM DB2 a provedeno ověření na vybrané kolekci medicínských dat. Na konci jsou pak předloženy obsáhlé statistiky průběhu zpracování a porovnávání získaných výsledků. Závěr obsahuje celkové hodnocení práce s doporučením možných budoucích vylepšení.cs
dc.format73 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectdolování znalostícs
dc.subjectnaivní bayescs
dc.subjectsvmcs
dc.subjectc4.5cs
dc.subjectk-nejblížších sousedůcs
dc.subjectalgoritmycs
dc.subjectmedicínské datacs
dc.subjectsemistrukturovaná datacs
dc.subjectwekacs
dc.titleOptimální metody dataminingu pro zpracování semistrukturovaných medicínských datcs
dc.title.alternativeOptimal data-mining techniques for semi-structured medical data processingen
dc.typediplomová prácecs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultNeobhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe aim of my thesis was to propose solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of natural language processing, and several already implemented datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. The implementation of Java program is also described in detail using MySQL, PostgreSQL, and IBM DB2 databases. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.en
dc.subject.translateddataminingen
dc.subject.translatednaive bayesen
dc.subject.translatedsvmen
dc.subject.translatedc4.5en
dc.subject.translatedk-nearest neighbouren
dc.subject.translatedalgorithmsen
dc.subject.translatedmedical dataen
dc.subject.translatedsemistructured dataen
dc.subject.translatedwekaen
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP.pdfPlný text práce1,25 MBAdobe PDFZobrazit/otevřít
A13N0064Pposudek-op.PDFPosudek oponenta práce1,71 MBAdobe PDFZobrazit/otevřít
A13N0064Phodnoceni-ved.PDFPosudek vedoucího práce402,61 kBAdobe PDFZobrazit/otevřít
A13N0064Pobhajoba.PDFPrůběh obhajoby práce224,19 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23654

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.