Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorKlečková Jana, Doc. Dr. Ing.
dc.contributor.authorKamburov, Mario
dc.contributor.refereeVčelák Petr, Ing.
dc.date.accepted2016-9-6
dc.date.accessioned2017-02-21T08:28:14Z-
dc.date.available2016-6-14
dc.date.available2017-02-21T08:28:14Z-
dc.date.issued2016
dc.date.submitted2016-8-10
dc.identifier69730
dc.identifier.urihttp://hdl.handle.net/11025/23700
dc.description.abstractCílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází.cs
dc.format100 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectdolování znalostícs
dc.subjectfulltextcs
dc.subjectnaivní bayescs
dc.subjectsvmcs
dc.subjectc4.5cs
dc.subjectk-nejblížších sousedůcs
dc.subjectalgoritmycs
dc.subjectmedicínská datacs
dc.subjectsemistrukturovaná datacs
dc.subjectwekacs
dc.subjectcouchdbcs
dc.titleOptimální metody dataminingu pro zpracování semistrukturovaných medicínských datcs
dc.title.alternativeOptimal data-mining techniques for semi-structured medical data processingen
dc.typediplomová prácecs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-programInženýrská informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe aim of my thesis was to propose a solution and to create a program that would allow correction of medical texts on the basis of a very large and diverse semistructured data from medical reports. The work describes the theoretical possibilities of several datamining algorithms for text classification. There is described the principle of my proposed solution, which uses a database to store the training data. In my thesis I am using fulltext search based on CouchDB and Apache Lucene for the purpose of medical spell check and text correction. The verification was applied to a selected collection of medical data. At the end there are comprehensive statistics of the data processing and comparing the obtained results. Conclusion contains an overall assessment of the work with recommendations for possible future improvements.en
dc.subject.translateddataminingen
dc.subject.translatedfulltexten
dc.subject.translatednaive bayesen
dc.subject.translatedsvmen
dc.subject.translatedc4.5en
dc.subject.translatedk-nearest neighbouren
dc.subject.translatedalgorithmsen
dc.subject.translatedmedical dataen
dc.subject.translatedsemistructured dataen
dc.subject.translatedwekaen
dc.subject.translatedluceneen
dc.subject.translatedcouchdben
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Kamburov.pdfPlný text práce2,66 MBAdobe PDFZobrazit/otevřít
A13N0064Pposudek-op.PDFPosudek oponenta práce833,25 kBAdobe PDFZobrazit/otevřít
A13N0064Phodnoceni-ved.PDFPosudek vedoucího práce398,37 kBAdobe PDFZobrazit/otevřít
A13N0064Pobhajoba.PDFPrůběh obhajoby práce204,1 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/23700

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.