Název: Koncept Data Lakehouse pro zpracování medicínských dat
Další názvy: Data Lakehouse concept for medical data processing
Autoři: Moučka, Lukáš
Vedoucí práce/školitel: Klečková Jana, Doc. Dr. Ing.
Oponent: Kryl Martin, Ing.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/53730
Klíčová slova: medicínská data;koncept úložiště;data lakehouse;delta lake;mre platforma;dasta;res-q;dicom;hl7;etl;elt;fair data
Klíčová slova v dalším jazyce: medical data;the concept of storage;data lakehouse;delta lake;medical research and education platform;dasta;res-q;dicom;hl7;etl;elt;fair data
Abstrakt: Diplomová práce se zabývá problematikou nového typu úložiště Data Lakehouse, které je koncipováno pro ukládání heterogenních dat. V teoretické části je zmíněna evoluce jednotlivých typů úložišť a zevrubně je popisuje. Hlavním cílem je ukládat medicínské záznamy do tohoto typu úložiště a následně s nimi pracovat. Toto aktuálně řeší MRE platforma, která je vyvíjena a provozována na FAV ZČU. Pro ověření vhodnosti úložiště pro oblast medicínských dat byla vyvinuta aplikace, která implementuje úložiště Data Lakehouse za pomocí open-source projektu Delta Lake. První část aplikace tvoří administrace, která poskytuje kompletní správu uživatelů a obsahuje sekce zajišťující správu úložiště. Druhou část tvoří úložiště a skrze REST API poskytuje veškeré funkce pro jeho správu. Výsledné testování aplikace ukazuje vhodnost použití úložiště pro medicínská data. Na základě testování jsou popsány i náměty pro případná zlepšení a rozšíření stávající práce.
Abstrakt v dalším jazyce: The master thesis deals with a new type of Data Lakehouse, which is designed for heterogeneous data storage. In the theoretical part, it deals with the evolution of different types of storage and describes them in detail. The main goal is to store medical records in this type of storage and then work with them. This is currently solved by the MRE platform, which is developed and operated at the FAV ZČU. To verify the suitability of the storage for the medical data area, an application was developed that implements the Data Lakehouse using the open-source Delta Lake project. The first part of the application consists of the administration, which provides complete user management and contains sections to ensure the management of the repository. The second part consists of the storage and provides all the functionality for its management through a REST API. The final testing of the application shows the suitability of using the storage for medical data. Based on the testing, suggestions for possible improvements and extensions to existing work are also described.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_Moucka_Lukas_2023.pdfPlný text práce2,03 MBAdobe PDFZobrazit/otevřít
A20N0053Pposudek-op.pdfPosudek oponenta práce423,97 kBAdobe PDFZobrazit/otevřít
A20N0053Phodnoceni-ved.pdfPosudek vedoucího práce542,57 kBAdobe PDFZobrazit/otevřít
A20N0053Pobhajoba.pdfPrůběh obhajoby práce534,28 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/53730

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.