Title: | Systém porovnání studijních programů českých univerzit |
Other Titles: | System for comparison of study programmes of czech universities |
Authors: | Hospaska, Martin |
Advisor: | Ježek Karel, Prof. Ing. CSc. |
Referee: | Fiala Dalibor, Doc. Ing. Ph.D. |
Issue Date: | 2017 |
Publisher: | Západočeská univerzita v Plzni |
Document type: | diplomová práce |
URI: | http://hdl.handle.net/11025/27144 |
Keywords: | univerzity;crawler;porovnání předmětů;webové stránky;uložíště dokumentů;elasticsearch;jsoup |
Keywords in different language: | universities;crawler;courses comparison;web pages;document database;elasticsearch;jsoup |
Abstract: | Výstupem této práce je aplikace webového crawleru a vlastní webové stránky, které slouží pro zobrazení dat získaných pomocí crawleru. Součástí práce je rovněž vybrané datové úložiště sloužící pro uchovávání a vyhledávání v~uložených datech. Po nasazení této práce na veřejně přístupný server je tak možné zájemcům o studium na vysoké škole nabídnout unikátní systém pro porovnávání předmětů vybraných univerzit. Text práce popisuje způsob vytvoření a následné využití kolekce předmětů vyučovaných na vybraných vysokých školách v ČR. Zaobírá se jak samotným stahováním informací z webů univerzit, tak jejich uložením v databázi a následným porovnáváním předmětů pomocí vytvořených webových stránek. Čtenář se v textu práce dozví, jakou strukturu mají webové stránky vybraných univerzit a jakým způsobem lze sestavit webový crawler, který dokáže z těchto stránek získávat data. Dozví se také o možnostech, jak stažená data uložit a následně s nimi pracovat. Pokud by si čtenář přál vytvořit webové stránky zobrazující stažená data, i o tomto se v textu dočte. |
Abstract in different language: | The goal of this diploma thesis is to create a web crawler and corresponding user interface, which presents the data obtained from the crawler. The created project also consists of a data storage used for preserving the retrieved data from the crawler. Target users of this platform are students. The aforementioned system should help them with comparing units taught at different universities. For this, the platform needs to be deployed and available on the public network. This paper describes how the units are collected using the implemented crawler and how the collected data are interpreted. For this, courses at selected universities in the Czech Republic are used as testing data. In more details, the process of downloading the information from universities pages and storing it in the data storage is explained. Finally, the way how the collected data are compared is described. In the scope of this thesis, the structure of pages of selected universities is described and the steps how to create a custom web crawler to collect data from these pages are given as well. The reader can also learn about different ways how the data can be exported. The steps how to create a custom user interface presenting the collected data are also given in the thesis. |
Rights: | Plný text práce je přístupný bez omezení. |
Appears in Collections: | Diplomové práce / Theses (KIV) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Hospaska_Martin_A15N0039P_DP.pdf | Plný text práce | 1,89 MB | Adobe PDF | View/Open |
A15N0039Phodnoceni-ved.PDF | Posudek vedoucího práce | 331,64 kB | Adobe PDF | View/Open |
A15N0039Pposudek-op.PDF | Posudek oponenta práce | 664,62 kB | Adobe PDF | View/Open |
A15N0039Pobhajoba.PDF | Průběh obhajoby práce | 218,81 kB | Adobe PDF | View/Open |
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11025/27144
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.