Název: Tvorba datových zdrojů pro bibliometrická měření
Další názvy: Creation of Data Sources for Bibliometric Analysis
Autoři: Baratta, Štěpán
Vedoucí práce/školitel: Fiala Dalibor, Doc. Ing. Ph.D.
Oponent: Dostal Martin, Ing. Ph.D.
Datum vydání: 2019
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/37416
Klíčová slova: bibliografie;nosql;databáze;api
Klíčová slova v dalším jazyce: bibliography;nosql;database;api
Abstrakt: Cílem této práce je vytvoření rozsáhlého úložište obsahujícího data z různých datových zdrojů, které se zabývají sběrem publikačních a patentových bibliografických dat. Součástí práce je také umožnění přístupu k této vytvořené databázi pomocí aplikačního rozhraní, které poskytuje metody pro dotazování. Ve výsledném řešení byla použita nerelační databáze MongoDB a pro komunikaci s ní byl použit programovací jazyk Java. Podařilo se shromáždit přes 200 milionů záznamů ze 4 datových zdrojů, zejména z publikační databáze Microsoft Academic Graph. Z amerického patentového úřadu United States Patent and Trademark Office bylo získáno přes 3 miliony záznamů. Další část práce se zabývala vytvořením aplikace pro administraci datových zdrojů, která také umožnuje předzpracovávání dat a jejich nahrávání do databáze MongoDB. Jako nadstavba byla vytvořena webová aplikace, demonstrující fungování aplikačního rozhraní, umožnující jednoduché vizualizace výsledků. Jako součást měření byla provedena analýza hlavních datových zdrojů.
Abstrakt v dalším jazyce: The main purpose of this thesis is to create a large repository concentrating data from various publicly available databases which store bibliographic information related to intellectual property rights. One part of this work focuses on enabling access to the created repository using an application interface, providing methods for querying. In the final solution, non-relational database MongoDB was used and Java programming language was used for communication with the database. Over 200 millions of records were acquired from multiple data sources, mainly from publication database Microsoft Academic Graph. Over 3 millions of records were acquired from the United States Patent and Trademark Office. Another part of this work focused on creating an application for administering the data sources. It also enables for data preprocessing and loading data to the MongoDB database. An additional web application was created to demonstrate the functioning of the application interface, enabling for simple visualization of the results. An analysis of the main data sources was created.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
thesis.pdfPlný text práce4,43 MBAdobe PDFZobrazit/otevřít
A17N0061Pposudek-op.PDFPosudek oponenta práce348,54 kBAdobe PDFZobrazit/otevřít
A17N0061Phodnoceni-ved.PDFPosudek vedoucího práce473,02 kBAdobe PDFZobrazit/otevřít
A17N0061Pobhajoba.PDFPrůběh obhajoby práce195,47 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/37416

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.