Title: Detekce polarity textu s využitím mezijazyčné transformace
Other Titles: Text polarity detection using cross-lingual transformation
Authors: Šmíd, Jakub
Advisor: Přibáň Pavel, Ing.
Referee: Pražák Ondřej, Ing.
Issue Date: 2021
Publisher: Západočeská univerzita v Plzni
Document type: bakalářská práce
URI: http://hdl.handle.net/11025/44232
Keywords: detekce polarity;mezijazyčné transformace;strojové učení;zpracování přirozeného jazyka;neuronové sítě;analýza sentimentu
Keywords in different language: polarity detection;cross-lingual transformations;machine learning;natural language processing;neural networks;sentiment analysis
Abstract: Tato bakalářská práce se zabývá detekcí polarity textu s využitím mezijazyčných transformací. Mezijazyčné transformace patří mezi metody, které umožňují přenos znalostí mezi jazyky. Konkrétně v této práci jsou použita anglická anotovaná data pro detekci polarity v českém textu. V rámci práce jsou navrženy a implementovány dva modely neuronových sítí - LSTM a CNN - v kombinaci se slovními vektory fastText. Modely jsou následně s využitím lineárních mezijazyčných transformací natrénovány na anglických datech a vyhodnoceny na českých datech. Výsledky těchto experimentů jsou porovnány s modely, které byly trénovány i vyhodnoceny pouze na češtině. Srovnání ukazuje, že s dostatečným množstvím výhradně anglických dat lze dosáhnout velmi dobrých výsledků, které jsou jen o 5 až 6 % horší v porovnání s modely trénovanými jen na českých datech.
Abstract in different language: This bachelor's thesis focuses on text polarity detection using cross-lingual transformations. Cross-lingual transformations are among the methods that allow the transfer of knowledge between languages. Specifically, in this work, the English annotated data are used for polarity detection in Czech text. Within the thesis, two neural network models - LSTM and CNN - are proposed and implemented in combination with fastText word embeddings. The models are then trained on English data and evaluated on Czech data using linear cross-lingual transformations. The results of these experiments are compared with models that have been trained and evaluated only on Czech data. The comparison shows that with a sufficient amount of exclusively English data, it is possible to achieve very good results, which are only 5 to 6% worse compared to models trained only on Czech data.
Rights: Plný text práce je přístupný bez omezení.
Appears in Collections:Bakalářské práce / Bachelor´s works (KIV)

Files in This Item:
File Description SizeFormat 
BP_Jakub_Smid.pdfPlný text práce1,04 MBAdobe PDFView/Open
A19B0675P_Hodnoceni.pdfPosudek vedoucího práce265,02 kBAdobe PDFView/Open
A19B0675P_Posudek.pdfPosudek oponenta práce237,11 kBAdobe PDFView/Open
A19B0675P_Obhajoba.pdfPrůběh obhajoby práce43,59 kBAdobe PDFView/Open


Please use this identifier to cite or link to this item: http://hdl.handle.net/11025/44232

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.