Název: Detekce polarity textu s využitím mezijazyčné transformace
Další názvy: Text polarity detection using cross-lingual transformation
Autoři: Šmíd, Jakub
Vedoucí práce/školitel: Přibáň Pavel, Ing.
Oponent: Pražák Ondřej, Ing.
Datum vydání: 2021
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: bakalářská práce
URI: http://hdl.handle.net/11025/44232
Klíčová slova: detekce polarity;mezijazyčné transformace;strojové učení;zpracování přirozeného jazyka;neuronové sítě;analýza sentimentu
Klíčová slova v dalším jazyce: polarity detection;cross-lingual transformations;machine learning;natural language processing;neural networks;sentiment analysis
Abstrakt: Tato bakalářská práce se zabývá detekcí polarity textu s využitím mezijazyčných transformací. Mezijazyčné transformace patří mezi metody, které umožňují přenos znalostí mezi jazyky. Konkrétně v této práci jsou použita anglická anotovaná data pro detekci polarity v českém textu. V rámci práce jsou navrženy a implementovány dva modely neuronových sítí - LSTM a CNN - v kombinaci se slovními vektory fastText. Modely jsou následně s využitím lineárních mezijazyčných transformací natrénovány na anglických datech a vyhodnoceny na českých datech. Výsledky těchto experimentů jsou porovnány s modely, které byly trénovány i vyhodnoceny pouze na češtině. Srovnání ukazuje, že s dostatečným množstvím výhradně anglických dat lze dosáhnout velmi dobrých výsledků, které jsou jen o 5 až 6 % horší v porovnání s modely trénovanými jen na českých datech.
Abstrakt v dalším jazyce: This bachelor's thesis focuses on text polarity detection using cross-lingual transformations. Cross-lingual transformations are among the methods that allow the transfer of knowledge between languages. Specifically, in this work, the English annotated data are used for polarity detection in Czech text. Within the thesis, two neural network models - LSTM and CNN - are proposed and implemented in combination with fastText word embeddings. The models are then trained on English data and evaluated on Czech data using linear cross-lingual transformations. The results of these experiments are compared with models that have been trained and evaluated only on Czech data. The comparison shows that with a sufficient amount of exclusively English data, it is possible to achieve very good results, which are only 5 to 6% worse compared to models trained only on Czech data.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
BP_Jakub_Smid.pdfPlný text práce1,04 MBAdobe PDFZobrazit/otevřít
A19B0675P_Hodnoceni.pdfPosudek vedoucího práce265,02 kBAdobe PDFZobrazit/otevřít
A19B0675P_Posudek.pdfPosudek oponenta práce237,11 kBAdobe PDFZobrazit/otevřít
A19B0675P_Obhajoba.pdfPrůběh obhajoby práce43,59 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/44232

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.