Detekce polarity textu s využitím mezijazyčné transformace

Šmíd, Jakub

Název:	Detekce polarity textu s využitím mezijazyčné transformace
Další názvy:	Text polarity detection using cross-lingual transformation
Autoři:	Šmíd, Jakub
Vedoucí práce/školitel:	Přibáň Pavel, Ing.
Oponent:	Pražák Ondřej, Ing.
Datum vydání:	2021
Nakladatel:	Západočeská univerzita v Plzni
Typ dokumentu:	bakalářská práce
URI:	http://hdl.handle.net/11025/44232
Klíčová slova:	detekce polarity;mezijazyčné transformace;strojové učení;zpracování přirozeného jazyka;neuronové sítě;analýza sentimentu
Klíčová slova v dalším jazyce:	polarity detection;cross-lingual transformations;machine learning;natural language processing;neural networks;sentiment analysis
Abstrakt:	Tato bakalářská práce se zabývá detekcí polarity textu s využitím mezijazyčných transformací. Mezijazyčné transformace patří mezi metody, které umožňují přenos znalostí mezi jazyky. Konkrétně v této práci jsou použita anglická anotovaná data pro detekci polarity v českém textu. V rámci práce jsou navrženy a implementovány dva modely neuronových sítí - LSTM a CNN - v kombinaci se slovními vektory fastText. Modely jsou následně s využitím lineárních mezijazyčných transformací natrénovány na anglických datech a vyhodnoceny na českých datech. Výsledky těchto experimentů jsou porovnány s modely, které byly trénovány i vyhodnoceny pouze na češtině. Srovnání ukazuje, že s dostatečným množstvím výhradně anglických dat lze dosáhnout velmi dobrých výsledků, které jsou jen o 5 až 6 % horší v porovnání s modely trénovanými jen na českých datech.
Abstrakt v dalším jazyce:	This bachelor's thesis focuses on text polarity detection using cross-lingual transformations. Cross-lingual transformations are among the methods that allow the transfer of knowledge between languages. Specifically, in this work, the English annotated data are used for polarity detection in Czech text. Within the thesis, two neural network models - LSTM and CNN - are proposed and implemented in combination with fastText word embeddings. The models are then trained on English data and evaluated on Czech data using linear cross-lingual transformations. The results of these experiments are compared with models that have been trained and evaluated only on Czech data. The comparison shows that with a sufficient amount of exclusively English data, it is possible to achieve very good results, which are only 5 to 6% worse compared to models trained only on Czech data.
Práva:	Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:	Bakalářské práce / Bachelor´s works (KIV)

Soubory připojené k záznamu:

Soubor	Popis	Velikost	Formát
BP_Jakub_Smid.pdf	Plný text práce	1,04 MB	Adobe PDF	Zobrazit/otevřít
A19B0675P_Hodnoceni.pdf	Posudek vedoucího práce	265,02 kB	Adobe PDF	Zobrazit/otevřít
A19B0675P_Posudek.pdf	Posudek oponenta práce	237,11 kB	Adobe PDF	Zobrazit/otevřít
A19B0675P_Obhajoba.pdf	Průběh obhajoby práce	43,59 kB	Adobe PDF	Zobrazit/otevřít

Zobrazit celý záznam Zobrazit statistiky

Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/44232

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.

hledání

navigace