Název: Kategorizace zákaznické zpětné vazby nezávislá na jazyce
Další názvy: Categorization of customer feedback independent of the language
Autoři: Průcha, Pavel
Vedoucí práce/školitel: Steinberger Josef, Doc. Ing. Ph.D.
Oponent: Přibáň Pavel, Ing.
Datum vydání: 2023
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/53738
Klíčová slova: nlp;strojové učení;neuronové sítě
Klíčová slova v dalším jazyce: nlp;machine learning;neural networks
Abstrakt: Kategorizaci zákaznické zpětné vazby využívají různé společnosti pro zkvalitnění produktu nebo služby, kterou nabízí. Tato diplomová práce se zabývá kategorizací zákaznické zpětné vazby nezávislé na jazyce. Konverze mezi jazyky využívá transformaci vektorového prostoru pomocí transformační matice a strojový překlad. Datový korpus pro trénování a testování klasifikátorů je vytvořen z recenzí řetězce McDonald's, ve kterých je následně manuálně označený sentiment ve vybraných kategoriích. Tímto způsobem je vytvořený trénovací korpus z českých recenzí a testovací korpusy z anglických a německých recenzí. Data jsou v různých kombinacích testována primárně na neuronových sítích CNN a LSTM s vektorovou reprezentací textu word2vec a fasttext. Nejúspěšnější kombinací modelů je LSTM s fasttext, která je použita v demonstrátoru práce.
Abstrakt v dalším jazyce: Categorization of customer feedback is used by various companies to improve the quality of the product or service they offer. This thesis deals with language-independent categorization of customer feedback. Conversion between languages uses vector space transformation using a transformation matrix and machine translation. The data corpus for training and testing classifiers is created from reviews of the chain McDonald's, in which the sentiment in selected categories is then manually annotated. In this way, the training corpus is created from Czech reviews and the test corpus from English and German reviews. Data are tested in various combinations primarily on neural networks CNN and LSTM with word embeddings word2vec and fasttext. The most successful combination of models is LSTM with fasttext, which are used in the work demonstrator.
Práva: Plný text práce je přístupný bez omezení
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
A20N0102P_DP.pdfPlný text práce1,16 MBAdobe PDFZobrazit/otevřít
A20N0102Pposudek-op.pdfPosudek oponenta práce251,61 kBAdobe PDFZobrazit/otevřít
A20N0102Phodnoceni-ved.pdfPosudek vedoucího práce102,18 kBAdobe PDFZobrazit/otevřít
A20N0102Pobhajoba.pdfPrůběh obhajoby práce528,28 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/53738

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.