Název: | Kategorizace zákaznické zpětné vazby nezávislá na jazyce |
Další názvy: | Categorization of customer feedback independent of the language |
Autoři: | Průcha, Pavel |
Vedoucí práce/školitel: | Steinberger Josef, Doc. Ing. Ph.D. |
Oponent: | Přibáň Pavel, Ing. |
Datum vydání: | 2023 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/53738 |
Klíčová slova: | nlp;strojové učení;neuronové sítě |
Klíčová slova v dalším jazyce: | nlp;machine learning;neural networks |
Abstrakt: | Kategorizaci zákaznické zpětné vazby využívají různé společnosti pro zkvalitnění produktu nebo služby, kterou nabízí. Tato diplomová práce se zabývá kategorizací zákaznické zpětné vazby nezávislé na jazyce. Konverze mezi jazyky využívá transformaci vektorového prostoru pomocí transformační matice a strojový překlad. Datový korpus pro trénování a testování klasifikátorů je vytvořen z recenzí řetězce McDonald's, ve kterých je následně manuálně označený sentiment ve vybraných kategoriích. Tímto způsobem je vytvořený trénovací korpus z českých recenzí a testovací korpusy z anglických a německých recenzí. Data jsou v různých kombinacích testována primárně na neuronových sítích CNN a LSTM s vektorovou reprezentací textu word2vec a fasttext. Nejúspěšnější kombinací modelů je LSTM s fasttext, která je použita v demonstrátoru práce. |
Abstrakt v dalším jazyce: | Categorization of customer feedback is used by various companies to improve the quality of the product or service they offer. This thesis deals with language-independent categorization of customer feedback. Conversion between languages uses vector space transformation using a transformation matrix and machine translation. The data corpus for training and testing classifiers is created from reviews of the chain McDonald's, in which the sentiment in selected categories is then manually annotated. In this way, the training corpus is created from Czech reviews and the test corpus from English and German reviews. Data are tested in various combinations primarily on neural networks CNN and LSTM with word embeddings word2vec and fasttext. The most successful combination of models is LSTM with fasttext, which are used in the work demonstrator. |
Práva: | Plný text práce je přístupný bez omezení |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
A20N0102P_DP.pdf | Plný text práce | 1,16 MB | Adobe PDF | Zobrazit/otevřít |
A20N0102Pposudek-op.pdf | Posudek oponenta práce | 251,61 kB | Adobe PDF | Zobrazit/otevřít |
A20N0102Phodnoceni-ved.pdf | Posudek vedoucího práce | 102,18 kB | Adobe PDF | Zobrazit/otevřít |
A20N0102Pobhajoba.pdf | Průběh obhajoby práce | 528,28 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/53738
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.