Název: | Automatické zodpovídání dotazů založené na sumarizaci textů |
Další názvy: | Automated Question Answering Based on a Text Summarization |
Autoři: | Saleh Salem, Tárik |
Vedoucí práce/školitel: | Ježek, Karel |
Oponent: | Krčmář, Lubomír |
Datum vydání: | 2012 |
Nakladatel: | Západočeská univerzita v Plzni |
Typ dokumentu: | diplomová práce |
URI: | http://hdl.handle.net/11025/3039 |
Klíčová slova: | sumarizace textů;multidokumentová sumarizace;latentní sémantická analýza;zpracování přirozeného jazyka;filtrování nežádoucího textu z webových stránek;internet;vyhledávání;internetový vyhledávač;Java |
Klíčová slova v dalším jazyce: | text summarization;multidocument summarization;latent semantic analysis;natural language processing;boilerplate removal;internet;search;search engine;Java |
Abstrakt: | Úkolem této diplomové práce bylo vytvořit internetový vyhledávač založený na automatické dotazové multidokumentové sumarizaci textů. Práce tento cíl splňuje a výsledkem je webová aplikace ASI využívající latentní sémantickou analýzu pro sumarizaci textů z webových stránek. Aplikace ASI dokáže sumarizaci webových stránek psaných v češtině a angličtině a dovoluje snadné rozšíření o další algoritmy pro vyhledávání. Práce také seznamuje s oblastmi sumarizace textů, internetového vyhledávání, filtrace textů z webových stránek a zpracování přirozeného jazyka, které všechny hrajou důležitou roli. |
Abstrakt v dalším jazyce: | The objective of this diploma thesis was to develop a search engine based on automatic query-based multidocument summarization of texts. The thesis meets this objective and the result of the work is the ASI web application using a latent semantic analysis for summarization of texts from web pages. The ASI application is able to perform summarization of web pages in Czech and English and allows extension of the application by other searching algorithms. Further, the work deals with the text summarization, internet searching, filtration of text from web pages (boilerplate removal) and natural language processing, which play an important role in this work. |
Práva: | Plný text práce je přístupný bez omezení. |
Vyskytuje se v kolekcích: | Diplomové práce / Theses (KIV) |
Soubory připojené k záznamu:
Soubor | Popis | Velikost | Formát | |
---|---|---|---|---|
DP_TarikSalehSalem_2012.pdf | Plný text práce | 1,91 MB | Adobe PDF | Zobrazit/otevřít |
A09N0102Pposudek-ved.pdf | Posudek vedoucího práce | 261,22 kB | Adobe PDF | Zobrazit/otevřít |
A09N0102Pposudek-op.pdf | Posudek oponenta práce | 318,58 kB | Adobe PDF | Zobrazit/otevřít |
A09N0102Pprubeh.pdf | Průběh obhajoby práce | 195,62 kB | Adobe PDF | Zobrazit/otevřít |
Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam:
http://hdl.handle.net/11025/3039
Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.