Název: Automatické zodpovídání dotazů založené na sumarizaci textů
Další názvy: Automated Question Answering Based on a Text Summarization
Autoři: Saleh Salem, Tárik
Vedoucí práce/školitel: Ježek, Karel
Oponent: Krčmář, Lubomír
Datum vydání: 2012
Nakladatel: Západočeská univerzita v Plzni
Typ dokumentu: diplomová práce
URI: http://hdl.handle.net/11025/3039
Klíčová slova: sumarizace textů;multidokumentová sumarizace;latentní sémantická analýza;zpracování přirozeného jazyka;filtrování nežádoucího textu z webových stránek;internet;vyhledávání;internetový vyhledávač;Java
Klíčová slova v dalším jazyce: text summarization;multidocument summarization;latent semantic analysis;natural language processing;boilerplate removal;internet;search;search engine;Java
Abstrakt: Úkolem této diplomové práce bylo vytvořit internetový vyhledávač založený na automatické dotazové multidokumentové sumarizaci textů. Práce tento cíl splňuje a výsledkem je webová aplikace ASI využívající latentní sémantickou analýzu pro sumarizaci textů z webových stránek. Aplikace ASI dokáže sumarizaci webových stránek psaných v češtině a angličtině a dovoluje snadné rozšíření o další algoritmy pro vyhledávání. Práce také seznamuje s oblastmi sumarizace textů, internetového vyhledávání, filtrace textů z webových stránek a zpracování přirozeného jazyka, které všechny hrajou důležitou roli.
Abstrakt v dalším jazyce: The objective of this diploma thesis was to develop a search engine based on automatic query-based multidocument summarization of texts. The thesis meets this objective and the result of the work is the ASI web application using a latent semantic analysis for summarization of texts from web pages. The ASI application is able to perform summarization of web pages in Czech and English and allows extension of the application by other searching algorithms. Further, the work deals with the text summarization, internet searching, filtration of text from web pages (boilerplate removal) and natural language processing, which play an important role in this work.
Práva: Plný text práce je přístupný bez omezení.
Vyskytuje se v kolekcích:Diplomové práce / Theses (KIV)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
DP_TarikSalehSalem_2012.pdfPlný text práce1,91 MBAdobe PDFZobrazit/otevřít
A09N0102Pposudek-ved.pdfPosudek vedoucího práce261,22 kBAdobe PDFZobrazit/otevřít
A09N0102Pposudek-op.pdfPosudek oponenta práce318,58 kBAdobe PDFZobrazit/otevřít
A09N0102Pprubeh.pdfPrůběh obhajoby práce195,62 kBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/3039

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.