Full metadata record
DC poleHodnotaJazyk
dc.contributor.advisorHoidekr, Jan
dc.contributor.authorLehečka, Jan
dc.contributor.refereeŠvec, Jan
dc.date.accepted2012-06-20
dc.date.accessioned2013-06-19T06:29:02Z
dc.date.available2011-09-19cs
dc.date.available2013-06-19T06:29:02Z
dc.date.issued2012
dc.date.submitted2012-05-18
dc.identifier47846
dc.identifier.urihttp://hdl.handle.net/11025/2648
dc.description.abstractCílem této diplomové práce je navrhnout a implementovat systém, který automaticky hledá a označuje slova s nepravidelnou výslovností v českých textech. Nepravidelná výslovnost slova je taková výslovnost, která nelze odvodit pomocí pravidel české fonetické transkripce. Pro řešení je použit klasifikátor, který roztřídí všechna slova do dvou tříd, a to do třídy slov s pravidelnou výslovností a třídy slov s nepravidelnou výslovností. Natrénovaný klasifikátor zohledňuje i slovník výjimek zabudovaný v existujícím fonetickém transkriberu. Výsledky této práce ukazují, že nejlepší klasifikace slov je dosaženo při použití klasifikátoru podle k-nejbližšího souseda. Dalšími zkoumanými klasifikátory v této práci byly neuronové sítě, lineární SVC a rozhodovací stromy.cs
dc.format60 s.cs
dc.format.mimetypeapplication/pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.subjectnepravidelná výslovnostcs
dc.subjectfonetická transkripcecs
dc.subjectautomatická detekce jazykacs
dc.subjectjazykový modelcs
dc.subjectklasifikacecs
dc.subjectlineární systém rovniccs
dc.subjectklasifikátor podle k-nejbližšího sousedacs
dc.subjectneuronové sítěcs
dc.titleDetekce slov s nepravidelnou výslovností v českém textucs
dc.title.alternativeDetection of words with irregular pronunciation in Czech texten
dc.typediplomová prácecs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.description.departmentKatedra kybernetikycs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.description.resultObhájenocs
dc.rights.accessopenAccessen
dc.description.abstract-translatedThe goal of this work is proposal and implementation of a system, which is able to find and mark words with irregular pronunciation in Czech texts. Irregular pronunciation of word is such pronunciation, that can not be derived by using rules of Czech phonetic transcription. To solve the problem, a classifier separating words into two classes is used. In the first target class, there are words with regular pronunciation, and the second class contains only words with irregular pronunciation. Trained classifier takes also a vocabulary of exceptions built in existing phonetic transcriber into consideration. The result of this work shows that the best classification is achieved when using k-nearest neighbor classifier. Other investigated classifiers in this work were neural networks, linear SVC and decision trees.en
dc.subject.translatedirregular pronunciationen
dc.subject.translatedphonetic transcriptionen
dc.subject.translatedautomatic language detectionen
dc.subject.translatedlanguage modelen
dc.subject.translatedclassificationen
dc.subject.translatedlinear system of equationsen
dc.subject.translatedk-nearest neighbor classifieren
dc.subject.translatedneural networksen
Vyskytuje se v kolekcích:Diplomové práce / Theses (KKY)

Soubory připojené k záznamu:
Soubor Popis VelikostFormát 
dp_lehecka.pdfPlný text práce1,3 MBAdobe PDFZobrazit/otevřít
lehecka-v.pdfPosudek vedoucího práce1,75 MBAdobe PDFZobrazit/otevřít
lehecka-o.pdfPosudek oponenta práce1,82 MBAdobe PDFZobrazit/otevřít
lehecka-p.pdfPrůběh obhajoby práce1,48 MBAdobe PDFZobrazit/otevřít


Použijte tento identifikátor k citaci nebo jako odkaz na tento záznam: http://hdl.handle.net/11025/2648

Všechny záznamy v DSpace jsou chráněny autorskými právy, všechna práva vyhrazena.