Classification of Errors in Text

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.

Název česky	Klasifikace chyb v textu
Autoři	JAKUBÍČEK Miloš BUŠTA Jan HLAVÁČKOVÁ Dana PALA Karel
Rok publikování	2009
Druh	Článek ve sborníku
Konference	RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing
Fakulta / Pracoviště MU	Fakulta informatiky
Citace
www	http://nlp.fi.muni.cz/raslan/2009/
Obor	Jazykověda
Klíčová slova	errors in text; classification of errors
Popis	Tento článek prezentuje dvě klasifikace chyb v českých textech. Základním zdrojem je korpus Chyby, který byl vytvořen v letech 1999-2000 ([1]). Tento korpus obsahuje různé druhy chyb jako např. pravopisné, typografické, gramatické, sémantické, lexikální a stylistické. Tyto chyby byly ručně opraveny a vyznačeny podle anotačního schématu pro klasifikaci chyb, která byla pro tento účel vyvinuta. Za účelem anotace byl vyvinut nástroj zvaný WinCorr. V článku je popsáno první anotační schéma i jeho revize navržená za účelem získání přesnějšího popisu chyb, které se v textech vyskytují. Předmětem diskuse jsou zároveň základní principy, na nichž obě anotace staví.
Související projekty:	Centrum komputační lingvistiky Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce