Classification of Errors in Text
| Název česky | Klasifikace chyb v textu |
|---|---|
| Autoři | |
| Rok publikování | 2009 |
| Druh | Článek ve sborníku |
| Konference | RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | http://nlp.fi.muni.cz/raslan/2009/ |
| Obor | Jazykověda |
| Klíčová slova | errors in text; classification of errors |
| Popis | Tento článek prezentuje dvě klasifikace chyb v českých textech. Základním zdrojem je korpus Chyby, který byl vytvořen v letech 1999-2000 ([1]). Tento korpus obsahuje různé druhy chyb jako např. pravopisné, typografické, gramatické, sémantické, lexikální a stylistické. Tyto chyby byly ručně opraveny a vyznačeny podle anotačního schématu pro klasifikaci chyb, která byla pro tento účel vyvinuta. Za účelem anotace byl vyvinut nástroj zvaný WinCorr. V článku je popsáno první anotační schéma i jeho revize navržená za účelem získání přesnějšího popisu chyb, které se v textech vyskytují. Předmětem diskuse jsou zároveň základní principy, na nichž obě anotace staví. |
| Související projekty: |