Nová automatická morfologická analýza češtiny
| Autoři | |
|---|---|
| Rok publikování | 2017 |
| Druh | Článek v odborném periodiku |
| Časopis / Zdroj | Naše řeč |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | http://nase-rec.ujc.cas.cz/archiv.php?art=8465 |
| Obor | Jazykověda |
| Klíčová slova | automatic morphological analysis; lemmatisation; natural language processing; part-of-speech tagging; tagset |
| Popis | Cílem příspěvku je představit projekt inovace popisu české morfologie pro nástroje automatické morfologické analýzy, zejména změny v pojetí tagsetu. Více než dvacet let je automatická morfologická analýza součástí mnoha nástrojů počítačového zpracování přirozeného jazyka (natural language processing, NLP). Její výsledky užívá lingvistická veřejnost zejména při práci s velkými jazykovými korpusy. Od roku 2012 běží grantový projekt, v jehož rámci se připravují inovace automatické morfologické analýzy češtiny. Ty jsou zaměřeny především na odstranění nedostatků, s nimiž se dosavadní praxe potýká, a zhodnocují zkušenosti, které bylo možné získat pouze na základě praxe. |
| Související projekty: |