Nová automatická morfologická analýza češtiny

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Filozofickou fakultu. Oficiální stránka publikace je na webu muni.cz.

Autoři	OSOLSOBĚ Klára HLAVÁČOVÁ Jaroslava PETKEVIČ Vladimír ŠIMANDL Josef SVÁŠEK Martin
Rok publikování	2017
Druh	Článek v odborném periodiku
Časopis / Zdroj	Naše řeč
Fakulta / Pracoviště MU	Filozofická fakulta
Citace
www	http://nase-rec.ujc.cas.cz/archiv.php?art=8465
Obor	Jazykověda
Klíčová slova	automatic morphological analysis; lemmatisation; natural language processing; part-of-speech tagging; tagset
Popis	Cílem příspěvku je představit projekt inovace popisu české morfologie pro nástroje automatické morfologické analýzy, zejména změny v pojetí tagsetu. Více než dvacet let je automatická morfologická analýza součástí mnoha nástrojů počítačového zpracování přirozeného jazyka (natural language processing, NLP). Její výsledky užívá lingvistická veřejnost zejména při práci s velkými jazykovými korpusy. Od roku 2012 běží grantový projekt, v jehož rámci se připravují inovace automatické morfologické analýzy češtiny. Ty jsou zaměřeny především na odstranění nedostatků, s nimiž se dosavadní praxe potýká, a zhodnocují zkušenosti, které bylo možné získat pouze na základě praxe.
Související projekty:	Čeština v jednotě synchronie a diachronie - 2017