Propria (příjmení na -č) - problém automatické morfologické analýzy
| Autoři | |
|---|---|
| Rok publikování | 2008 |
| Druh | Článek ve sborníku |
| Konference | Jazyk a jeho proměny |
| Fakulta / Pracoviště MU | |
| Citace | |
| Obor | Jazykověda |
| Klíčová slova | corpus; proprium; family name; authomatical morphological analysis |
| Popis | Ačkoliv se rozsáhlé jazykové korpusy od doby vzniku korpusové lingvistiky budují především pro potřeby lexikografie, mohou sloužit a slouží i pro bádání v řadě dalších lingvistických oborů. V tomto příspěvku jsme se snažili demonstrovat, jak mohou korpusy přispět při zpracování lingvistických podkladů použitelných v oblasti NLP. Na příkladu analýzy vlastních jmen (maskulin životných na č) jsme ukázali, na jaká úskalí mohou narazit pokusy vytvořit automatický modul derivace konkrétně českých deverbativ na -č. Výsledkem je rozsáhlý seznam možných případů přegenerovávání, kterých by se mohl automatický nástroj dopustit v případě, že by nepracoval dostatečně s rozdílem apelativum/proprium. |
| Související projekty: |