HOMONYMIE MEZI OIKONYMY A ANTROPONYMY ZAKONČENÝMI NA -SLAV/-SLAVA JAKO PROBLÉM AUTOMATICKÉ MORFOLOGICKÉ ANALÝZY
| Autoři | |
|---|---|
| Rok publikování | 2020 |
| Druh | Článek v odborném periodiku |
| Časopis / Zdroj | Acta onomastica |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | |
| Klíčová slova | anthroponym; oikonym; ending in -slav/-slava; corpus; tagging; disambiguation |
| Popis | Homonymie na všech úrovních, která je charakteristickým rysem všech přirozených jazyků, je také jedna z nejvýznamnějších překážek automatického zpracování přirozeného jazyka. V tomto příspěvku poukážeme na morfosyntaktické rozdíly českých antroponym zakončených na -slav (typu Miroslav, mužský rodu) a českých oikonym se stejnou koncovkou (typ Miroslav, ženský rod) a českých antroponym zakončených na -slava (ženský rod typu Miroslava, protože jeho tvary jsou homonymní s oběma: mužskými antroponymy i ženskými oikonymy). Analýza dat z korpusu Syn v8 ukazuje, že slovní forma homonymie významně ovlivňuje výsledky automatické morfologické analýzy. Dokumentujeme chyby v pokrytí morfologického slovníku a především chyby v morfologickém značkování a navrhujeme řešení, jak částečně zlepšit desambiguaci daného typu vlastních podstatných jmen. |
| Související projekty: |