Computing Idioms Frequency in Text Corpora
| Název česky | Výpočet četnosti idiomů v korpusu |
|---|---|
| Autoři | |
| Rok publikování | 2008 |
| Druh | Článek ve sborníku |
| Konference | Proceedings of Recent Advances in Slavonic Natural Language Processing 2008 |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | https://nlp.fi.muni.cz/raslan/2008/papers/12.pdf |
| Obor | Jazykověda |
| Klíčová slova | frequency of idioms; headwords; text corpora; czech language |
| Popis | Idiomy jsou slovní spojení, jejichž význam se neskládá z významů jednotlivých slov. Idiomy jsou příkladem porušování principu kompozicionality a tím jsou problémem při strojovém zpracování jazyka. Výpočet četnosti idiomů v korpusu přinese informaci, které idiomy se používají častěji, které méně často. Seřazení idiomů dle jejich četnosti ukáže, na které idiomy je třeba se soustředit více, a tak lépe porozumět přirozenému jazyku. |
| Související projekty: |