Víceslovné výrazy a klasifikace českých textů
| Autoři | |
|---|---|
| Rok publikování | 2004 |
| Druh | Článek ve sborníku |
| Konference | Znalosti 2004, sborník posterů |
| Fakulta / Pracoviště MU | |
| Citace | |
| Obor | Informatika |
| Klíčová slova | text classification; machine learning; multword expressions |
| Popis | Presentujeme první výsledky experimentů týkající se použití víceslovných výrazů pro klasifikaci českých textů. Podáváme přehled nejdelších, nejčastěji použitých a nejužitečnějších víceslovných skupin. Všímáme si též vlivu lematizace na přesnost klasifikace textů. |
| Související projekty: |