Morfologické značkování mluvených korpusů, zkušenosti a otevřené otázky
| Autoři | |
|---|---|
| Rok publikování | 2008 |
| Druh | Článek ve sborníku |
| Konference | Čeština v mluveném korpusu |
| Fakulta / Pracoviště MU | |
| Citace | |
| Obor | Jazykověda |
| Klíčová slova | corpus; spoken corpora; tagging |
| Popis | Cílem příspěvku je: a) Stručně shrnout zkušenosti získané při úpravách nástrojů primárně určených pro automatickou morfologickou analýzu psané češtiny s cílem rozšířit jejich použitelnost pro anotace mluvených korpusů. b) Představit nástroj upravenou verzi automatického morfologického analyzátoru ajka použitou pro automatické značkování mluvených korpusů. c) Podělit se o konkrétní zkušenosti s automatickou morfologickou analýzou a následnou ruční disambiguací automaticky označkovaných částí Brněnského mluveného korpusu (BMK) a Korpusu soukromé korespondence (KSK) oba vytvořeny v Ústavu českého jazyka FF MU. d) Na základě výše uvedených zkušeností zhodnotit klady a zápory, meze a možnosti automatické morfologické analýzy mluvených textů. |
| Související projekty: |