Competing Patterns in Language Engineering and Computer Typesetting
| Název česky | Soutěživé vzory v jazykovém inženýrství a počítačové sazbě |
|---|---|
| Autoři | |
| Rok publikování | 2005 |
| Druh | Účelové publikace |
| Fakulta / Pracoviště MU | |
| Citace | |
| Popis | Cílem této dizertační práce je vývoj modelů, metod a metodologie pro strojové učení kompaktního a efektivního uložení dat v~oblastech jazykového inženýrství a počítačové sazby, se zaměřením na masivní zpracování výjimek. Výzkum se soustředil na přístup řízený vzory. Byla vyvinuta celá metodologie takzvaných přebíjejících vzorů, pomocí níž je možné zpracovat (detekovat, efektivně uložit a v~nich vyhledávat) výjimky. Přebíjející vzory umožňují ukládat kontextově závislou informaci, která může být naučena z~dat, nebo napsána expertem, nebo vzájemně kombinována. První část práce buduje teorii přebíjejících vzorů; jsou definovány základní techniky metodologie jako stratifikace, bootstraping, filtrování dat. Užití technologie je ukázáno na příkladech segmentačních problémů (dělení slov) a problému parciální morfologické desambiguace značkovaných dat v~oblasti korpusové lingvistiky. Druhá část práce obsahuje soubor sedmi publikovaných článků, které se zabývají nasazením navržené metodologie a diskutují její možnosti a aplikace v~oblastech dělení slov, dělení složených slov, generování přebíjejících vzorů pro češtinu a slovenštinu a například i segmentaci thajského textu. |
| Související projekty: |