Pattern Generation Revisited

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Název česky Generování vzorů
Autoři

ANTOŠ David SOJKA Petr

Rok publikování 2001
Druh Článek ve sborníku
Konference Proceedings of the Twelfth European TeX Conference
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
www
Obor Využití počítačů, robotika a její aplikace
Klíčová slova patterns;UNICODE;finite automata;natural language processing;language engineering
Popis Článek popisuje techniku vzorů jako prostředek pro získávání informace z~rozsáhlých dat a zpětné rozpoznávání. Typickou aplikací této techniky je dělení slov. Dosud chybí generátor vzorů dělení pro systém $\Omega$ (pro UNICODE) a rozšíření programu PATGEN, omezeného osmibitovým ASCII, není únosné. Proto jsme vyvinuli knihovnu PATLIB pro obecnou manipulaci se vzory a na ní postavili generátor vzorů dělení slov v~UNICODE. Popsali jsme architekturu systému a dále méně známou datovou strukturu dynamic packed trie, kterou lze výhodně použít pro efektivní ukládání konečných jazyků s výstupy. Vzory lze použít i pro rozpoznávání hranic složených slov, proto zmíníme návrhy na rozšíření následníků TeXu o klasifikované dělení s~více typy dělících bodů a o automatické potlačování ligatur na švech složených~slov.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info