Fast syntactic searching in very large corpora for many languages
| Název česky | Rychlé syntaktické vyhledávání ve velkých korpusech pro mnoho jazyků |
|---|---|
| Autoři | |
| Rok publikování | 2010 |
| Druh | Článek ve sborníku |
| Konference | PACLIC 24 Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation |
| Fakulta / Pracoviště MU | |
| Citace | |
| Obor | Informatika |
| Klíčová slova | corpus search; large corpora; CQL; syntactic search |
| Popis | Prvním krokem pro mnoho lingvistických výzkumů je vyhledání příkladů. V 21. století by tyto příklady měly být vždy vyhledávány, nikoli vymýšleny. Proto potřebují lingvisté flexibilní nástroje pro vyhledávání i okrajových jazykových jevů. Takové vyhledávání musí být navíc rychlé i pro velké korpusy a složité dotazy. Představujeme rozšíření ke korpusovému dotazovacímu jazyku CQL pro intuitivní vytváření syntaktických dotazů a ukážeme, že tyto dotazy mohou být rychle vyhodnocovány našimi nástroji i pro korpusy o velikostech v řádech miliard pozic. |
| Související projekty: |