Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet
| Název česky | Dlouhodobě udržitelný vývoj a údržba WordNetu: případová studie češtiny |
|---|---|
| Autoři | |
| Rok publikování | 2018 |
| Druh | Článek v odborném periodiku |
| Časopis / Zdroj | Cognitive Studies | Études cognitives |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | |
| Doi | https://doi.org/10.11649/cs.1715 |
| Klíčová slova | EuroWordNet; BalkaNet; wordnet; Czech WordNet; DEBVisDic |
| Popis | Český Wordnet představuje jeden z prvních národních wordnetů, které byly vytvořeny během projektů EuroWordNet a BalkaNet. Bohužel data obsahují různé problémy, které mohou ovlivnit využití českého WordNetu v NLP aplikacích. Od zveřejněné první verze CzWN byly sémantická síť v několika fázích rozšířena, ale komplexní finální úpravy a proces zveřejněný zatím nejsou dokončené. V roce 2017 jsme spustili projekt k vyhodnocení a aktualizaci českého WordNetu a také propojení s Collaborative Interlingual Index. V tomto článku poskytujeme přehled verzí a rozšíření českého Wordnetu a také plán pro publikaci aktualizované verze s otevřenou licencí. Dále představujeme koncept dlouhodobých aktualizací a údržby dat založený na crowdsourcingu. |
| Související projekty: |