The Art of Mathematics Retrieval
| Název česky | Umění indexování a vyhledávání matematiky |
|---|---|
| Autoři | |
| Rok publikování | 2011 |
| Druh | Článek ve sborníku |
| Konference | Proceedings of the 2011 ACM Symposium on Document Engineering |
| Fakulta / Pracoviště MU | |
| Citace | |
| www | |
| Doi | https://doi.org/10.1145/2034691.2034703 |
| Obor | Informatika |
| Klíčová slova | math indexing and retrieval; mathematical digital libraries; information systems; information retrieval; mathematical content search; document ranking of mathematical papers; math text mining; MIaS; WebMIaS |
| Přiložené soubory | |
| Popis | V článku je navržena architektura nového systému, MIaS (Math Indexer and Searcher), a návrh je zdůvodněn. Byl zvolen přístup založený na podobnosti matematických formulí v prezentačním MathML. Systém byl implementován a návrh verifikován na široce používaném indexačním systému Apache Lucene. Škálovatelnost byla ověřena na více než 400,000 odborných matematických článcích z archivu arXiv s 158 miliony matematickými formulemi. To představovalo indexování téměř tří bilionů matematických podformulí v MathML pomocí Solr-kompatibilního rozšíření Lucene. |
| Související projekty: |