Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru

Varování

Publikace nespadá pod Ústav výpočetní techniky, ale pod Fakultu informatiky. Oficiální stránka publikace je na webu muni.cz.
Autoři

GÉRYK Jan BAYER Jaroslav POPELÍNSKÝ Lubomír

Rok publikování 2011
Druh Článek ve sborníku
Konference Sborník konference Znalosti 2011
Fakulta / Pracoviště MU

Fakulta informatiky

Citace
Obor Informatika
Klíčová slova machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization
Popis Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace.
Související projekty:

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info