Informace o projektu
Portálové řešení pro správu a zpracování life-science datových sad a jejich metadat ukládaných v systému Onedata

Informace

Projekt nespadá pod Ústav výpočetní techniky, ale pod Přírodovědeckou fakultu. Oficiální stránka projektu je na webu muni.cz.
Kód projektu
744R1/2023
Období řešení
7/2023 - 6/2024
Investor / Programový rámec / typ projektu
CESNET
Fakulta / Pracoviště MU
Přírodovědecká fakulta

Moderní výzkum produkuje velké množství dat, které je potřeba ukládat. Pro tento účel už některé laboratoře NCBR a CEITEC využívají řešení postavené nad distribuovaným úložištěm Onedata běžícím nad infrastrukturou e-INFRA CZ. To bylo původně nasazeno pro laboratoř CEMCOF na CEITEC, a později rozšířeno i pro jiné zdroje dat. Aby bylo toto řešení rutinně používáno uživateli bez větších IT znalostí a zároveň abychom data ukládali v souladu s FAIR principy, je potřeba jej rozšířit o uživatelsky přívětivou správu datových sad a jejich metadat. Cílem projektu je tak vytvoření modulárního portálového řešení, které umožní spravovat datové sady, spouštět nad nimi definované aplikace a doplnit je o metadatový popis.

Metadatový popis je pro každou laboratoř jedinečný a skládá se z informací, které lze automaticky vyčíst z vlastních dat, a anotací, které musí uživatel zadat ručně. Každý modul by proto obsahoval definici konkrétního metadatového schématu spolu s naprogramovanými nástroji pro automatizovanou extrakci metadat a přívětivé grafické rozhraní pro jejich ruční doplnění a editaci. Dále by umožňoval export metadat do zavedených obecných i doménově specifických metadatových katalogů.

Mnohé datové sady potřebují jejich uživatelé dále zpracovávat pomocí specializovaného software nebo nad nimi provádět opakované zkoumání. Za účelem zpracování těchto dat vytvoříme nástroj, který uživatelům usnadní spuštění doménově specifického software nad existujícími daty uloženými v systému Onedata skrze uživatelsky přívětivé webové rozhraní. Jako první prototypovou aplikaci zpřístupníme takto software Scipion.

Navrhované řešení budeme nejprve nasazovat v jednotlivých laboratořích v rámci MU, ale bude použitelné i dalšími pracovišti. Vhodnou platformou pro diseminaci tohoto řešení na další instituce jsou infrastrukturní projekty: ELIXIR CZ, jehož jsme součástí, Czech-BioImaging, nebo CIISB. Zároveň počítáme s tím, že navržené řešení usnadní přístup k úložištím e-infrastruktury CESNET, a zvýší tak zájem o jejich použití.

Publikace

Počet publikací: 2


Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info