Project information
Portálové řešení pro správu a zpracování life-science datových sad a jejich metadat ukládaných v systému Onedata

Project Identification
744R1/2023
Project Period
7/2023 - 6/2024
Investor / Pogramme / Project type
CESNET
MU Faculty or unit
Faculty of Science

Moderní výzkum produkuje velké množství dat, které je potřeba ukládat. Pro tento účel už některé laboratoře NCBR a CEITEC využívají řešení postavené nad distribuovaným úložištěm Onedata běžícím nad infrastrukturou e-INFRA CZ. To bylo původně nasazeno pro laboratoř CEMCOF na CEITEC, a později rozšířeno i pro jiné zdroje dat. Aby bylo toto řešení rutinně používáno uživateli bez větších IT znalostí a zároveň abychom data ukládali v souladu s FAIR principy, je potřeba jej rozšířit o uživatelsky přívětivou správu datových sad a jejich metadat. Cílem projektu je tak vytvoření modulárního portálového řešení, které umožní spravovat datové sady, spouštět nad nimi definované aplikace a doplnit je o metadatový popis.

Metadatový popis je pro každou laboratoř jedinečný a skládá se z informací, které lze automaticky vyčíst z vlastních dat, a anotací, které musí uživatel zadat ručně. Každý modul by proto obsahoval definici konkrétního metadatového schématu spolu s naprogramovanými nástroji pro automatizovanou extrakci metadat a přívětivé grafické rozhraní pro jejich ruční doplnění a editaci. Dále by umožňoval export metadat do zavedených obecných i doménově specifických metadatových katalogů.

Mnohé datové sady potřebují jejich uživatelé dále zpracovávat pomocí specializovaného software nebo nad nimi provádět opakované zkoumání. Za účelem zpracování těchto dat vytvoříme nástroj, který uživatelům usnadní spuštění doménově specifického software nad existujícími daty uloženými v systému Onedata skrze uživatelsky přívětivé webové rozhraní. Jako první prototypovou aplikaci zpřístupníme takto software Scipion.

Navrhované řešení budeme nejprve nasazovat v jednotlivých laboratořích v rámci MU, ale bude použitelné i dalšími pracovišti. Vhodnou platformou pro diseminaci tohoto řešení na další instituce jsou infrastrukturní projekty: ELIXIR CZ, jehož jsme součástí, Czech-BioImaging, nebo CIISB. Zároveň počítáme s tím, že navržené řešení usnadní přístup k úložištím e-infrastruktury CESNET, a zvýší tak zájem o jejich použití.

Publications

Total number of publications: 5


You are running an old browser version. We recommend updating your browser to its latest version.