Životní cyklus dat

Životní cyklus výzkumných dat (Research data lifecycle) je schéma popisující kroky, kterými prochází výzkumná data v různých částech výzkumného procesu, tj. před, během a po skončení experimentu či projektu. Ne každé zpracování výzkumných dat musí nutně zahrnovat všechny fáze životního cyklu. Pokud tomu nic nebrání, měla by data být dostupná k “opakovanému použití” tak, aby je mohl v ideálním případě využít kdokoliv. Otevírání výzkumných dat spočívá v dodržování určitých principů dobré správy, právních norem, doporučení a kritérií, které umožní zajistit u konkrétních dat různou míru budoucího opakovaného použití (tzv. reuse). Obecně se životní cyklus dat skládá z několika fází (viz Obr.). Pro každou z nich existují různé technické nástroje, které dané fáze životního cyklu podporují.

Užitečným zdrojem informací o nástrojích podporujících jednotlivé fáze životního cyklu výzkumných dat je Research Data Management Kit (RDMkit), který byl vytvořený sdružením ELIXIR s cílem podpořit vědce v oblasti věd o živé přírodě v jejich úsilí zlepšit správu výzkumných dat a naplnění FAIR principů.
Obdobným zdrojem s drobnými odlišnostmi v důrazu na tu kterou část fáze výzkumného cyklu je Data Management Expert Guide (DMEG), který je vytvořený konsorciem evropských sociálněvědních datových archivů – CESSDA ERIC a je tak zaměřený na sociální vědy.

  1. Plánování: návrh experimentu na základě existujících poznatků a dat, naplánování správy dat, návrh podmínek umožňující následné sdílení vzniklých dat, návrh sběru dat vzniklých v rámci experimentu.
  2. Vznik dat: vznik vědeckých dat v rámci konkrétní aplikace vědecké metody, získání dat od třetích stran za účelem experimentu.
  3. Zpracování dat: primární zpracování surových dat představující jejich čištění od šumu, vznik dokumentace dat (vznik metadat popisující jednotlivá vědecká data), převod do potřebných formátů.
  4. Analýza dat: analýza a interpretace zpracovaných dat za účelem vyhodnocení závěrů experimentu, ověření hypotéz.
  5. Uchovávání dat: správné dlouhodobé uchování potřebných vědeckých dat vzniklých v rámci konkrétní aplikace vědecké metody zahrnující zejména technické zpracování vědeckých dat, přípravu dat na jejich dlouhodobé uchovávání a výběr vhodného úložiště.
  6. Sdílení dat: zpřístupnění výzkumných dat pro spolupráci v rámci společného výzkumného projektu nebo s širší výzkumnou komunitou a společností jako takovou. Sdílení výzkumných dat nemusí nutně znamenat, že data jsou přístupná všem za jakýmkoliv účelem, data mohou být sdílena jen s omezeným přístupem.
  7. Opakované užití dat: využití dat pro další výzkum nebo další účely, míra opakovaného užití dat je dána mírou zpřístupnění dat v kroku č. 6.

    Zpracováno na základě podkladů z RDMkit, DMEG a výstupů z WG Education – EOSC CZ a Marek, Jiří. 2020. Otevřená data v akademické praxi. Masarykova univerzita, Právnická fakulta.