Data Steward

Data Steward v akademické sféře zodpovídá za správu a kvalitu dat v rámci výzkumného týmu. To zahrnuje celou širokou škálu úkolů a odpovědností, od vytváření Data Management plan, až po zajištění, aby data byla byla správně a bezpečně uložena i skladována. Kromě toho existují i Data Stewardi v centrále akademických institucí, konkrétně v knihovnách, kteří fungují jako podpora výzkumných pracovníků a ostatních Data Stewardů, pilotně ověřují kvalitu vzdělávacích materiálů v rámci komunity Data Stewardů a poskytují jim konzultační služby.

Data Stewardi, kteří figurují v akademické sféře, představují komunikační uzel mezi jednotlivými výzkumnými pracovníky na institucích a dalšími spolupracovníky, např. stakeholdery, tvůrci politik, poskytovateli infrastruktury (místní i mimo instituce) a vývojáři softwarů (oddělení IT).

Datový steward je v České republice stále celkem nový typ pracovní pozice. Proto poskytujeme v Knihovně Akademie věd podporu těm, kteří potřebují poradit například s tvorbou a správou Data Management plánů – konkrétně prostřednictvím nástroje FAIR Wizard, výběrem vhodných repozitářů, či konzultací ohledně využívání námi provozovaného institucionálního repozitáře – ASEP Repozitář AV ČR, plněním požadavků Open Science nebo nastavováním interních datových politik.

Obr. 1 role Data Stewarda

Proč mít v týmu Data Stewarda?

  • lepší kvalita (meta)dat;
  • lepší dokumentace dat;
  • jasná politika a procesy nakládání s (meta)daty;
  • záruka toho, že nakládání s daty bude v souladu s regulacemi;
  • zajištění bezpečí dat;
  • zajištění toho, že nasbíraná data mohou být dále využita.

Dovednosti Data Stewarda

  • efektivně komunikovat;
  • mít znalost databází;
  • schopnost vhledu do problematiky, kterou jejich tým nebo oddělení, se kterým spolupracují, řeší;
  • základní orientaci v legislativě a dalších regulacích ošetřujících nakládání s daty;
  • schopnost řešit problémy a výzvy.

Datový steward by měl mít určité penzum technických znalostí – hodí se například udržovat si přehled o různých typech úložišť, vědět, jak data správně a bezpečně uchovávat. Měl by rozumět datovým formátům. Hodí se také znalost databází. Pokud je to potřeba, datový steward by měl chápat databázové struktury a být schopen identifikovat poškozená data. 

Zároveň by měl rozumět potřebám výzkumných týmům, se kterými spolupracuje, a efektivně s nimi komunikovat, jak bude s jejich daty nakládáno. Měl by jim také umět vysvětlit nové procesy a efektivně je implementovat.

Nepostradatelná by měla být schopnost sledovat, jaké jsou legislativní požadavky týkající se nakládání s daty, mít přehled o tom, jaké požadavky na nakládání s daty mají poskytovatelé grantů, být v souladu také s regulacemi dané instituce a udržovat osvědčenou praxi v jeho týmu. Optimální je, pokud s daty nakládá podle FAIR principů.

Znalosti, které by měl Datový steward potřebovat, se mohou mírně lišit podle toho, v jakém oboru se Datový steward pohybuje. Jinak se může pečovat o kvalitativní data, jinak třeba o big data. 

Data Steward není datový analytik

Datový steward a datový analytik nejsou stejná pozice. Přestože oba pracují s daty, analytik organizuje a analyzuje data tak, aby z nich získal vhledy a vytvářel závěry nebo predikce, které pomáhají například obchodním rozhodnutím. Data Steward data neanalyzuje, ale zajišťuje, aby byla bezpečně a správně uložena a snadno dostupná všem, kterým dostupná mají být.

Pracovní náplň Data Stewarda

Vytváření datových procesů

Vytváří standardizaci procesů shromáždění dat a jednotná pravidla pro jejich užívání a manipulace s nimi. 

Ochrana dat

Data Stewardi jsou zodpovědní za údržbu dat a jejich ochranu. Pomáhají odstraňovat případné duplicity a nedokonalosti, či odhalovat abnormality a zabraňovat ztrátě či poškození dat. Dále mohou poskytovat informace o potenciálních rizicích pro bezpečnost dat.

Správa datové linie

Lineage dat je proces sledování původu dat a zaznamenávání každého případu jejich použití. Správou datové linie mohou Data Stewardi odhalit nepřesnosti či problémy v čase, kdy byla data zadána (v jakém formátu či programu), a tím je efektivněji a rychleji napravit.

Udržování kvality dat

Data stewardi využívají zpětnou vazbu a dotazy zákazníků k vytvoření systémů pro udržování vysoké kvality dat. Podávají zprávy o interních metrikách příslušným členům organizace či vědeckému týmu a pravidelně identifikují, sledují a vyhodnocují problémy.

Komunita Data Stewardů v ČR

V Česku již vznikla komunita Data stewardů, která se několikrát za rok sejde na online i fyzických setkání a pravidelně komunikuje přes platformu Discord (https://discord.gg/eMpzXFRaPn), kde si vyměňují aktuální informace a best practises. Zároveň jsou někteří její členové zapojeni do testování a evaluace výstupů Národní repozitářové platformy (NRP), čímž přispějí k jejímu zlepšení a efektivnějšímu využívání.

O pozici Data Stewarda a její důležité roli při správě výzkumných dat vznikla i stránka na oficiálních webových stránkách EOSC CZ, kterou najdete zde.


Zpracováno podle:

Data Stewards: Overview – The Turing Way, online: 2. 9. 2024;

Data Steward, UK, online 2. 9. 2024;

Data Steward kurz, DocEnhance NTK;

Salome Scholtens (2019) „Final report: Towards FAIR data steward as profession for the lifesciences. Report of a ZonMw funded collaborative approach built on existing expertise“.