Data Steward

Velmi zjednodušeně, Data Steward v akademické sféře zodpovídá za správu a kvalitu dat v rámci výzkumného týmu. To zahrnuje celou širokou škálu úkolů a odpovědností, od vytváření Data Management plánu, až po zajištění, aby data byla byla správně a bezpečně uložena i skladována. Kromě toho existují i Data Stewardi v centrále akademických institucí, konkrétně v knihovnách, kteří fungují jako podpora výzkumných pracovníků a ostatních Data Stewardů, pilotně ověřují kvalitu vzdělávacích materiálů v rámci komunity Data Stewardů a poskytují jim konzultační služby.

Data Stewardi, co figurují v akademické sféře, představují komunikační uzel mezi jednotlivými výzkumnými pracovníky na institucích a dalšími spolupracovníky, např. stakeholdery, tvůrci politik, poskytovateli infrastruktury (místní i mimo instituce) a vývojáři softwarů (oddělení IT).

Datový steward je v České republice stále celkem nový typ pracovní pozice. Proto poskytujeme v Knihovně Akademie věd podporu těm, kteří potřebují poradit například s tvorbou a správou Data Management plánů – konkrétně prostřednictvím nástroje FAIR Wizard, výběrem vhodných repozitářů, či konzultací ohledně využívání námi provozovaného institucionálního repozitáře – ASEP Repozitář AV ČR, plněním požadavků Open Science, nebo nastavováním interních datových politik.

Obr. 1 role Data Stewarda

Proč mít v týmu Data Stewarda?

  • lepší kvalita (meta)dat;
  • lepší dokumentace dat;
  • jasná politika a procesy nakládání s (meta)daty;
  • záruka toho, že nakládání s daty bude v souladu s regulacemi;
  • zajištění bezpečí dat;
  • zajištění toho, že nasbíraná data mohou být dále využita.

Dovednosti Data Stewarda

  • efektivně komunikovat;
  • mít znalost databází;
  • schopnost vhledu do problematiky, kterou jejich tým nebo oddělení, se kterým spolupracují, řeší;
  • základní orientaci v legislativě a dalších regulacích ošetřujících nakládání s daty;
  • schopnost řešit problémy a výzvy.

Datový steward by měl mít určité penzum technických znalostí – hodí se například udržovat si přehled o různých typech úložišť, vědět, jak data správně a bezpečně uchovávat. Měl by rozumět datovým formátům. Hodí se také znalost databází. Pokud je to potřeba, datový steward by měl chápat databázové struktury a být schopen identifikovat poškozená data. 

Zároveň by měl rozumět potřebám výzkumným týmům, se kterými spolupracuje a efektivně s nimi komunikovat, jak bude s jejich daty nakládáno. Měl by umět jim také vysvětlit nové procesy a efektivně je implementovat.

Nepostradatelná by měla být schopnost sledovat, jaké jsou legislativní požadavky týkající se nakládání s daty, mít přehled o tom, jaké požadavky na nakládání s daty mají poskytovatelé grantů, být v souladu také s regulacemi dané instituce a udržovat osvědčenou praxi v jeho týmu. Optimální je, pokud s daty nakládá podle FAIR principů.

Znalosti, které Datový steward by měl potřebovat, se mohou mírně lišit podle toho, v jakém oboru se Datový steward pohybuje. Jinak se může pečovat o kvalitativní data, jinak třeba o big data. 

Data Steward není datový analytik

Datový steward a datový analytik nejsou stejná pozice. Přestože oba pracují s daty, analytik organizuje a analyzuje data tak, aby z nich získal vhledy a vytvářel závěry nebo predikce, které pomáhají například obchodním rozhodnutím. Data Steward data neanalyzuje, ale zajišťuje, aby byla bezpečně a správně uložena a snadno dostupná všem, kterým dostupná mají být.

Pracovní náplň Data Stewarda

Vytváření datových procesů

Vytváří standardizaci procesů shromáždění dat a jednotná pravidla pro jejich užívání a manipulace s nimi. 

Ochrana dat

Data Stewardi jsou zodpovědní za údržbu dat a jejich ochranu. Pomáhají odstraňovat případné duplicity, nedokonalosti, či odhalit abnormality a zabránit jejich ztrátě či poškození. Dále mohou poskytovat informace o potenciálních rizicích pro bezpečnost dat.

Správa datové linie

Lineage dat je proces sledování původu dat a zaznamenávání každého případu jejich použití. Správou datové linie mohou Data Stewardi odhalit nepřesnosti či problémy v čase, kdy byly data zadána (v jakém formátu či programu), a tím je efektivněji a rychleji napravit.

Udržování kvality dat

Data stewardi využívají zpětnou vazbu a dotazy zákazníků k vytvoření systémů pro udržování vysoké kvality dat. Podávají zprávy o interních metrikách příslušným členům organizace či vědeckému týmu a pravidelně identifikují, sledují a vyhodnocují problémy.