Velmi zjednodušeně, Data Steward v akademické sféře zodpovídá za správu a kvalitu dat v rámci výzkumného týmu. To zahrnuje celou širokou škálu úkolů a odpovědností, od vytváření Data Management plan, až po zajištění, aby data byla byla správně a bezpečně uložena i skladována. Kromě toho existují i Data Stewardi v centrále akademických institucí, konkrétně v knihovnách, kteří fungují jako podpora výzkumných pracovníků a ostatních Data Stewardů, pilotně ověřují kvalitu vzdělávacích materiálů v rámci komunity Data Stewardů a poskytují jim konzultační služby.
Data Stewardi, kteří figurují v akademické sféře, představují komunikační uzel mezi jednotlivými výzkumnými pracovníky na institucích a dalšími spolupracovníky, např. stakeholdery, tvůrci politik, poskytovateli infrastruktury (místní i mimo instituce) a vývojáři softwarů (oddělení IT).
Datový steward je v České republice stále celkem nový typ pracovní pozice. Proto poskytujeme v Knihovně Akademie věd podporu těm, kteří potřebují poradit například s tvorbou a správou Data Management plánů – konkrétně prostřednictvím nástroje FAIR Wizard, výběrem vhodných repozitářů, či konzultací ohledně využívání námi provozovaného institucionálního repozitáře – ASEP Repozitář AV ČR, plněním požadavků Open Science nebo nastavováním interních datových politik.
Obr. 1 role Data Stewarda
Proč mít v týmu Data Stewarda?
- lepší kvalita (meta)dat;
- lepší dokumentace dat;
- jasná politika a procesy nakládání s (meta)daty;
- záruka toho, že nakládání s daty bude v souladu s regulacemi;
- zajištění bezpečí dat;
- zajištění toho, že nasbíraná data mohou být dále využita.
Dovednosti Data Stewarda
- efektivně komunikovat;
- mít znalost databází;
- schopnost vhledu do problematiky, kterou jejich tým nebo oddělení, se kterým spolupracují, řeší;
- základní orientaci v legislativě a dalších regulacích ošetřujících nakládání s daty;
- schopnost řešit problémy a výzvy.
Datový steward by měl mít určité penzum technických znalostí – hodí se například udržovat si přehled o různých typech úložišť, vědět, jak data správně a bezpečně uchovávat. Měl by rozumět datovým formátům. Hodí se také znalost databází. Pokud je to potřeba, datový steward by měl chápat databázové struktury a být schopen identifikovat poškozená data.
Zároveň by měl rozumět potřebám výzkumných týmům, se kterými spolupracuje, a efektivně s nimi komunikovat, jak bude s jejich daty nakládáno. Měl by jim také umět vysvětlit nové procesy a efektivně je implementovat.
Nepostradatelná by měla být schopnost sledovat, jaké jsou legislativní požadavky týkající se nakládání s daty, mít přehled o tom, jaké požadavky na nakládání s daty mají poskytovatelé grantů, být v souladu také s regulacemi dané instituce a udržovat osvědčenou praxi v jeho týmu. Optimální je, pokud s daty nakládá podle FAIR principů.
Znalosti, které by měl Datový steward potřebovat, se mohou mírně lišit podle toho, v jakém oboru se Datový steward pohybuje. Jinak se může pečovat o kvalitativní data, jinak třeba o big data.
Data Steward není datový analytik
Datový steward a datový analytik nejsou stejná pozice. Přestože oba pracují s daty, analytik organizuje a analyzuje data tak, aby z nich získal vhledy a vytvářel závěry nebo predikce, které pomáhají například obchodním rozhodnutím. Data Steward data neanalyzuje, ale zajišťuje, aby byla bezpečně a správně uložena a snadno dostupná všem, kterým dostupná mají být.
Pracovní náplň Data Stewarda
Vytváření datových procesů
Vytváří standardizaci procesů shromáždění dat a jednotná pravidla pro jejich užívání a manipulace s nimi.
Ochrana dat
Data Stewardi jsou zodpovědní za údržbu dat a jejich ochranu. Pomáhají odstraňovat případné duplicity a nedokonalosti, či odhalovat abnormality a zabraňovat ztrátě či poškození dat. Dále mohou poskytovat informace o potenciálních rizicích pro bezpečnost dat.
Správa datové linie
Lineage dat je proces sledování původu dat a zaznamenávání každého případu jejich použití. Správou datové linie mohou Data Stewardi odhalit nepřesnosti či problémy v čase, kdy byla data zadána (v jakém formátu či programu), a tím je efektivněji a rychleji napravit.
Udržování kvality dat
Data stewardi využívají zpětnou vazbu a dotazy zákazníků k vytvoření systémů pro udržování vysoké kvality dat. Podávají zprávy o interních metrikách příslušným členům organizace či vědeckému týmu a pravidelně identifikují, sledují a vyhodnocují problémy.
Zpracováno podle:
Data Stewards: Overview – The Turing Way, online: 2. 9. 2024;
Data Steward, UK, online 2. 9. 2024;