Organiser mes données : le rôle du Data Steward



Dans beaucoup d’entreprises, la quantité de données traitées et stockées augmente considérablement. Nous observons une explosion du nombre de ressources : tables de données, dashboards, rapports, KPI, features ... D’un côté, cela représente une opportunité saine de croissance et d’optimisation sous réserve d’investissement massif dans les outils nécessaires à la bonne gestion de ces données. De l’autre, cela représente un grand challenge : trouver son chemin dans un océan de donnée dont la qualité, la complexité, la pertinence, provenance ou fiabilité varient du tout au tout. Dans ce post, nous allons étudier l’importance du rôle peu connu mais essentiel de “Data Steward”.


Sa principale raison d’être est avant tout de permettre une démocratisation de la donnée dans l’ensemble de l’entreprise et permettre à chaque employé de prendre des décisions éclairées rapidement et avec confiance.



Quelles sont ses responsabilités ?



Supervision opérationnelle et qualité

  • Porte une attention particulière à ce qu’aucun doublon ne soit répertorié afin d’éviter une perte de temps, une possible confusion ou de gâcher de l’espace de stockage.

Documentation

  • S’assure que chaque élément du “data lake” soit correctement défini et documenté. Si besoin, le Data Steward renomme les éléments qui se trouvent dans votre “data lake” afin de leur donner un nom adapté au métier.

  • Décrire la donnée en fournissant à l’utilisateur le plus d’informations possible sur chaque dataset : nom d’origine, taille, dates de modification, provenance, niveau de confiance et statut de la donnée.

Conformité et des gestions des risques

  • Veille aussi à éviter toute obsolescence de la donnée, en supprimant les éléments non pertinents, non conforme ou inappropriés.

Sécurité et accès

  • Maintient un niveau de confiance de la donnée satisfaisant, c’est-à-dire si la donnée a préalablement été vérifiée et de ce fait si elle peut être utilisée en toute confiance.

  • Gère les accès aux données sensibles.


Seul le Data Steward a la capacité et l’autorisation de gérer et modifier la donnée. Le travail du Data Steward est primordial puisque c’est lui qui va organiser votre “data lake” en qualifiant un par un chaque élément qui s’y trouve afin d’obtenir une donnée sûre et qualitative et dont l’utilisation sera optimisée.



Quels sont les outils utilisés par le Data Steward ?



Data Steward est un nouveau métier où ses missions sont encore à clarifier, ses outils à identifier et son rôle essentiel au sein de l’entreprise à évangéliser. De ce fait, les entreprises ont encore du mal à leur attribuer un budget clair. Il leur est donc difficile de s’outiller correctement pour assurer la bonne maîtrise et gestion de ses données.


Pourtant, bien s’outiller permettrait de :

  • gagner en autonomie sur le management des données

  • centraliser les informations récoltées sur les données

  • gérer l’obsolescence de la documentation

  • faire remonter les erreurs et/ou modifications des données

  • identifier les données pertinentes à transmettre à ses utilisateurs

  • partager les données entre les différentes entités de l’entreprise

  • exposer les données à ses utilisateurs depuis un outil propice à la collaboration


À ce jour, nous sommes convaincus que le rôle de data steward est indispensable pour construire et orchestrer une gouvernance efficace dans l’entreprise. C’est dans cette optique que Castor construit un produit unique, en proposant une documentation dynamique et connectée des données de l’entreprise. Les data catalogs nouvelles générations, comme le nôtre, ont pour ambition de devenir l’outil de référence des data stewards.


Une solution efficace ?



Le "data catalog" Castor permet de :

  1. Gérer les données d’une manière user friendly

  2. Centraliser l’ensemble des métadonnées recueillies

  3. Rechercher une base de donnée en fonction de la description de ses colonnes et de la métadonnée de manière générale

  4. Gérer les accès aux données : ouvrir les données aux bonnes personnes selon le niveau de sensibilité

  5. Gérer la qualité des données

Le tout en un clic.

castor_logo_1.png

Your data has never been so clear and friendly

  • Medium
  • LinkedIn
  • Twitter

© 2020 Castor. All registered.

LegalCareers