Management de la métadonnée, pourquoi investir dans une solution ?

Management de la métadonnée, pourquoi investir dans une solution de qualité ?

3 min read

La donnée a pris, ces dernières années, un tournant stratégique incontestable. Les entreprises qui connaissent les plus fortes croissances ont choisi de mettre la donnée au coeur de leur stratégie. Que ce soit les GAFA (Google, Apple, Facebook, Amazon) ou les startups de la Silicon Valley (Uber, Airbnb, LinkedIn, etc), tous investissent dans la gestion et le management de leur donnée pour extraire un maximum de valeur de leur capital “data”.


Cette transformation de l’entreprise vers la donnée, qu’on l’aime ou pas, concerne tout le monde, toutes les industries et toutes les structures. Pour faire face aux jeunes startups innovantes et digitales, il est nécessaire de capitaliser sur ses données, de casser les silos et de démocratiser leur accès à travers tous les rôles et niveaux de responsabilité.


Démocratisation de la donnée


Démocratiser la donnée implique la mise en place d’une stratégie de gouvernance solide, tournée vers la documentation. Une démocratisation réussie de la donnée vise à permettre à chaque employé de répondre à ces questions facilement :


  • Quelles sont les données que nous avons dans notre lac de données ?
  • Où sont-elles stockées et qui y a accès ?
  • Est-ce qu’elles sont suffisamment documentées pour être utilisées rapidement, sans possibilité d’erreur ?
  • D’où viennent les données de ce tableau de données ?
  • Quelles sont les règles qui protègent les accès à chacune des bases de données ?
  • Qui est le responsable de telle base de données ? Qui sont les utilisateurs récurrents ?
  • Où trouver la documentation rapidement ? Qui peut la modifier ?
  • Pour répondre à toutes ces questions, il est nécessaire d’installer un système de documentation dans les processus de création et de transformation de données.


Pourquoi investir ?

Alors qu’il existe des solutions open-source pour gérer la recherche et documentation de ses données (comme Amundsen par exemple), pourquoi privilégier une solution payante ?


  1. Accompagnement : un accompagnement initial est nécessaire dans la définition des besoins, l'installation du produit et la formation des utilisateurs (pour les entreprises qui n'ont pas les ressources en interne)
  2. Support : la mise en place d'un support client de qualité et réactif est un élément clef de réussite d'un projet de data management
  3. Fonctionnalités avancées : de nombreuses fonctionnalités et connecteurs demandent des investissements plus lourds pour dégager un maximum de valeurs pour le client (automatisation, lineage, déploiement "at scale", développement d'API et de connecteurs vers les outils préférés des utilisateurs, data mapping pour résoudre les thématiques de compliance)


Une solution qui permet de créé de la valeur


Enfin, au cours des discussions que nous avons eu avec plus de 50 startups, ETI et grands groupes, c'est un investissement qui est créateur de valeur :


Valorisation des données


  • possibilité de faire des analyses sur l'ensemble des données disponibles (et non pas seulement celles connues) rapidement, sans erreur, ni perte de temps inutile
  • possibilité de vendre ou partager les données avec l'extérieur tout en maintenant un niveau maximum d'efficacité et de sécurité
  • utiliser les données efficacement pour des tâches à haute valeur ajoutée : optimisation des processus, comprendre les clients, créer ou améliorer un produit, prise de décisions stratégiques


Optimisation des ressources


  • réduction du nombre de requêtes inutiles dans le data lake de type "SELECT * FROM sales_report_mm_2020" pour comprendre une base de donnée
  • optimisation de l'espace disponible sur les serveurs via une détection de doublon
  • optimisation du temps des ingénieurs et des analystes : réduction du nombre de questions inutiles posées à l'ingénieur créateur de la base de données, autonomie des analysts dans leurs tâches
  • optimisation de la collaboration et du dialogue avec les différentes parties prenantes "data" de l'entreprise


Minimisation des risques


  • risques d'erreur dans le travail des data scientists / analysts en raison d'une mauvaise interprétation d'un base de donnée (à qui n'est-ce jamais arrivé ?) ou d'une documentation pas à jour
  • risques de conformité au RGPD avec une détection d'informations personnelles (PII) de qualité et actionable (répondre au droit à l'oubli et à la portabilité
  • risques de propagation d'erreurs dans des bases "enfants" avec un système de visualisation de d'arbre généalogique de la donnée
  • risques de perte du savoir après une démission en raison d'un "tribal knowledge" trop présent
  • risques d'accès non-autorisé avec à un système intégré de gestion d'accès hautement personnalisée et simplifiée


Pour toutes ces raisons, il est selon nous essentiel d’investir avant que les problèmes de gouvernance de données n’apparaissent si vous êtes encore une startup ou de s’attaquer à ce problème aussi vite que possible s’il se fait déjà ressentir car les problématiques ne vont cesser de s’empirer avec le temps et la multiplication des sources et quantité de données disponibles.


En savoir plus sur notre solution : Castor.

Subscribe to the Castor Blog

Xavier de Boisredon

Co-Founder & COO

Linkedin Profil

More From Castor Blog

Get more value from the data you already have

Start your free 14-day trial now or schedule a product tour.
We have a flexible pricing that works for companies of all sizes.
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.