Comment Les Entreprises Font-elles Facent à l’Obsolescence des Dashboards?
Et pourquoi 95% des dashboards BI sont-ils défaillants?
Un problème courant
Laissez-moi vous raconter mes débuts en tant que data scientist chez Ubisoft à San Francisco, une entreprise de jeux vidéo connue pour des titres tels qu'Assassin's Creed, Watch Dogs, The Division, et Far Cry. J'étais emballé par l'idée d'analyser le comportement des joueurs, savoir combien de pas en moyenne les gens faisaient dans Assassin's Creed Valhalla ou quelle chanson était la plus populaire sur Just Dance. Je suis quelqu'un de curieux, mais aussi d'un peu paresseux, donc j'espérais pouvoir m'appuyer sur le travail déjà effectué par d'autres. Refaire ce qui avait déjà été fait ne m'enchantait pas.
Pendant mes premières semaines, j'ai exploré les dashboards Tableau déjà conçus. Cependant, je fus grandement déçu car les outils de Business Intelligence (BI) n'étaient pas optimisés pour la consommation de contenu, surtout à grande échelle ou pour une organisation de données en libre-service. J'ai passé des jours à chercher les dashboards qui m'intéressaient.
Le problème des dashboards est bien réel. Ils peuvent être très utiles pour surveiller la santé de l'entreprise au jour le jour, en fournissant une mine d'informations en un coup d'œil. Au fur et à mesure de la croissance des données, de plus en plus de personnes créent dashboards, et cela peut rapidement devenir confus.
Le problème des dashboards
Un dashboard est une représentation graphique de données tabulaires.
Très utile pour suivre l'état de santé de l'entreprise au jour le jour. On obtient beaucoup d'informations d'un seul coup d'œil. Cela semble (et c'est !) génial.
Mais avec la croissance des données, de plus en plus de personnes créent plus de dashboards et cela devient rapidement chaotique.
Les éléments importants ne sont plus évidents. Il devient difficile de trouver les analyses pertinentes. Les gens sont perdus et commencent à détester leur outil BI.
En tant que consommateur de données :
J'ai été surpris par quelques aspects des outils BI. Voici l'essentiel :
- Je ne pouvais pas explorer les dashboards de manière efficace.
- Je ne pouvais pas leur faire confiance sans une analyse approfondie de 30 minutes.
- Je n'avais aucune idée desquels étaient beaucoup utilisés ou critiques pour l'entreprise.
- J'ai passé des heures à découvrir quelles étaient les tables alimentant les dashboards.
- Je devais demander aux data engineers pour savoir quand a eu lieu la dernière actualisation.
Du point de vue d’un data manager :
L'année dernière, j'ai rencontré Arnaud de Turkheim et Amaury Dumoulin, data managers chez Payfit et Qonto. À l’époque, les deux se sentaient dépassés par les outils BI. En quelques mots, plus ils déployaient des outils d'analyse en libre-service, plus ils perdaient le contrôle et la confiance dans les dashboards :
- Pas de visibilité sur les droits d'accès.
- Pas de visibilité sur l'utilisation.
- Pas de visibilité sur les dépendances.
- Extrêmement difficile à nettoyer.
- Pas de connaissance de ceux qui sont importants.
- Pas de connaissance des doublons.
Voilà pour les aspects négatifs des dashboards. Heureusement, il existe également des pratiques recommandées. Permettez-moi de vous présenter les bonnes pratiques les plus courantes que j'ai pu observer au cours de mes entretiens avec les clients.
Bonnes pratiques observées
Les outils BI sont très puissants, ce qui signifie que les utilisateurs peuvent facilement trouver des moyens de créer un environnement confus pour les end-users. Voici quelques bonnes pratiques courantes qui peuvent vous aider à déployer des outils d'analyse en libre-service sans perdre le contrôle.
🔬 Établir une gouvernance simple dès le premier jour :
Un dossier par équipe, un sous-dossier appelé 'sandbox', et pour sortir de la sandbox, l'équipe data doit :
- Approuver la logique analytique
- Approuver qu'il ne s'agit pas d'un doublon
🚰 Utiliser la 'popularité' pour filtrer les dashboards
Archivez régulièrement les dashboards peu utilisés, tout en rassurant les utilisateurs que ceux-ci peuvent être restaurés facilement.
Nous pouvons également utiliser un préfixe [déprécié] sur les noms des dashboards / visualisations pour indiquer qu'ils sont destinés à la suppression.
🧶 Modéliser les données en dehors des outils BITransformez la plupart de vos données à l'intérieur de l'entrepôt de données avec dbt. Cela vous aidera à:
- Maintenir une source unique de vérité pour la modélisation des données
- Exploiter la capacité de joindre toutes les données/ faciliter la jointure entre tous les données
- Réduire la complexité de l'ingestion : séparation des préoccupations.
🎯 Trouver le bon équilibre : équipe data centralisée ou intégréeChacun de ces deux types présente des avantages et ses problèmes.
Les équipes data centralisées sont plus faciles à gérer et à organiser. Mais elles sont aussi plus lentes, car vous devez communiquer vos besoins commerciaux de manière plus précise.
Les équipes data intégrées sont plus agiles, plus opérationnelles dans leurs analyses, et se rapprochent des besoins commerciaux : elles sont efficaces mais pas de manière scalable. Il est difficile de maintenir une source de vérité unifiée en matière de données et de vision.
👮 Établir un processus clair pour où et comment est enregistré le contenu :Si votre instance est un "Far West" où les utilisateurs peuvent enregistrer leur contenu n'importe où, vous risquez de vous retrouver avec des doublons, un nettoyage difficile et une confusion perpétuelle. Établissez une norme de hiérarchie de contenu, indiquant comment et où vous souhaitez que les utilisateurs enregistrent leur contenu, afin de maintenir la cohérence de tous.
🦻 La collaboration et les commentaires sont puissants :
La collaboration entre les acteurs de la donnée peut faire gagner beaucoup de temps. Mettez en avant les dashboards utiles, c'est bon pour le moral des analystes BI qui se sentiront récompensés pour leur travail acharné, et cela facilitera la navigation parmi des centaines de dashboards.
🕵️♀️ Mettez en place des tests et des vérifications de qualité : Chaque analyste BI redoute que des hauts dirigeants lui demandent : "Ce dashboard ne semble pas correct, que se passe-t-il ?" et réalise que le pipeline de données alimentant le dashboard est cassé. Soyez les premiers à détecter le problème. Vous voudrez savoir pourquoi et quand le dashboard est devenu incorrect.
Bonnes pratiques spécifiques à Looker :
- N'exposez pas trop d'explorations
- Si tous les utilisateurs peuvent voir toutes les explorations de votre instance, cela peut facilement les perturber. Il est important de donner accès aux utilisateurs seulement à ce dont ils ont besoin pour leur travail. Si vous avez des explorations spécifiques à certaines personnes, envisagez de les masquer pour les utilisateurs qui n'en ont pas besoin.
- N'utilisez pas une seule grande exploration
- Avoir une seule grande exploration avec toutes les données peut entraîner une surcharge d'informations et de la confusion. Il est essentiel de nommer vos dimensions et mesures de manière claire et spécifique. Plus les noms sont clairs et spécifiques, mieux c'est. En outre, veillez à utiliser des étiquettes "groupe" et "vue" pour mieux organiser le sélecteur de champs pour les utilisateurs finaux.
Peut-on faciliter les choses avec un outil ?
Avoir une bonne stratégie de gouvernance des données repose sur trois éléments essentiels:
- Des personnes compétentes
- Des processus bien-conçus
- un outil efficace et agréable à utiliser
Manquer l’un de ces éléments peut rendre la gouvernance des données particulièrement pénible à mettre en oeuvre.
Il y a des choses qu'un outil peut automatiser :
Indexation des ressourcesUne puissante fonction de recherche au-dessus de votre outil BI pour aider les utilisateurs à parcourir des milliers de dashboards.
Actualité des donnéesAffichez la date de la dernière actualisation du dashboard à côté de la documentation.
PopularitéDonnez la priorité aux résultats et aux ressources de données en fonction de la consommation des utilisateurs. Ne vous retrouvez jamais à consulter des dashboards obsolètes datant de l'année dernière.
Traçabilité"Je ne fais confiance qu'à ce que je peux voir" ! Savoir quelles sont les tables et les requêtes utilisées pour créer un dashboard est essentiel pour s'assurer de sa fiabilité. En comprenant les impacts en aval, les data engineers peuvent communiquer avec l'équipe BI pour s'assurer qu'ils ne casseront pas de dashboards importants. Lisez davantage sur les cas d'utilisation du lignage des données ici.
Tests et vérifications de qualitéLe problème avec les dashboards : vous ne voyez pas quelles données sont utilisées, vous ne voyez que le résultat. À moins d'écrire des tests et des vérifications de qualité, vous ne saurez pas si votre dashboard est erroné avant qu'il ne soit trop tard.
Identification des doublons et des ressources obsolètesGagnez du temps et de l'argent en supprimant les ressources de données qui ne sont plus pertinentes. Cela améliore l'état général et la lisibilité de votre outil BI.
Il y a des choses qu'un outil peut faciliter :
Application des processusAssurez-vous que chaque personne concernée reçoit une notification lorsqu'elle doit donner son avis.
CollaborationCommuniquez avec les acteurs de la donnée proches des sources de données afin que les informations pertinentes ne se perdent pas dans un fil de discussion Slack ou pendant une pause café.
Gestion des droitsAvoir une vue d'ensemble des droits d'accès au data warehouse et à l'outil BI peut vous aider à détecter une utilisation illégale des données.
Maintenant, la question est simple.
Pourquoi n'avez-vous pas encore déployé CastorDoc?
CastorDoc est l'outil idéal pour lutter contre la dégradation des dashboards. Il permet aux responsables des données de mettre en place une analytics stack en libre-service sans perdre le contrôle des ressources de données (data warehouse et outils BI). Si vous cherchez plus d'informations, consultez notre blog pour en savoir plus.
À propos de nous
Nous écrivons sur tous les processus impliqués dans l'exploitation des actifs de données : de data stack moderne à la composition des équipes data, en passant par la gouvernance des données. Notre blog couvre les aspects techniques et moins techniques de la création de valeur tangible à partir des données.
Chez CastorDoc, nous développons un outil de documentation des données pour la génération Notion, Figma, Slack.
Ou, pour les adeptes de Fivetran, Looker, Snowflake et DBT, une solution axée sur les données. Nous avons conçu notre logiciel de catalogue pour qu'il soit facile à utiliser, plaisant et collaboratif.
Envie de le découvrir ? Contactez-nous et nous vous ferons une démonstration.
S'inscrire à la newsletter
You might also like
Contactez-nous pour en savoir plus
« J'aime l'interface facile à utiliser et la rapidité avec laquelle vous trouvez les actifs pertinents que vous recherchez dans votre base de données. J'apprécie également beaucoup le score attribué à chaque tableau, qui vous permet de hiérarchiser les résultats de vos requêtes en fonction de la fréquence d'utilisation de certaines données. » - Michal P., Head of Data.