Tale of Data publie le 1er lexique du marché le “Langage de la Data Quality”
Uniformisation de données issues de sources hétérogènes
Découvrez comment notre solution d'uniformisation de données issues de sources hétérogènes simplifie la gestion et l'intégration des informations provenant de diverses sources pour une meilleure qualité et une vue unifiée de vos données.
Le besoin
Notre client, un acteur majeur du transport de voyageurs et de marchandises, souhaitait diminuer le temps passé -plusieurs semaines, voire plusieurs mois- à rassembler les données d’entrée nécessaires à la réalisation d’un projet.
Les équipes Data du client ont donc commencé à concevoir un portail intranet sur lequel les chefs de projet internes pouvaient trouver en quelques clics les données nécessaires à la réalisation de leurs projets.
Le problème : chaque service produisant des données potentiellement réutilisables publiait une fiche signalétique sur ces données dans un format spécifique. De ce fait, il existait plusieurs centaines de formats.
La raison d’être du portail était de permettre une recherche transverse, donc portant sur des jeux de données produits par différents services. Une harmonisation des fiches signalétiques était par conséquent un prérequis indispensable à la réussite du projet de portail.
Solution proposée
Etablissement du format unique pour la fiche signalétique.
Importation du format : Tale of Data utilise le format cible pour suggérer automatiquement à l’utilisateur les transformations de données nécessaires pour passer du format courant au format cible.
Utilisation de Tale of Data par l’équipe Data du client pour créer, pour chaque format de fiche signalétique en entrée, les listes de transformations de données nécessaires à l’obtention d’une fiche en sortie.
Automatisation de l’ensemble du processus : quotidiennement, de nouvelles fiches signalétiques sont déposées par les différents services sur le Cloud privé du client (Microsoft Azure). Tale of Data récupère ces fiches et leur applique automatiquement les transformations qui leur correspondent (en fonction du service d’origine et de la nature de la fiche signalétique).
Une fois au format pivot les fiches sont dédoublonnées, puis envoyées par Tale of Data vers le portail (par API) où elles sont indexées afin d’être disponibles pour la recherche.
Gains obtenus
Des dizaines de millions d’euros économisés grâce à une diminution spectaculaire du temps de démarrage des nouveaux projets.
Le portail est aujourd’hui systématiquement utilisé par les chefs de projet pour rassembler les données dont ils ont besoin pour leurs projets.
Le taux de réutilisation des données est en forte augmentation : diminution significative du nombre de jeux de données achetés à des prestataires externes car le chef de projet n’avait aucun moyen de savoir qu’ils étaient déjà détenus par l’entreprise.
L’uniformisation des lieux (localisation des chantiers, des entrepôts, des dépôts, …) permet d’effectuer sur le portail des recherches géospatiales précises sur des jeux de données.
Les risques d’échec ont fortement diminué car les projets démarrent plus vite et avec les bonnes données d’entrée.