banner_tod_all2.png

Une riche palette de fonctionnalités pensées pour des utilisateurs métiers

Connexion à n'importe quelle source de données

Vous pouvez vous connecter à n'importe quelle source de données en lecture et en écriture, que ce soit du stockage de fichiers, des bases de données relationnelles ou NoSQL ou bien du stockage analytique.

Vous pouvez également lire et écrire depuis et vers n'importe quel type de fichiers structurés tels que CSV, Excel, JSON, XML, etc.

Data Sources - Tale of Data

Flow Designer : construction interactive de pipelines de traitement

Créez par simple glisser-déposer des pipelines (flows) de préparation de données sophistiqués impliquant plusieurs jeux de données.

Identifiez automatiquement les problèmes de qualité de données à chaque étape du flow.

Déployez en production vos pipelines de préparation de données en un clic

Flow Designer - Tale of Data

Plus de 80 transformations standards

Tale of Data fournit plus de 80 transformations, applicables en un simple clic, sur tout ou partie des enregistrements, pour les opérations de base lors de la manipulation des données : assembler, découper, convertir, normaliser, redresser et enrichir.

Notre moteur de suggestions de transformation vous aidera à rapidement apporter des modifications pertinentes à vos jeux de données.

Si vous ne trouvez pas la transformation adaptée à votre besoin, vous avez la possibilité d'utiliser des scripts.

Filtres et Facettes

Vous avez la possibilité de filtrer les jeux de données sur tous types de critères afin d'appliquer les transformations sur un sous-ensemble d'enregistrements.

Les filtres Tale of Data offrent un accès rapide aux distributions des valeurs sur l'ensemble des champs.

Facets and Filters - Tale of Data

Réconciliation à l’aide de référentiels

Vous pouvez créer et maintenir des référentiels d’entreprises qui soient exempts de problèmes de doublons, de formatage, de données manquantes ou incohérentes.

Les algorithmes de matching à la pointe de la technologie (flou, phonétique, etc.) proposés par Tale of Data vous permettent de réconcilier et enrichir vos données avec des données de référence ou des données externes.

Repositories - Tale of Data

Dédoublonnage multi-critères et multi-stratégies

Tale of Data propose de puissants algorithmes de dédoublonnage : flou, N-Gram, phonétique, etc.

Il est possible de dédoublonner en temps constant de très gros jeux de données et de lancer automatiquement des alertes dans des environnements de production lorsque des doublons sont détectés.

Dedupe - Tale of Data

Data Discovery

Notre technologie Mass Data Discovery (MDD) permet une recherche et une catégorisation automatiques des données présentes dans des bases de données et des fichiers.

Le MDD offre la possibilité de créer des cartographies d'anomalies, des cartographies sémantiques, des rapports synthétiques au format PDF et Excel, ainsi que de suivre l'évolution de vos métriques.

Data Discovery - Tale of Data

Audit et supervision de la qualité

Tale of Data repère automatiquement les données manquantes, mal formées ou incohérentes.

Des rapports d'audit de qualité des données au format PDF portant sur un ou plusieurs jeux de données peuvent être générés à la demande.

Il est possible, sur un flow, de configurer des alertes sur des conditions définies par l'utilisateur : présence d'anomalies particulières, taille des jeux de données incohérente, etc.

Ces alertes seront déclenchées lors de l'exécution du flow si les conditions de déclenchement sont remplies.

Tale of Data permet également de contrôler à n'importe quelle étape d'un flow :

  • les données via des règles métier écrites en langage naturel par les utilisateurs

  • les métadonnées en vérifiant le nom et le type des champs

Moteur de recommandation pour la fiabilisation

Notre moteur de recommandation utilise l’Intelligence Artificielle pour suggérer automatiquement des corrections et des enrichissements de données pertinents.

Tale of Data reconnaît automatiquement la nature des données et propose des remédiations possibles, par exemple :

  • sur un numéro de téléphone, le logiciel suggèrera automatiquement d'harmoniser le format au sein du champ (national, international, E164, etc.)

  • sur une zone géographique Tale of Data proposera des enrichissements comme l'ajout de zones administratives (département, région, etc.)

Automatisation

Des flows effectuant des transformations et des validations de données peuvent être mis en production en quelques clics.

Tale of Data offre de nombreuses options pour planifier l'exécution d'un flow : ponctuelle, quotidienne, hebdomadaire, mensuelle, etc.

Il est également possible d'utiliser l'API pour déclencher l'exécution d'un flow depuis un applicatif tiers.

tale-of-data-automation-fr.png

Montée en charge

En phase de conception du flow, des échantillons de centaines de milliers d'enregistrements peuvent être utilisés pour offrir un confort d'utilisation maximale (Data Prep interactive en temps réel).

Lors de l'exécution, il n'y a aucune limite sur la taille des jeux de données autre que celle imposée par l'infrastructure (mémoire disponible, nombre de data nodes dans le cluster, etc.).

Tale of Data peut s'exécuter sur des environnements classiques (mono serveur) ou dans des clusters grâce à la technologie Apache Spark.

Visualisation instantanée de données

Il est essentiel lorsque l'on prépare des données de pouvoir les visualiser instantanément afin d'identifier les problèmes encore présents.

Avec Tale of Data, nul besoin de quitter l'application pour visualiser les données : vous pouvez créer des graphiques et des cartes géographiques instantanés par simple glisser-déposer.

Data Visualization - Tale of Data