Qualité des données. SAP BusinessObjects Data Services 4.1 Support Package 1
Qualité des données
Qualité des données
16.1 Présentation de la qualité des données
Qualité des données est un terme qui fait référence à l'ensemble de transformations qui fonctionnent ensemble pour améliorer la qualité des données en nettoyant, améliorant, faisant correspondre et consolidant les éléments de données.
La qualité des données est principalement obtenue dans le progiciel à l'aide de quatre transformations :
• Address Cleanse. Analyse, standardise, corrige et améliore les données d'adresses.
• Data Cleanse. Analyse, standardise, corrige et améliore les données clients et opérationnelles.
• Geocoding. Utilise des données de coordonnées géographiques, d'adresses, de points d'intérêt pour ajouter adresse, latitude et longitude, recensement et autres informations à vos enregistrements.
• Match. Identifie les enregistrements doublons à plusieurs niveaux lors d'un seul transfert des individus, des membres ou des organisations dans plusieurs tables ou bases de données et les consolide en une source unique.
Rubriques associées
•
•
A propos du nettoyage de données
•
•
16.2 Data Cleanse
16.2.1 A propos du nettoyage de données
Le nettoyage de données désigne le processus d'analyse et de standardisation des données.
377 2012-11-22
Qualité des données
Les règles d'analyse et autres informations qui définissent le mode d'analyse et de standardisation sont stockées dans un package de nettoyage des données. Le Cleansing Package Builder de SAP
BusinessObjects Information Steward fournit une interface utilisateur graphique permettant de créer et d'affiner les packages de nettoyage des données. Pour respecter vos besoins et standards spécifiques en matière de nettoyage des données, il est possible de créer un package de nettoyage des données en partant de zéro d'après un exemple de données ou bien d'en adapter un existant ou fourni par SAP.
Un package de nettoyage des données est créé et publié dans le Cleansing Package Builder, puis référencé par la transformation Data Cleanse dans SAP BusinessObjects Data Services à des fins de tests et de déploiement de la production.
Dans un workflow de Data Services, la transformation Data Cleanse identifie et isole des parties spécifiques de différentes données, puis les analyse et les met en forme selon le package de nettoyage des données référencé ainsi que les options définies directement dans la transformation.
Le diagramme suivant illustre comment SAP BusinessObjects Data Services et SAP BusinessObjects
Information Steward travaillent ensemble pour permettre de développer un package de nettoyage des données spécifique à vos besoins en matière de données et de l'appliquer lors du nettoyage de vos données.
16.2.2 Cycle de vie du package de nettoyage des données : développement, déploiement et gestion
Le processus de développement, de déploiement et de gestion d'un package de nettoyage des données est le résultat d'actions et de communications entre l'administrateur de Data Services, le testeur de
Data Services et l'administrateur de données du Générateur de packages de nettoyage. Les rôles, responsabilités et titres exacts varient selon les organisations, mais comprennent souvent ce qui suit :
378 2012-11-22
Qualité des données
Rôle
Administrateur de données du Générateur de packages de nettoyage des données
Responsabilité
Utilise le Générateur de packages de nettoyage et possède des connaissances en matière de domaines pour développer et affiner un package de nettoyage des données spécifique à un domaine de données.
Testeur de Data Services
Administrateur Data Services
Dans un environnement de test de Data Services, utilise la transformation
Data Services pour nettoyer les données et vérifier les résultats. Travaille avec l'administrateur de données du Générateur de packages de nettoyage de données pour affiner un package de nettoyage des données.
Dans un environnement de production Data Services, utilise la transformation Data Cleanse pour nettoyer les données selon les règles et les standards définis dans le package de nettoyage des données sélectionné.
Il existe habituellement trois phases itératives dans un workflow de package de nettoyage des données : développement (création et test), déploiement et gestion.
Durant la phase de création et de test, l'administrateur de données crée un package de nettoyage des données personnalisé d'après un exemple de données fourni par l'administrateur de Data Services, puis travaille avec le testeur de Data Services pour affiner le package de nettoyage des données.
Quand tout un chacun est satisfait des résultats, le package de nettoyage des données est déployé en production.
Durant la phase de déploiement, l'administrateur, le testeur et l'administrateur de données de Data
Services travaillent ensemble pour affiner encore le package de nettoyage des données afin que les données de production soient nettoyées en respectant la plage acceptable établie.
Pour terminer, le package de nettoyage des données passe en phase de gestion et mis à jour uniquement si les résultats des jobs planifiés régulièrement ne respectent pas la plage ou lorsque de nouvelles données sont introduites.
Un workflow classique est illustré par le diagramme ci-dessous :
379 2012-11-22
Qualité des données
380
Pour en savoir plus sur le processus de déplacement d'un package de nettoyage des données du développement vers la production et vers la maintenance, voir le
Guide d'administration SAP
BusinessObjects Information Steward.
Pour en savoir plus sur l'utilisation de l'outil de gestion des promotions de la Central Management
Console (CMC) pour déplacer des packages de nettoyage des données (ce qui est désigné sous le terme de promotion d'“objets” ou d'“InfoObjects”), voir le
Guide d'administration de la plateforme Business
Intelligence.
2012-11-22

Public link updated
The public link to your chat has been updated.