Préparation d'enregistrements pour correspondance. SAP BusinessObjects Data Services 4.1 Support Package 1
Qualité des données
Noms doubles
Lorsque les noms doubles sont analysés, Data Cleanse propose quatre descriptions de sexe supplémentaires : multi-nom féminin, multi-nom masculin, multi-nom mixte et multi-nom ambigu. Ces sexes sont générés avec Data Cleanse en fonction des sexes affectés aux deux noms. La table ci-dessous affiche la manière dont les sexes multi-noms sont affectés :
Nom double
Sexe du premier nom
Sexe du deuxième nom
Sexe affecté pour nom double
Bob et Sue Jones
Bob et Tom Jones
Sue et Sara Jones
Bob et Pat Jones masculin fort masculin fort féminin fort masculin fort féminin fort masculin fort féminin fort
Ambigu multi-nom mixte
Multi-nom masculins
Multi-nom féminins
Multi-nom ambigu
Prénoms chinois et japonais
Lorsqu'un prénom a été analysé comme le résultat des règles qui combinent intelligemment les caractères du prénom plutôt que d'inclure le nom donné comme une variante dans le package de nettoyage des données, Data Cleanse génère le sexe en combinant le sexe des caractères individuels qui constituent le prénom à l'aide de la table ci-dessous.
Féminin fort
Ambigu
Féminin fort
Masculin fort
Féminin faible
Ambigu féminin fort
Masculin faible
féminin fort
Ambigu féminin fort
Masculin fort
Ambigu masculin fort
Ambigu
Féminin faible
féminin fort
Ambigu
Féminin faible masculin fort masculin fort
Ambigu
Féminin faible
Masculin faible
Ambigu masculin fort
Ambigu
Masculin faible
Masculin faible
Ambigu
féminin fort masculin fort
Féminin faible
Masculin faible
Ambigu
16.2.8 Préparation d'enregistrements pour correspondance
Si vous planifiez un flux de données qui inclut une correspondance, il est recommandé d'utiliser d'abord
Data Cleanse pour normaliser les données afin d'améliorer la précision des correspondances. La transformation Data Cleanse doit être en amont de la transformation Match.
393 2012-11-22
Qualité des données
La transformation Data Cleanse peut générer des standards de correspondance ou d'autres noms pour de nombreux champs de nom et de société, ainsi que pour tous les champs de sortie personnalisée.
Par exemple, Data Cleanse peut affirmer que Patrick et Patricia sont des correspondances potentielles pour le nom Pat. Les standards de correspondance peuvent aider à surmonter deux types de problèmes de correspondance : orthographe différent (Catherine et Katherine) et surnoms (Pat et Patrick).
Cet exemple indique la manière dont Data Cleanse peut préparer des enregistrements pour la correspondance.
Tableau 16-13 : Source de données 1
Enregistrement d'entrée
Intl Marketing, Inc.
Pat Smith, directeur de comptabilité
Enregistrement nettoyé
Prénom 1
Standards de correspondance
Prénom 2
Nom de famille
Fonction
Société
Pat
Patrick, Patricia
Smith
Directeur de comptabilité
Intl. Mktg, Inc.
Tableau 16-14 : Source de données 2
Enregistrement d'entrée
Smith, Patricia R.
International Marketing, Incorp.
Enregistrement nettoyé
Prénom 1
Standards de correspondance
Prénom 2
Nom de famille
Fonction
Société
Patricia
R
Smith
Intl. Mktg, Inc.
Lorsqu'un package de nettoyage des données n'inclut pas un autre nom, le champ de sortie du standard de correspondance pour ce terme est vide. Dans le cas d'une sortie multi-mots telle qu'un nom de société, lorsqu'aucune des variantes dans le nom de société n'a un autre nom, alors la sortie du standard de correspondance est vide. Cependant, si au moins une variante a un autre nom associé, le standard de correspondance est généré à l'aide de l'autre nom de la variante lorsque disponible, et des variantes pour les mots qui n'ont pas un autre nom.
394 2012-11-22

Enlace público actualizado
El enlace público a tu chat ha sido actualizado.