Assistant de correspondance. SAP BusinessObjects Data Services 4.1 Support Package 1
Qualité des données
Critères de correspondance
Les critères de correspondance font référence au champ que vous voulez faire correspondre. Vous pouvez utiliser des options de critères pour spécifier des règles de gestion pour la correspondance sur chacun de ces champs. Ces règles vous permettent de définir à quel niveau d'exactitude les données doivent répondre pour être considérées comme des correspondances.
Vous pouvez, par exemple, définir un niveau de similarité d'au moins 85 % pour les prénoms, mais autoriser aussi l'initiale d'un prénom à correspondre à un prénom complet et autoriser un prénom à correspondre à un deuxième prénom.
• Les critères de correspondance au niveau de la famille peuvent inclure le nom de famille et l'adresse ou le nom de famille et le numéro de téléphone.
• Les critères de correspondance au niveau de l'individu peuvent inclure le nom complet et l'adresse, le nom complet et le NSS ou le nom complet et l'adresse électronique.
• Les critères de correspondance au niveau de la société peuvent inclure le nom de la société et l'adresse, le nom de la société et le code NACE ou le nom de la société et le numéro DUNS (Data
Universal Numbering System).
16.4.3 Assistant de correspondance
432
16.4.3.1 Assistant de correspondance
L'Assistant Match peut rapidement configurer les flux de données de correspondance sans que vous ayez à créer manuellement chaque transformation individuelle nécessaire pour terminer la tâche.
Opérations prises en charge par l'Assistant de correspondance
L'Assistant Match :
• Génère toutes les transformations requises pour exécuter la stratégie de correspondance choisie.
• Applique des valeurs par défaut à vos critères de correspondance selon la stratégie choisie.
• Place les transformations générées dans l'espace de travail, connectées à la plateforme choisie en amont.
• Détecte les champs appropriés en amont et les mappe automatiquement.
Opérations non prises en charge par l'Assistant de correspondance
L'Assistant Match vous fournit une configuration de correspondance de base, qui requiert parfois une personnalisation en fonction de vos règles de gestion.
L'Assistant Match :
2012-11-22
Qualité des données
• Ne modifie pas les données traitées. Pour corriger des entrées non standard ou des données manquantes, placez l'une des transformations de nettoyage des adresses et une transformation
Data Cleanse en amont du processus de correspondance.
• Ne connecte pas les transformations Match générées à une transformation en aval, comme un chargeur. C'est à vous de connecter ces transformations.
• Ne permet pas de définir des valeurs basées sur des règles ou des valeurs de scoring pondéré à des fins de correspondance. L'Assistant Match intègre des "meilleures pratiques" qui définissent ces valeurs à votre place. Vous pouvez modifier les valeurs d'options en fonction de vos règles de gestion.
Rubriques associées
•
433
16.4.3.2 Avant de commencer
Préparer un flux de données pour l'Assistant Correspondance
Pour optimiser la performance de l'Assistant Match, veillez à inclure les éléments suivants avant de le lancer :
• Incluez un lecteur dans votre flux de données. Imaginons que vous vouliez faire correspondre un champ d'entrée spécifique que nos transformations de nettoyage des données ne prennent pas en charge.
• Incluez l'une des transformations de nettoyage des adresses et la transformation Data Cleanse.
L'Assistant Match est optimisé si les données que vous faites correspondre ont déjà été nettoyées et analysées dans des champs discrets en amont dans le flux de données.
• Pour faire correspondre des champs d'adresses, veillez à les faire passer par la transformation Data
Cleanse. Sinon, ils ne seront pas disponibles pour la transformation Match (et l'Assistant Match).
Cette règle s'applique aussi si la transformation Data Cleanse est placée avant une transformation de nettoyage des adresses.
16.4.3.3 Utilisation de l'assistant de correspondance
16.4.3.3.1 Sélection de la stratégie de correspondance
L'Assistant Match commence par vous inviter à sélectionner une stratégie de correspondance en fonction de vos exigences de règles de gestion. Le chemin à suivre dans l'Assistant Match dépend de la stratégie sélectionnée. Utilisez ces descriptions pour décider de la meilleure stratégie à adopter :
2012-11-22
Qualité des données
434
• Correspondance simple. Utilisez cette stratégie si vos règles de gestion en matière de correspondance reposent sur un critère de correspondance simple pour identifier des relations dans des données consommateur, métier ou produit.
• Membres de la famille. Utilisez cette stratégie si vos règles de gestion en matière de correspondance reposent sur plusieurs niveaux de relations consommateur tels que correspondances d'adresses, correspondances familiales et correspondances individuelles.
• Membres de l'organisation. Utilisez cette stratégie si vos règles de gestion en matière de correspondance reposent sur plusieurs niveaux de relations professionnelles tels que correspondances d'entreprises, correspondances de filiales et correspondances de contacts.
• Correspondance de consommateur multinational. Utilisez cette stratégie de correspondance si vos données incluent plusieurs pays et que vos règles de gestion en matière de correspondance diffèrent selon les pays.
Remarque :
La stratégie Correspondance de consommateur multinational configure un flux de données pour des données Latin1. Pour utiliser la correspondance Unicode, vous devez modifier votre flux de données après sa création.
• Identifier une personne de différentes manières. Utilisez cette stratégie si vos règles de gestion en matière de correspondance reposent sur plusieurs critères de correspondance pour identifier des relations et que vous voulez trouver le chevauchement entre toutes ces définitions.
Statistiques source
Si vous voulez générer des statistiques source pour vos rapports, assurez-vous qu'un champ contenant la valeur source physique existe dans toutes les sources de données.
Pour générer des statistiques source pour vos rapports de correspondance, cochez la case Générer
des statistiques pour vos sources, puis sélectionnez un champ contenant la valeur source physique.
Rubriques associées
•
•
Correspondance par association
16.4.3.3.2 Identification des critères de correspondance.
Les critères représentent les données que vous voulez utiliser pour déterminer les correspondances.
Dans cette fenêtre, vous devez définir ces critères pour chaque set de correspondance que vous utilisez.
Les sets de correspondance comparent les données pour rechercher des enregistrements similaires, indépendamment dans chaque groupe de décomposition désigné (ultérieurement dans l'Assistant de correspondance). Les enregistrements d'un groupe de décomposition ne sont pas comparés à ceux d'un autre groupe de décomposition.
Pour rechercher les données correspondant à tous les champs, utilisez un set de correspondance unique avec plusieurs champs. Pour rechercher les données correspondant uniquement à une combinaison spécifique de champs, utilisez plusieurs sets de correspondance avec deux champs.
2012-11-22
Qualité des données
En travaillant sur des données d'étudiant ou de pigeon voyageur, un individu peut utiliser le même nom, mais avoir plusieurs adresses valides.
Sélectionnez une combinaison de champs qui indique au mieux les informations qui se chevauchent, telles que le nom de famille et le NSS.
Données1 Données2 Données3 Données4
R. Carson 1239 Whistle Lane Columbus, Ohio 555-23-4333
Robert T. Carson 52 Sunbird Suites Tampa, Florida 555-23-4333
1.
Entrez le nombre de manières requises pour identifier un individu. Vous obtenez alors le nombre de sets de correspondance correspondant (transformations) dans le flux de données.
2.
Le nom du set de correspondance par défaut apparaît dans le champ Nom. Sélectionnez un set de correspondance dans la liste Sets de correspondance et saisissez un nom plus pertinent, si nécessaire.
3.
Pour chaque set de correspondance, sélectionnez le critère à faire correspondre.
Vous affecterez ensuite des champs de transformations en amont à ces critères.
4.
Sélectionnez l'option à utiliser pour la comparaison dans la colonne Comparer à l'aide de. Les options varient selon le critère choisi. Les options de comparaison sont les suivantes :
•
Similarité de champs
•
Similarité de mots
•
Différence numérique
•
Différence numérique en pourcentage
•
Proximité géographique
5.
Facultatif : Si vous choisissez de faire une correspondance sur Personnalisé, saisissez un nom pour le critère personnalisé dans la colonne Nom personnalisé.
6.
Facultatif : Si vous choisissez d'effectuer une correspondance sur Personnalisé, indiquez à quel point les données doivent correspondre pour que le critère en deux enregistrements soit considéré comme une correspondance. Les valeurs qui en résultent déterminent le degré de similarité attendu lors du processus de comparaison pour ce critère uniquement. Après avoir sélectionné une stratégie, vous pouvez modifier les valeurs des options de règles de comparaison en fonction de vos besoins de correspondance spécifiques. Sélectionnez l'un des éléments suivants dans la liste de la colonne
Exactitude personnalisée :
• Correspondance exacte : Les données de ce critère doivent être parfaitement identiques.
Aucune variation n'est autorisée dans les données.
• Correspondance élevée : Les données de ce critère doivent comporter un niveau élevé de similarité. Un faible niveau de variation est autorisé dans les données.
• Correspondance moyenne : Les données de ce critère doivent comporter un niveau moyen de similarité. Un niveau moyen de variation est autorisé dans les données.
435 2012-11-22
Qualité des données
436
• Correspondance faible : Les données de ce critère doivent comporter un niveau faible de similarité. Un niveau important de variation est autorisé dans les données.
16.4.3.3.3 Définition des niveaux de correspondance
Les niveaux de correspondance permettent de définir les processus de correspondance à différents niveaux liés de manière logique. Les niveaux de correspondance font référence à la catégorie globale de correspondance et non aux règles spécifiques de correspondance. Par exemple, une correspondance pour le niveau Domicile correspondra uniquement à des éléments d'adresse, une correspondance pour le niveau Famille correspondra uniquement au nom de famille et une correspondance pour le niveau
Individu correspondra uniquement au prénom.
La correspondance multiniveaux peut contenir jusqu'à trois niveaux dans un set de correspondance unique défini de façon incrémentielle. La correspondance multiniveaux alimente uniquement les enregistrements qui correspondent de niveau de correspondance en niveau de correspondance (à savoir résident, famille, individu) à des fins de comparaison.
Pour définir des niveaux de correspondance :
1.
Cliquez sur la correspondance de niveau supérieur et saisissez un nom pour le niveau (ou conservez le nom par défaut). Les critères par défaut sont déjà sélectionnés. Si vous ne voulez pas les utiliser, décochez la case.
La sélection des critères par défaut est un bon point de départ pour sélectionner des critères. Vous pouvez ajouter des critères pour chaque niveau afin d'obtenir des correspondances plus précises.
2.
Sélectionnez des critères complémentaires pour ce niveau.
3.
Si vous voulez utiliser des critères autres que ceux proposés, cliquez sur Personnalisé, puis sélectionnez les critères souhaités.
4.
Poursuivez jusqu'à ce que tous les niveaux requis soient renseignés.
16.4.3.3.4 Sélection de pays
Sélectionnez les pays dont les standards postaux peuvent être requis pour pouvoir comparer les données entrantes. Le panneau de gauche affiche une liste de tous les pays disponibles. Le panneau de droite affiche les pays que vous avez déjà sélectionnés.
1.
Sélectionnez le nom du pays dans la liste Tous les pays.
2.
Cliquez sur Ajouter pour le déplacer dans la liste Pays sélectionnés.
3.
Répétez les étapes 1 et 2 pour chaque pays à inclure.
Vous pouvez aussi sélectionner plusieurs pays à la fois et les ajouter tous en cliquant sur le bouton
Ajouter.
Les pays sélectionnés sont gardés en mémoire pour la prochaine session de l'Assistant Match.
16.4.3.3.5 Regroupement des pays dans des axes
Créez des axes pour regrouper les pays par combinaisons logiques selon vos règles de gestion (par exemple, Asie, Europe, Amérique du Sud). Chaque axe crée jusqu'à six sets de correspondance
(transformations Match).
2012-11-22
Qualité des données
437
1.
Sélectionnez le nombre d'axes à créer. La lise des axes reflète le nombre d'axes sélectionné et leur affecte un numéro d'axe.
2.
Pour créer chaque axe, sélectionnez un titre d'axe tel que Axe1.
3.
Sélectionnez les pays à inclure dans cet axe.
4.
Cliquez sur Ajouter pour déplacer les pays sélectionnés vers l'axe sélectionné.
Utilisez la liste COUNTRY UNKNOWN (__) pour les données dont le pays d'origine n'a pas été identifié.
Utilisez la liste COUNTRY OTHER (--) pour les données dont le pays d'origine a été identifié, mais n'existe pas dans la liste des pays sélectionnés.
5.
Dans Moteurs de comparaison, sélectionnez l'un des moteurs suivants pour chaque axe :
Remarque :
Toutes les transformations Match générées pour l'axe utiliseront le moteur de comparaison sélectionné.
• LATIN1 (par défaut)
•
CHINOIS
•
JAPONAIS
•
COREEN
•
TAIWANAIS
•
AUTRE_NON_LATIN1
Le bouton Suivant est activé uniquement lorsque tous les axes ont une entrée et tous les pays sont affectés à un axe.
16.4.3.3.6 Sélection de champs de critères
Sélectionnez et désélectionnez des champs de critères pour chaque set de correspondance et niveau de correspondance créés dans votre flux de données. Ces sélections déterminent quels sont les champs comparés pour chaque enregistrement. Certains critères peuvent être sélectionnés par défaut en fonction des données en entrée.
S'il n'existe qu'un seul champ du type de contenu approprié, il n'est pas possible de le modifier pour ces critères dans l'Assistant Match.
Pour activer le bouton Suivant, vous devez sélectionner au moins un champ standard de non-correspondance.
1.
Pour chaque champ de critères à inclure, sélectionnez un champ disponible dans la liste déroulante, qui contient des champs de sources en amont. Les champs disponibles sont limités aux types de contenu appropriés pour ces critères. Si aucun champ du type approprié n'est disponible, tous les champs en amont s'affichent dans le menu.
2.
Facultatif : désélectionnez les champs de critères que vous ne voulez pas inclure.
16.4.3.3.7 Création de clés de décomposition
Utilisez des clés de décomposition pour créer des groupes gérables de données à comparer. Le set de correspondance compare les données des enregistrements au sein de chaque groupe de
2012-11-22
Qualité des données décomposition uniquement et non à travers les différents groupes. Le fait d'effectuer des sélections correctes permet de réduire le temps de traitement en évitant les comparaisons de données profondément divergentes.
Les clés de décomposition sont particulièrement importantes lorsque vous traitez de gros volumes de données, car la taille des groupes de décomposition peut affecter le temps de traitement. Même si vos données ne sont pas volumineuses, les groupes de décomposition accélèrent le temps de traitement.
Créez des clés de décomposition qui regroupent des données similaires susceptibles de contenir des correspondances. N'oubliez pas que les enregistrements d'un groupe de décomposition ne seront pas comparés aux enregistrements d'un autre groupe de décomposition.
Par exemple, lorsque vous effectuez une correspondance pour rechercher des adresses en double, basez la clé de décomposition sur le code postal, la ville ou l'Etat pour créer les groupes les plus susceptibles de correspondre. Lorsque vous effectuez une correspondance pour rechercher des individus en double, basez la clé de décomposition sur le code postal et une partie du nom, qui sont les plus susceptibles de correspondre.
Création de clés de décomposition
1.
Dans la colonne "Combien de champs ?", sélectionnez le nombre de champs à inclure dans la clé de décomposition.
2.
Pour chaque clé de décomposition, sélectionnez les éléments suivants :
• le ou les champs dans la clé de décomposition
• le point de départ de chaque champ
• le nombre d'emplacements à lire dans chaque champ
3.
Après avoir défini les clés de décomposition, procédez comme suit :
• Cliquez sur Terminer. La transformation Match se termine.
• Si vous effectuez une correspondance multinationale, cliquez sur Suivant pour accéder à la page Critères de correspondance.
16.4.3.4 Après la configuration
Bien que l'Assistant Match fasse une grande partie du travail, voici quelques étapes à suivre pour exécuter correctement votre job de correspondance. Vous pouvez aussi effectuer d'autres opérations pour affiner votre processus de correspondance.
Se connecter aux transformations en aval
Lorsque l'Assistant Match a terminé, il place les transformations générées dans l'espace de travail, connectées à la transformation en amont que vous avez sélectionnée pour lancer l'Assistant Match.
Pour pouvoir exécuter votre job, vous devez connecter chaque port de la dernière transformation à une plateforme en aval. Pour ce faire, cliquez sur un port et faites-le glisser pour le connecter à l'objet souhaité.
438 2012-11-22

公開リンクが更新されました
あなたのチャットの公開リンクが更新されました。