Qualité des données
16.4.12 Correspondance phonétique
Les fonctions Double Metaphone et Soundex permettent de renseigner un champ et de l'utiliser pour créer des groupes de décomposition ou comme critère dans une correspondance.
Critère de correspondance
Dans certains cas, l'utilisation de données phonétiques comme critère peut produire un plus grand nombre de correspondances qu'une comparaison par rapport à d'autres critères comme le nom ou des données société.
La correspondance par rapport aux données du champ Nom donne des résultats différents de la correspondance basée sur des données phonétiques. Par exemple :
Nom Score de comparaison
Smith
Smythe
Similaire à 72 %
Nom
Smith
Smythe
Clé phonétique (primaire) Score de comparaison
SMO
Similaire à 100 %
SMO
Options des critères
Si vous voulez établir la correspondance d'après des données phonétiques, configurez les options des critères comme suit.
Option
Algorithme de comparaison
Rechercher des lettres transposées
Score d'ajustement des initiales
Score d'ajustement des sous-chaînes
0
0
Valeur
Champ
Non
511 2012-11-22
Qualité des données
512
Option
Score d'ajustement des abréviations
Valeur
0
Scores de correspondance
Si vous établissez la correspondance d'après le critère phonétique seulement, définissez les options de scores de correspondance comme suit.
Option
Score de correspondance
Aucun score de correspondance
Valeur
100
99
Si vous établissez la correspondance d'après plusieurs critères, dont un critère phonétique, placez le critère phonétique en premier dans l'ordre des critères et définissez vos options de scores de correspondance comme suit :
Option
Score de correspondance
Aucun score de correspondance
Valeur
101
99
Champs vides
Lorsque vous utilisez des groupes de décomposition, les enregistrements qui ne comportent aucune valeur ne se trouvent pas dans le même groupe que ceux qui comportent une valeur (sauf si vous configurez la correspondance par rapport aux champs vides). Prenons l'exemple des deux enregistrements d'entrée suivants :
Mr Johnson 100 Main St La Crosse WI 54601
Scott Johnson 100 Main St La Crosse WI 54601
Une fois ces enregistrements traités par la transformation Data Cleanse, le premier enregistrement comporte un champ de prénom vide et, de ce fait, un champ phonétique vide. Dans ces conditions, vous ne pouvez obtenir aucune correspondance en créant des groupes de décomposition. Si vous ne créez pas de groupes de décomposition, vous ne pouvez obtenir un résultat qu'en utilisant la correspondance des vides.
Longueur des données
La longueur que vous affectez à une sortie de fonction phonétique revêt de l'importance. Par exemple :
2012-11-22