Statistiques du profileur. SAP BusinessObjects Data Services 4.1 Support Package 1
Evaluation des données
Indiquez le mot de passe à utiliser pour se connecter au CMS.
•
Authentification
Indiquez le type d'authentification utilisé par le CMS.
3.
Cliquez sur Se connecter.
Le logiciel essaye de se connecter au CMS à l'aide des informations indiquées. Lorsque vous vous connectez avec succès, la liste des référentiels du profileur qui sont à votre disposition est affichée.
4.
Sélectionnez le référentiel que vous souhaitez utiliser.
5.
Cliquez sur OK pour vous connecter à l'aide du référentiel sélectionné.
Lorsque vous vous connectez avec succès au serveur du profileur, l'icône Serveur du profileur sur la barre de statut en bas n'a plus le signe X rouge dessus. De plus, lorsque vous déplacez le pointeur sur l'icône, la barre de statut affiche l'emplacement du serveur du profileur.
Rubriques associées
• Guide Management Console Guide : gestion du serveur du profileur
• Guide d'administration : gestion des utilisateurs et des droits
15.1.3 Statistiques du profileur
340
15.1.3.1 Profil de colonne
Il est possible de générer des statistiques pour une ou plusieurs colonnes. Les colonnes peuvent toutes appartenir à une source de données ou à plusieurs sources de données. Dans le cas d'une génération de statistiques pour plusieurs sources dans une tâche du profileur, toutes les sources doivent être dans la même banque de données.
Profilage de base
Par défaut, le Profileur de données génère les attributs de profileur de base suivants pour chaque colonne sélectionnée.
Attribut de base
Min.
Nombre min.
Max.
Description
La valeur la plus basse dans cette colonne.
Nombre de lignes qui contiennent la valeur la plus basse dans cette colonne.
La valeur la plus élevée dans cette colonne.
2012-11-22
Evaluation des données
Attribut de base
Nombre max.
Moyenne
Longueur minimale de la chaîne
Longueur maximale de la chaîne
Longueur moyenne de la chaîne
Valeurs nulles
% de valeurs nulles
Zéros
% de zéros
Vides
% de vides
Description
Nombre de lignes qui contiennent la valeur la plus élevée dans cette colonne.
Pour les colonnes numériques, la valeur moyenne dans cette colonne.
Pour les colonnes avec des caractères, la longueur de la valeur de chaîne la plus courte dans cette colonne.
Pour les colonnes avec des caractères, la longueur de la valeur de chaîne la plus longue dans cette colonne.
Pour les colonnes avec des caractères, la longueur moyenne des valeurs de chaîne dans cette colonne.
Nombre de valeurs nulles dans cette colonne.
Pourcentage de lignes contenant une valeur nulle dans cette colonne.
Nombre de valeurs 0 dans cette colonne.
Pourcentage de lignes contenant une valeur 0 dans cette colonne.
Pour les colonnes avec des caractères, le nombre de lignes qui contiennent un vide dans cette colonne.
Pourcentage de lignes contenant un vide dans cette colonne.
Profilage détaillé
Il est possible de générer plusieurs attributs détaillés en plus des attributs ci-dessus, mais la génération d'attributs détaillés consomme plus de temps et de ressources de l'ordinateur. Par conséquent, il est recommandé de ne pas sélectionner le profil détaillé à moins d'avoir besoin des attributs suivants :
Attribut détaillé
Médiane
Description
La valeur qui se trouve dans la ligne du milieu de la table source.
Longueur médiane de la chaîne
Distincts
Pour les colonnes avec des caractères, la valeur qui se trouve dans la ligne du milieu de la table source.
Nombre de valeurs distinctes dans cette colonne.
% de distincts
Modèles
% de modèle
Pourcentage de lignes contenant chaque valeur distincte dans cette colonne.
Nombre des différents modèles dans cette colonne.
Pourcentage de lignes contenant chaque modèle dans cette colonne.
341 2012-11-22
Evaluation des données
Exemples d'utilisation des statistiques de profilage de colonne pour améliorer la qualité des données
Il est possible d'utiliser les attributs de profil de colonnes pour vous aider dans les différentes tâches, y compris les tâches suivantes :
• Obtenir des statistiques, des fréquences, des plages et des valeurs hors normes de base. Par exemple, ces statistiques de profilage peuvent indiquer qu'une valeur de colonne est notamment plus élevée que les autres valeurs dans la source de données. Il est possible que vous décidiez alors de définir une transformation Validation pour activer un indicateur dans une table différente avant de charger cette valeur hors normes dans la table cible.
• Identifier des variantes du même contenu. Par exemple, le numéro de référence peut être un type de données integer dans une source de données, et un type de données varchar dans une autre source de données. Il est possible que vous décidiez alors quel type de données vous souhaitez utiliser dans votre entrepôt de données cible.
• Découvrir des modèles et des formats de données. Par exemple, les statistiques de profilage peuvent indiquer que le numéro de téléphone se trouve sous des formats différents. Avec ces informations de profil, il est possible que vous décidiez de définir une transformation Validation pour toutes les convertir afin qu'elles utilisent le même format cible.
• Analyser la plage numérique. Par exemple, le numéro de client peut avoir une plage de chiffres dans une source, et une plage différente dans une autre source. La cible requiert d'avoir un type de données qui s'adapte à la plage maximale.
• Identifier les informations manquantes, les valeurs nulles et les vides dans le système source. Par exemple, les statistiques de profilage peuvent indiquer que les valeurs nulles apparaissent pour les numéros de fax. Il est possible que vous décidiez alors de définir une transformation Validation pour replacer la valeur nulle avec une phrase telle que "Inconnu" dans la table cible.
Rubriques associées
•
Affichage des attributs de colonne générés par le profileur de données
•
Soumission des tâches du profileur de colonnes
15.1.3.2 Profil de relation
Un profil de relation indique le pourcentage des valeurs non correspondantes dans les colonnes des deux sources. Les sources incluent :
• Tables
• Fichiers plats
• Une combinaison d'une table et d'un fichier plat
342 2012-11-22

Enlace público actualizado
El enlace público a tu chat ha sido actualizado.