Détection du schéma. SAP Business Intelligence plateforme
Référence du pilote d'accès aux données
Exemple : Qualificateur
Si C:\reports\report_1.csv est la source de données, le qualificateur est C:\reports\ et le nom de table est report_1.csv.
6.1.4 Détection du schéma
La couche d'accès aux données fournit les méthodes suivantes pour la détection du schéma d'un fichier
CSV :
• Pas de détection
• Détection automatique
• Utilisation d'un fichier DDL (Data Definition Language)
• Utilisation d'un fichier DDL SQL
Pour choisir la méthode à appliquer aux fichiers, utilisez le paramètre Détection du schéma dans l'Assistant de connexion. Vous pouvez fournir le schéma en utilisant des fichiers de schéma (DDL ou
SQLDDL). Cela peut s'avérer utile pour les fichiers CSV volumineux et complexes.
Les fichiers sont analysés dans l'ordre alphabétique.
Remarque :
Les premières lignes d'un fichier CSV peuvent contenir des commentaires et être ignorées à l'aide du paramètre Nombre initial de lignes de commentaires dans l'Assistant.
Pas de détection
Le pilote d'accès aux données ignore les lignes de commentaires, analyse la première ligne et détermine le nombre de colonnes mais pas les types de colonne. Toutes les valeurs sont considérées comme des chaînes et la taille des colonnes est définie sur 255 caractères, ce qui correspond à la longueur standard du type de données VARCHAR. Une valeur supérieure à 255 est tronquée. Les colonnes peuvent contenir des valeurs nulles.
Détection automatique
Rappel :
Cette méthode ne peut pas être appliquée à des fichiers contenant des colonnes de longueur fixe.
Le pilote d'accès aux données analyse les fichiers CSV corrects et obtient les informations suivantes :
• Noms de colonne
En règle générale, la première ligne contient les noms de colonne. Sinon, le pilote génère des noms de colonne au format col1, col2, …, coln.
• Types de colonne
68 2013-08-29
Référence du pilote d'accès aux données
69
Le pilote recherche les types de colonne en utilisant des modèles prédéfinis et des paramètres utilisateur pour les types de données numérique, de date/heure. Si une colonne contient des valeurs de différents types, le pilote considère les valeurs de colonne comme des chaînes.
• Tailles de colonne
La taille d'une colonne dépend de son type. Pour les valeurs numériques, la taille de la colonne représente la longueur de la valeur la plus élevée dans la plage du type. Pour les autres valeurs, il s'agit de la longueur de la valeur de la chaîne la plus longue trouvée lors de la détection.
Attention :
Pour permettre au pilote de trouver la chaîne la plus longue, l'optionLignes de test doit être définie sur tous.
• Caractère nul des colonnes
Le caractère nul est défini sur vrai s'il existe une valeur nulle dans la colonne et sur faux si toutes les valeurs sont renseignées.
A moins de sélectionner toutes les lignes, vous sélectionnez le nombre de lignes que le pilote doit analyser en définissant le paramètre Nombre de lignes de test dans l'Assistant de connexion.
Voir les recommandations dans le Guide de l'utilisateur de l'outil de conception d'information.
Utilisation de fichiers DDL
Le pilote d'accès aux données analyse le fichier DDL pour convertir les types de données SQL en type de données du pilote.
Le fichier DDL suit le modèle ci-dessous :
ColumnName[:ColumnType[(Length)]];
Par exemple : col1:VARCHAR(20); col2:DATE; col3:INTEGER; col4:INTEGER;
Le fichier DDL ne peut définir qu'un seul schéma de tables. Le pilote affecte le même schéma à chaque fichier CSV utilisé comme source de données.
Utilisation de fichiers SQLDDL
Le pilote d'accès aux données analyse le fichier SQLDDL pour convertir les types de données SQL en type de données du pilote.
Le fichier SQLDDL suit le modèle ci-dessous :
CREATE TABLE <csvFilename> (
(<ColumnName> <ColumnType> [NOT] NULL,)*
(<ColumnName> <ColumnType> [NOT] NULL)
);
Par exemple :
CREATE TABLE Clients ( id INTEGER NOT NULL, name CHAR(20) NULL,
2013-08-29

Öffentlicher Link aktualisiert
Der öffentliche Link zu Ihrem Chat wurde aktualisiert.