Utilisation de la transformation Entity Extraction. SAP BusinessObjects Data Services 4.1 Support Package 1
Transformations
8.6.2.3 Aperçu de règle
Une règle d'extraction définit des modèles personnalisés pour extraire des entités, des relations, des
événements et d'autres extractions plus importantes soumises ensemble en tant que faits. Vous écrivez des règles d'extraction personnalisées pour exécuter une extraction répondant à vos besoins spécifiques.
8.6.3 Utilisation de la transformation Entity Extraction
La transformation Entity Extraction peut extraire des informations à partir d'un contenu au format texte,
HTML, XML, ou binaire (tel que PDF) et générer une sortie structurée. Vous pouvez utiliser la sortie de plusieurs façons en fonction de votre workflow. Vous pouvez l'utiliser comme entrée pour une autre transformation ou l'écrire dans plusieurs sources de sortie, par exemple une table de base de données ou un fichier plat. La sortie est générée en codage UTF-16. La liste suivante indique des scénarios sur le moment où utiliser la transformation seule ou associée à d'autres transformations Data Services.
• Recherche d'informations et de relations spécifiques issues d'une quantité importante de texte liée
à un domaine générale. Par exemple, une société est intéressée par l'analyse des commentaires client reçus dans un texte en forme libre suite au lancement d'un nouveau produit.
• Relier des informations structurées à partir d'un texte non structuré avec des informations structurées existantes pour effectuer de nouvelles connexions. Par exemple, un service de poursuite pénale essaie d'établir des connexions entre divers crimes et des personnes impliquées à l'aide de sa propre base de données et des informations disponibles dans divers rapports au format texte.
• Analyse et rapport relatif aux problèmes de qualité d'un produit, par exemple des réparations trop
élevées et des retours de certains produits. Par exemple, vous pouvez disposer d'informations structurées sur des produits, des pièces, des clients et des fournisseurs dans une base de données, alors que des informations importantes relatives aux problèmes peuvent se présenter sous forme de notes : champs d'enregistrements de maintenance, journaux de réparation, escalades produit et journaux de centre de support. Pour identifier les problèmes, vous devez établir des connexions entre diverses formes de données.
8.6.4 Différences entre traitement des données de texte et transformations Data
Cleanse
La transformation Entity Extraction propose une fonctionnalité similaire à la transformation Data Cleanse dans certains cas, notamment concernant les fonctions de personnalisation. Cette section décrit les différences entre les deux transformations et celle qui doit être utilisée conformément à vos objectifs.
La transformation Traitement des données de texte et la transformation Entity Extraction sont logiques
209 2012-11-22

Lien public mis à jour
Le lien public vers votre chat a été mis à jour.