2 SAP InfiniteInsight®
D
ANS CE CHAPITRE
2.1 Présentation
SAP InfiniteInsight ® est la solution de Data Mining idéale pour modéliser vos données en toute simplicité et avec la plus grande rapidité, tout en obtenant des résultats pertinents et facilement interprétables. Grâce à
SAP InfiniteInsight
®
, vous transformez rapidement vos données en connaissance et prenez les bonnes décisions stratégiques et opérationnelles au bon moment.
SAP InfiniteInsight ® met les dernières techniques de Data Mining à la portée de n'importe quel utilisateur métier. SAP InfiniteInsight ® vous permet d'accéder facilement à de nombreux formats de sources de données et de générer de manière semi-automatique et extrêmement rapide des modèles explicatifs et prédictifs et des modèles descriptifs.
Avec SAP InfiniteInsight ® , vous pouvez vous concentrer sur les activités à forte valeur ajoutée que constituent l'analyse des résultats de la modélisation de vos données et la prise de décision.
10
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
2.2 Architecture et fonctionnement
En se basant sur un schéma d'architecture général présenté ci-dessous, cette section présente :
les différents types d'interfaces vous permettant d'utiliser SAP InfiniteInsight ® .
11
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
2.2.1 Interfaces d'utilisation
Les trois types d'interface d'utilisation
Trois types d'interfaces vous permettent d'utiliser les fonctionnalités de SAP InfiniteInsight ® :
une interface graphique utilisateur,
un interpréteur de commandes,
des API de contrôle (
Application Programming Interface
).
L'interface graphique
L'interface KxJWizard s'adresse principalement aux "utilisateurs finaux" ou "métier". Elle donne accès à des assistants de modélisation, qui vous permettent d'utiliser les fonctionnalités SAP InfiniteInsight
®
et de modéliser vos données avec la plus grande facilité. En même temps, elle propose un ensemble de graphiques facilitant la visualisation et l'interprétation des résultats de la modélisation.
Cette interface, fournie à titre d'exemple, est développée en Java sur la base de l'API CORBA et fonctionne sur n'importe quelle plate-forme (Windows, UNIX, etc.). Grâce aux API proposées avec SAP InfiniteInsight
®
, vous pouvez développer vos propres interfaces graphiques.
L'interpréteur de commande KxShell
L'interpréteur KxShell vous permet d'utiliser SAP InfiniteInsight ® à l'aide de commandes. Un script KxShell transmet les commandes d’une modélisation aux différentes fonctionnalités.
L'interpréteur de commandes est un exemple de développement basé sur l'API C++. Comme une API, il peut
être utilisé pour intégrer SAP InfiniteInsight
®
à d'autres applications ou progiciels.
Les API de contrôle
Les API de contrôle (
Application Programming Interface
) s'adressent principalement aux développeurs, ou aux utilisateurs ayant une pratique de la programmation. Ces API donnent accès à tout l'éventail des fonctionnalités et aux paramétrages les plus fins des fonctionnalités SAP InfiniteInsight ® elles permettent d'intégrer les fonctionnalités SAP InfiniteInsight applications ou progiciels.
®
. En même temps,
de manière personnalisée à d'autres
Trois API sont livrées avec SAP InfiniteInsight
®
:
une API COM/DCOM, utilisable sur les plates-formes Microsoft,
une API CORBA, utilisable sur toute plate-forme en mode Client/Serveur,
une API C++, utilisable sur toute plate-forme en mode standalone.
12
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
2.2.2 Fonctionnement
Le fonctionnement de SAP InfiniteInsight ® peut être subdivisé en quatre phases :
Phase 1 - Accès aux données
Phase 2 - Manipulation et préparation des données
Phase 3 - Modélisation des données
Phase 4 - Présentation et déploiement des modèles
Phase 1 : Accès aux données
SAP InfiniteInsight ® accède à divers types de sources de données :
des fichiers "à plat", tels que les fichiers .csv, les fichiers tabulés et autres fichiers de type texte.
des sources compatibles ODBC, telles que les bases de données Oracle, SQL Server ou IBM DB2.
L' API C Data Access permet de connecter des sources au format propriétaire, telles que des senseurs industriels.
Dans la majorité des cas, et notamment si vous utilisez les fonctionnalités SAP InfiniteInsight
®
via une interface graphique, vous n'avez pas à vous préoccuper des processus d'accès aux données. L'accès aux données est réalisé de manière quasi-transparente : dans l'interface utilisateur graphique, il vous suffit de sélectionner le format de source de données à utiliser (fichiers "à plat" ou sources de données compatibles ODBC) et de spécifier la localisation du fichier de données. L' API C Data Access est utile pour les développeurs qui souhaitent écrire des accès à des bases de données au format propriétaire.
La fonctionnalité InfiniteInsight® Access
La fonctionnalité InfiniteInsight ® Access (KAA) permet la lecture des données SAS et l’écriture dans une table
SAS des scores obtenus par un modèle SAP InfiniteInsight
®
.
Actuellement, les formats gérés sont les suivants :
fichiers SAS version 6 sous Windows & Unix
SAS 7/8 sous Windows & Unix
Fichiers SAS Transport
L’accès à une table SAS se fait directement grâce à l'interface SAP InfiniteInsight
®
en indiquant simplement le type du format du fichier à analyser. La génération d’une table SAS contenant les résultats de l’application d'un modèle SAP InfiniteInsight ® ( scores, probabilités, numéro du segment, valeur prévue…) se fera de la même en façon, en indiquant le format de la table en sortie grâce à l’interface SAP InfiniteInsight ainsi générée au format SAS est intégrée automatiquement dans le système d’information SAS.
® . La table
13
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
Phase 2 : Manipulation et préparation des données
InfiniteInsight ® Explorer / Codeur de séquences (KSC) et InfiniteInsight ® Explorer / Codeur des journaux d'événements (KEL) sont des fonctionnalités de préparation et de manipulation de données. L’utilisation de ces fonctionnalités est simple pour l’utilisateur final et les traitements sont effectués de manière automatique.
InfiniteInsight ® Explorer / Codeur des journaux d'événements (KEL) rassemble des évènements par période de temps. Il permet d'intégrer des données transactionnelles aux données démographiques des consommateurs.
Il est utilisé dans le cas où les données brutes contiennent des informations statiques telles que l'âge, le sexe ou la profession d'une personne, et des variables dynamiques, telles que les habitudes de consommation ou les transactions de cartes bancaires.Les données sont automatiquement regroupées dans la période définie par l'utilisateur sans avoir à programmer en SQL ou à modifier les diagrammes de bases de données.
InfiniteInsight
®
Explorer / Codeur des journaux d'événements combine et compresse ces données pour les rendre utilisables par les autres composants de SAP InfiniteInsight ® .
InfiniteInsight ® Explorer / Codeur de séquences (KSC) regroupe des évènements en une succession de transitions. Par exemple, le parcours d'un internaute dans un site web lors d'une session peut être transformé en un ensemble de données. Chaque colonne représente une transition particulière d'une page vers une autre.
Comme pour InfiniteInsight
®
Explorer / Codeur des journaux d'événements, ces nouvelles colonnes de données peuvent être ajoutées aux données existantes d'un consommateur et sont rendues exploitables pour les autres composants de SAP InfiniteInsight ® .
InfiniteInsight ® Modeler / Codeur analytique (K2C) prépare et transforme automatiquement les données en un format approprié à l'utilisation de SAP InfiniteInsight ® . InfiniteInsight variables nominales et ordinales, remplit automatiquement les valeurs manquantes et détecte les données aberrantes. De plus, cette fonctionnalité contribue de façon significative à la robustesse des modèles générés par SAP InfiniteInsight ® en créant un codage robuste des données.
® Modeler / Codeur analytique traduit les
Phase 3 : Modélisation des données
Les fonctionnalités InfiniteInsight ® Modeler / Régression ou Classement et InfiniteInsight reposent, permettent de générer des modèles d'analyse pertinents et robustes.
® Modeler /
Segmentation, grâce aux techniques statistiques et aux technologies informatiques sur lesquelles elles
InfiniteInsight ® Modeler / Régression ou Classement permet de générer des modèles explicatifs et prédictifs.
Les modèles générés par InfiniteInsight
®
Modeler / Régression ou Classement permettent d'expliquer et de prédire un phénomène, ou variable cible, en fonction de données contenues dans le jeu de données analysé, ou variables explicatives. Les modèles générés par InfiniteInsight ® Modeler / Régression ou Classement sont calculés grâce à un algorithme de régression et de classification. Cette régression polynomiale est un algorithme propriétaire développé et implémenté par KXEN où les calculs des paramètres se base sur le principe des SRM de Vapnik
InfiniteInsight ® Modeler / Segmentation permet de générer des modèles descriptifs, c'est-à-dire de segmenter un jeu de données en un nombre de segments (ou groupes). InfiniteInsight ® Modeler /
Segmentation permet en outre de réaliser des segmentations supervisées grâce à l’introduction d’une variable cible prise en compte dans le codage des données. Une segmentation supervisée permet la constitution de groupes homogènes qui se distinguent entre eux par leur comportement vis à vis de la variable cible. Cette segmentation utilise une méthode optimisée et robustifiée de nuées dynamiques basée (K-means) sur les théories de Vapnik.
14
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
Phase 4 : Présentation et déploiement du modèle
Une fois les modèles générés, des indicateurs de performance des modèles, des graphiques et des rapports d'analyse au format HTML facilitent la visualisation et l'interprétation des résultats de la modélisation des données.
Une fois les modèles validés, vous pouvez les appliquer sur :
une ou plusieurs observations spécifiques issues de votre base de données (mode
Simulation)
,
une nouveau jeu de données complet, ou jeu de données d'application (mode
Application
).
Pour faciliter le déploiement et l'intégration des modèles, le code correspondant à chaque modèle peut
également être généré dans différents langages de programmation. La fonctionnalité InfiniteInsight responsable de cette génération de code, est décrite ci-dessous.
® Scorer,
La fonctionnalité InfiniteInsight® Scorer
La fonctionnalité InfiniteInsight ®
SAP InfiniteInsight ®
Scorer permet de générer le code correspondant à un modèle généré avec
dans les langages suivants : C, XML, AWK, HTML, SQL, PMML2, SAS, or JAVA.
Sous cette forme, le modèle peut être intégré dans une application supportant les langages cités ci-dessus.
Les codes générés permettent d'intégrer les modèles SAP InfiniteInsight ® au sein d'applications ou progiciels, ou de les appliquer sur des données sans nécessiter la présence de SAP InfiniteInsight ® . Ils permettent notamment d'utiliser les modèles sur des plateformes techniques différentes de celle sur laquelle ils ont été générés.
Attention
La génération de code n'est disponible que pour des modèles générés par les fonctionnalités suivantes
: InfiniteInsight
InfiniteInsight ®
® Modeler / Codeur analytique, InfiniteInsight
Modeler / Segmentation.
® Modeler / Régression ou Classement,
2.3 Prérequis méthodologiques
Avant de modéliser vos données avec SAP InfiniteInsight ® , vous devez :
avoir défini une problématique à laquelle vous souhaitez répondre,
posséder un jeu de données exposant cette problématique sous la forme d'un ensemble d'observations.
15
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®
2.3.1 Vos données sont-elles exploitables
Une fois votre problématique identifiée et formulée, vous avez besoin de posséder des données qui permettent d'y répondre. Nous ne nous étendrons pas ici sur la notion de valeur informative associée aux données. Celle-ci dépend de vos processus et outils de collecte et d'extraction de données, et non des fonctionnalités SAP InfiniteInsight ® . En revanche, pour que vos données soient exploitables par SAP
InfiniteInsight
®
, les cinq conditions suivantes doivent être remplies :
vous devez posséder un volume de données suffisamment important pour pouvoir construire un modèle valide, c'est-à-dire à la fois pertinent et robuste. Un modèle d'analyse qui serait généré à partir d'un jeu de données de 50 lignes aurait une capacité de généralisation faible, ainsi qu'une valeur informative faible, voire dangereuse. Nous pouvons vous conseiller sur les problématiques de volume de données.
votre jeu de données doit contenir une variable cible, qui permette d'exprimer votre problématique au sein de SAP InfiniteInsight
®
.
pour chaque observation du jeu de données d'apprentissage, la variable cible doit être renseignée.
Autrement formulé, aucune valeur de la variable cible ne doit manquer sur la totalité du jeu de données d'apprentissage,
le format de votre source de données doit être supporté par SAP InfiniteInsight
®
,
vos données doivent être présentées sous la forme d'une table de données unique, sauf dans les cas où vous utilisez les fonctionnalités InfiniteInsight
InfiniteInsight ®
® Explorer / Codeur des journaux d'événements ou
Explorer / Codeur de séquences.
2.3.2 Quelle est votre problématique
Les fonctionnalités SAP InfiniteInsight ® répondent tous à une même philosophie : ils permettent de faire de l'analyse de données supervisée. Le terme "supervisé" signifie que l'analyse de données ne se déroule pas dans l'absolu, mais toujours en fonction d'une problématique : votre problématique !
Pensez à la base de données comportant des informations sur vos clients. Une analyse qui aurait regroupé vos clients en groupes homogènes dans l'absolu n'a pas forcément un intérêt évident. En revanche, une analyse qui les aurait regroupé en fonction d'une problématique telle que le "chiffre d'affaire moyen qu'ils vous rapportent chaque année" prendrait toute sa valeur. Vous connaîtriez alors les profils caractéristiques des clients qui vous rapportent le plus d'argent.
Vous l'avez compris, l'étape préalable à l'utilisation SAP InfiniteInsight
®
consiste à identifier et formuler votre problématique.
16
CUSTOMER
© 2014 SAP AG or an SAP affiliate company. All rights reserved-
SAP InfiniteInsight® 7.0
SAP InfiniteInsight®

Öffentlicher Link aktualisiert
Der öffentliche Link zu Ihrem Chat wurde aktualisiert.