Utilisation du service Integration Services avec l'exploration de données
L'exploration de données est fréquemment définie comme le processus d'extraction d'informations valides et utilisables à partir de bases de données de grande taille. En d'autres termes, l'exploration de données vous permet de dégager les modèles et les tendances existant dans les données. Microsoft SQL ServerAnalysis Services fournit de puissantes fonctionnalités d'exploration de données, ainsi que des outils permettant d'extraire et d'analyser ces modèles. Integration Services propose un ensemble de composants pour vous aider à gérer et à interroger ces modèles d'exploration de données.
Pour plus d'informations sur les fonctionnalités d'exploration de données dans SQL ServerAnalysis Services, consultez Vue d'ensemble (Analysis Services - Exploration de données) et Projets d'exploration de données (Analysis Services - Exploration de données).
[!REMARQUE]
Certains composants de Integration Services décrits dans cette rubrique sont disponibles uniquement dans les éditions Enterprise et Developer de SQL Server.
Gestionnaires de connexions
Un gestionnaire de connexions est une représentation logique d'une connexion à une source de données. Vous pouvez utiliser le gestionnaire de connexions Analysis Services pour vous connecter à une base de données Analysis Services dans laquelle sont stockés les structures et les modèles d'exploration de données. L'ensemble des tâches et des composants de flux de données décrits dans cette rubrique nécessitent un gestionnaire de connexions Analysis Services.
Gestionnaire de connexions Analysis Services
Un gestionnaire de connexions Analysis Services permet à un package de se connecter à un serveur qui exécute une base de données Analysis Services ou à un projet Analysis Services qui procure un accès à des structures et des modèles d'exploration de données. La connexion à un projet Analysis Services est possible uniquement lors du développement de packages dans Business Intelligence Development Studio. Au moment de l'exécution, les packages se connectent au serveur et à la base de données sur lesquels vous avez déployé Analysis Services.
Pour plus d'informations, consultez Gestionnaire de connexions Analysis Services.
Tâches
Les tâches sont des éléments de flux de contrôle qui définissent des unités de travail qui sont exécutées dans un package. Les tâches suivantes vous permettent de créer ou de modifier un modèle ou une structure d'exploration de données, et de traiter ou d'interroger un modèle.
Tâche DDL d'exécution de SQL Server Analysis Services
Cette tâche exécute les instructions du langage de définition de données (DDL) qui peuvent créer, supprimer ou modifier des modèles ou des structures d'exploration de données. Les instructions DDL sont représentées en tant qu'instructions en langage ASSL (Analysis Services Scripting Language) et insérées dans une commande XMLA (XML for Analysis).
Pour plus d'informations sur cette tâche, consultez Tâche DDL d'exécution de SQL Server Analysis Services. Pour plus d'informations sur la création et la modification des objets Analysis Services à l'aide de XMLA, consultez Création et modification d'objets (XMLA).
Tâche de traitement Analysis Services
Cette tâche automatise le traitement des objets Analysis Services, tels que les modèles d'exploration de données.
Pour plus d'informations sur cette tâche, consultez Tâche de traitement d'Analysis Services. Pour plus d'informations sur le traitement des objets Analysis Services, consultez Traitement des objets Analysis Services.
Tâche de requête d'exploration de données
La tâche de requête d'exploration de données exécute des requêtes de prédiction basées sur les modèles d'exploration de données intégrés à Analysis Services. La requête de prédiction crée une prédiction de nouvelles données à l'aide de modèles d'exploration de données et enregistre sa sortie dans une table ou des tables.
Pour plus d'informations sur cette tâche, consultez Tâche de requête d'exploration de données. Pour plus d'informations sur l'interrogation d'un modèle d'exploration de données à l'aide de DMX, consultez Création de requêtes de prédiction DMX.
Transformations du flux de données
Les transformations sont les composants du flux de données d'un package qui agrègent, fusionnent, distribuent et modifient des données.
Transformation de requête d'exploration de données
La transformation de requête d'exploration de données effectue des requêtes de prédiction par rapport aux modèles d'exploration de données. Cette transformation contient un générateur de requêtes qui permet de créer des requêtes DMX (Data Mining Extensions). Le générateur de requêtes vous permet de créer des instructions personnalisées à l'aide du langage DMX afin d'évaluer les données d'entrée de la transformation par rapport à un modèle d'exploration de données existant. Contrairement à la tâche de requête d'exploration de données qui enregistre sa sortie directement dans une table ou des tables, la transformation de requête d'exploration de données met sa sortie à disposition des composants en aval dans le flux de données du package.
Pour plus d'informations sur cette transformation, consultez Transformation de requête d'exploration de données. Pour plus d'informations sur l'interrogation d'un modèle d'exploration de données à l'aide de DMX, consultez Création de requêtes de prédiction DMX.
Destinations du flux de données
Les destinations sont les composants de flux de données qui chargent la sortie d'un flux de données dans différents types de sources de données ou créent un dataset en mémoire.
Destination d'apprentissage du modèle d'exploration de données
La destination d'apprentissage du modèle d'exploration de données exerce les modèles d'exploration de données en transmettant les données que la destination reçoit par le biais des algorithmes de modèles d'exploration de données. Au cours du processus d'apprentissage, les algorithmes calculent les modèles et les relations entres les éléments dans les données. Une fois qu'un nouveau modèle d'exploration est exercé, vous pouvez l'utiliser pour exécuter des requêtes de prédiction.
Pour plus d'informations, consultez Destination d'apprentissage du modèle d'exploration de données.
Autres composants Integration Services pour l'exploration de données
Integration Services possède de nombreux autres composants qui peuvent être utiles au sein d'une solution d'exploration de données.
Pour exercer ou tester vos modèles d'exploration de données avec un sous-ensemble de vos données, vous pouvez faire appel aux éléments suivants :
**Transformation d'échantillonnage de lignes. **Copie uniquement un sous-ensemble de lignes basé sur un nombre que vous spécifiez. Pour plus d'informations, consultez Transformation d'échantillonnage de lignes.
**Transformation d'échantillonnage du pourcentage. **Copie uniquement un sous-ensemble de lignes basé sur un pourcentage que vous spécifiez. Pour plus d'informations, consultez Transformation de l'échantillonnage du pourcentage.
Pour nettoyer vos données en supprimant des doublons et en standardisant des valeurs, vous pouvez faire appel aux éléments suivants :
**Transformation de tri. **Supprime des lignes en double au cours du tri des données. Pour plus d'informations, consultez Transformation de tri.
**Transformation de regroupement approximatif. **Regroupe les lignes selon les similitudes plutôt qu'une correspondance exacte. Pour plus d'informations, consultez Transformation de regroupement probable et Procédure : identifier des lignes de données semblables à l'aide de la transformation de regroupement probable.
**Transformation de recherche floue. **Localise une correspondance dans une table de référence basée sur des similitudes plutôt qu'une correspondance exacte. Pour plus d'informations, consultez Transformation de recherche floue.
Pour effectuer l'exploration de texte, vous pouvez faire appel aux éléments suivants :
**Transformation d'extraction de terme. **Crée une table des termes découverts dans la source après l'exclusion des mots vides définis par l'utilisateur et des mots vides standard. Pour plus d'informations, consultez Transformation d'extraction de terme.
**Transformation de recherche de terme. **Met en correspondance des termes de votre entrée avec des termes d'une table de référence. Pour plus d'informations, consultez Transformation de recherche de terme.
|