Requêtes d'exploration de données
Les requêtes d'exploration de données sont utiles à de nombreuses fins. Plusieurs possibilités s'offrent à vous :
Appliquer le modèle aux nouvelles données, pour créer des prédictions uniques ou multiples. Vous pouvez fournir des valeurs d'entrée sous forme de paramètres, ou dans un lot.
Obtenir un résumé statistique des données utilisées pour l'apprentissage.
Extraire les schémas et les règles, ou générer un profil du cas type qui représente un schéma dans le modèle.
Extraire les formules de régression et d'autres calculs qui expliquent les schémas.
Obtenir les cas qui conviennent à un schéma particulier.
Récupérer des détails sur les cas utilisés dans le modèle, y compris des données non utilisées dans l'analyse.
Recycler un modèle en ajoutant de nouvelles données ou effectuer une prédiction croisée.
Cette section fournit une vue d'ensemble des informations dont vous avez besoin pour utiliser les requêtes d'exploration de données. Elle décrit les types de requêtes que vous pouvez créer sur des objets d'exploration de données, présente les outils et les langages de requête et fournit des liens vers des exemples de requêtes que vous pouvez créer sur des modèles générés à l'aide des algorithmes fournis dans l'exploration de données SQL Server.
Fonctionnement des requêtes d'exploration de données
Outils et interfaces de requête
Requêtes pour différents types de modèle
Spécifications
Fonctionnement des requêtes d'exploration de données
L'exploration de données dans Analysis Services prend en charge les types de requêtes suivants :
Requêtes de prédiction (Exploration de données)
Requêtes qui créent des inférences basées sur des schémas dans le modèle, et à partir des données d'entrée.
Requêtes de contenu (Exploration de données)
Requêtes qui retournent des métadonnées, des statistiques et d'autres informations sur le modèle lui-même.
Requêtes d'extraction (exploration de données)
Requêtes qui peuvent récupérer les données de cas sous-jacentes pour le modèle, ou même les données de la structure qui n'ont pas été utilisées dans le modèle.
Requêtes de définition des données (Exploration de données)
Requêtes qui ne retournent pas d'informations du modèle, mais qui sont plutôt utilisées pour générer des modèles et des structures ou pour mettre à jour les données dans un modèle ou une structure.
Avant de créer des requêtes, il est recommandé de vous familiariser avec les différences qu'il existe entre les modèles créés à l'aide de chacun des algorithmes d'exploration de données fournis par SQL Server.
Parcourez et explorez chaque type de modèle à l'aide des visionneuses personnalisées d'exploration de données fournies pour chaque type d'algorithme. Pour plus d'informations, consultez Tâches de la visionneuse de modèle d'exploration de données et procédures.
Examinez le contenu de modèle pour chaque type de modèle, à l'aide de la Visionneuse de l'arborescence de contenu générique Microsoft. Pour interpréter ces informations, reportez-vous à Contenu du modèle d'exploration de données (Analysis Services - Exploration de données).
Outils et interfaces de requête
Vous pouvez générer des requêtes d'exploration de données en mode interactif à l'aide de l'un des outils de requête fournis par SQL Server. Le générateur de requêtes de prédiction graphique est fourni à la fois dans Outils de données SQL Server (SSDT) et SQL Server Management Studio. Si vous n'avez pas utilisé le générateur de requêtes de prédiction auparavant, nous vous recommandons de suivre les étapes du Didacticiel sur l'exploration de données de base pour vous familiariser avec l'interface. Pour obtenir une vue d'ensemble rapide des étapes, consultez la rubrique consacrée à la création d'une requête à l'aide du Créer une requête de prédiction à l'aide du Générateur de requêtes de prédiction.
Le générateur de requêtes de prédiction est utile pour démarrer des requêtes que vous personnaliserez ultérieurement. Vous pouvez ajouter facilement des sources de données et les mapper à des colonnes, puis basculer vers la vue DMX et personnaliser la requête en ajoutant une clause WHERE ou d'autres fonctions.
Une fois que vous êtes familiarisé avec les modèles d'exploration de données et la procédure de génération des requêtes, vous pouvez également écrire des requêtes directement à l'aide du langage d'extensions DMX (Data Mining Extensions). DMX est un langage de requête semblable à Transact-SQL, et que vous pouvez utiliser à partir de nombreux clients. DMX est l'outil de choix pour créer des prédictions personnalisées et des requêtes complexes. Pour obtenir une présentation de DMX, consultez Création et interrogation de modèles d'exploration de données à l'aide du langage DMX : didacticiels (Analysis Services - Exploration de données).
Les éditeurs DMX sont fournis à la fois dans Outils de données SQL Server (SSDT) et SQL Server Management Studio. Vous pouvez également utiliser le générateur de requêtes de prédiction pour démarrer vos requêtes, puis changer la vue afin d'activer l'éditeur de texte et copier l'instruction DMX dans un autre client. Pour plus d'informations, consultez Interface de requête d'exploration de données.
Vous pouvez composer des instructions DMX par programme et les envoyer depuis votre client vers le serveur Analysis Services en utilisant AMO ou XMLA. Toutefois, DMX est le langage que vous devez utiliser pour créer des requêtes sur un modèle d'exploration de données.
Vous pouvez également interroger les métadonnées, les statistiques et une partie du contenu du modèle à l'aide de vues de gestion dynamique (DMV), basées sur les ensembles de lignes de schéma d'exploration de données. Ces vues DMV facilitent la récupération d'informations relatives au modèle en tapant des instructions SELECT ; toutefois, vous ne pouvez pas créer de prédictions. Pour plus d'informations sur les vues DMVs prises en charge par Analysis Services, consultez Utiliser des vues de gestion dynamique (DMV) pour surveiller Analysis Services.
Enfin, vous pouvez créer des requêtes d'exploration de données à utiliser dans les packages Integration Services, à l'aide de la Tâche de requête d'exploration de données ou Transformation de requête d'exploration de données. La tâche de flux de contrôle prend en charge plusieurs types de requêtes DMX, alors que la transformation de flux de données ne prend en charge que les requêtes qui utilisent des données dans le flux de données, à savoir les requêtes qui utilisent la syntaxe PREDICTION JOIN.
Requêtes pour différents types de modèle
L'algorithme utilisé lors de la création du modèle influence considérablement le type d'informations que vous pouvez obtenir à partir d'une requête d'exploration de données. La raison de ces différences s'explique par le fait que chaque algorithme traite les données d'une manière différente et stocke différents types de schémas. Par exemple, certains algorithmes créent des clusters ; d'autres créent des arborescences. Par conséquent, vous devrez peut-être utiliser la prédiction et les fonctions de requêtes spécialisées, selon le type de modèle avec lequel vous travaillez.
La liste suivante fournit un résumé des fonctions que vous pouvez utiliser dans les requêtes :
Fonctions de prédiction générales : la fonction Predict est polymorphe, ce qui signifie qu'elle fonctionne avec tous les types de modèle. Cette fonction détecte automatiquement le type de modèle que vous utilisez et vous invite à saisir des paramètres supplémentaires. Pour plus d'informations, consultez Predict (DMX).
Attention Tous les modèles ne sont pas utilisés pour effectuer des prédictions. Par exemple, vous pouvez créer un modèle de clustering qui n'a pas d'attribut prédictible. Toutefois, même si un modèle ne dispose pas d'attribut prédictible, vous pouvez créer des requêtes de prédiction qui retournent d'autres types d'informations utiles à partir du modèle.
Fonctions de prédiction personnalisées : chaque type de modèle fournit un ensemble de fonctions de prédiction conçues pour utiliser les schémas créés par l'algorithme.
Par exemple, la fonction Lag est fournie pour les modèles de série chronologique, pour vous permettre de visualiser les données d'historique utilisées pour le modèle. Pour les modèles de clustering, les fonctions telles que ClusterDistance sont plus explicites.
Pour plus d'informations sur les fonctions prises en charge pour chaque type de modèle, consultez les liens suivants :
Vous pouvez également appeler des fonctions VBA ou créer vos propres fonctions. Pour plus d'informations, consultez Fonctions (DMX).
Statistiques générales : il existe plusieurs fonctions qui peuvent être utilisées avec presque n'importe quel type de modèle et retournent un ensemble standard de statistiques descriptives, telles que l'écart type.
Par exemple, la fonction PredictHistogram retourne une table qui répertorie tous les états de la colonne spécifiée.
Pour plus d'informations, consultez Fonctions de prédiction générales (DMX).
Statistiques personnalisées : des fonctions de prise en charge supplémentaires sont fournies pour chaque type de modèle, afin de générer des statistiques qui sont appropriées à la tâche analytique spécifique.
Par exemple, lorsque vous utilisez un modèle de clustering, vous pouvez utiliser la fonction, PredictCaseLikelihood pour retourner le score de vraisemblance associé à un certain cas et cluster. Toutefois, si vous avez créé un modèle de régression linéaire, vous serez plus intéressé à récupérer le coefficient et l'ordonnée à l'origine, ce que vous pouvez effectuer à l'aide d'une requête de contenu.
Fonctions de contenu de modèle : le contenu de tous les modèles est représenté dans un format standardisé qui vous permet de récupérer des informations avec une requête simple. Vous créez des requêtes sur le contenu du modèle à l'aide du langage DMX. Vous pouvez également obtenir un certain type de contenu de modèle à l'aide des ensembles de lignes du schéma d'exploration de données.
Dans le contenu du modèle, la signification de chaque ligne ou nœud de la table retournée diffère selon le type d'algorithme utilisé pour générer le modèle, ainsi que le type de données de la colonne. Pour plus d'informations, consultez Requêtes de contenu (Exploration de données).
Spécifications
Avant de pouvoir créer une requête sur un modèle, le modèle d'exploration de données doit avoir été traité. Le traitement d'objets Analysis Services requiert des autorisations spéciales. Pour plus d'informations sur le traitement des modèles d'exploration de données, consultez Exigences et considérations concernant le traitement (exploration de données).
Exécuter des requêtes sur un modèle d'exploration de données requiert différents niveaux d'autorisations, selon le type de requête que vous exécutez. Par exemple, l'extraction des données de structure ou de cas nécessite généralement des autorisations supplémentaires qui peuvent être définies sur l'objet de structure d'exploration de données ou sur un objet de modèle d'exploration de données.
Toutefois, si votre requête utilise des données externes et inclut des instructions telles que OPENROWSET ou OPENQUERY, la base de données que vous interrogez doit activer ces instructions, et vous devez disposer d'une autorisation sur les objets de base de données sous-jacents.
Pour plus d'informations sur les contextes de sécurité requis pour exécuter des requêtes d'exploration de données, consultez Vue d'ensemble de la sécurité (exploration de données)
Dans cette section
Les rubriques de cette section présentent chaque type de requête d'exploration de données plus en détail et fournissent des liens vers des exemples détaillés de création de requêtes sur des modèles d'exploration de données.
Requêtes de prédiction (Exploration de données)
Requêtes de contenu (Exploration de données)
Requêtes d'extraction (exploration de données)
Requêtes de définition des données (Exploration de données)
Interface de requête d'exploration de données
Tâches associées
Utilisez ces liens pour apprendre à créer et à utiliser des requêtes d'exploration de données.
Voir aussi
Concepts
Algorithmes d'exploration de données (Analysis Services - Exploration de données)
Contenu du modèle d'exploration de données (Analysis Services - Exploration de données)