Choisir et mapper les données d'entrée pour une requête de prédiction
Lorsque vous créez des prédictions à partir d'un modèle d'exploration de données, vous le faites généralement en alimentant de nouvelles données dans le modèle. (Les modèles de série chronologique, qui peuvent faire des prédictions basées sur des données historiques uniquement, font exception.) Pour fournir de nouvelles données au modèle, vous devez vous assurer que les données sont disponibles dans une vue de source de données. Si vous connaissez à l'avance les données que vous allez utiliser pour la prédiction, vous pouvez les inclure dans la vue de source de données utilisée pour créer le modèle. Sinon, vous devrez peut-être créer une vue de source de données. Pour plus d’informations, consultez Vues de sources de données dans les modèles multidimensionnels.
Parfois les données dont vous avez besoin peuvent être contenues dans plusieurs tables d'une jointure un-à-plusieurs. Tel est le cas avec les données utilisées pour les modèles d'association ou les modèles Sequence Clustering, qui utilisent une table de cas liée à une table imbriquée qui contient les détails du produit ou de la transaction. Si votre modèle utilise une structure de table de cas imbriquée, les données que vous utilisez pour la prédiction doivent également avoir une structure de table de cas imbriquée.
Avertissement
Vous ne pouvez pas ajouter de nouvelles colonnes ou mapper des colonnes qui se trouvent dans une vue de source de données différente. La vue de source de données que vous sélectionnez doit contenir toutes les colonnes dont vous avez besoin pour la requête de prédiction.
Après avoir identifié les tables qui contiennent les données que vous allez utiliser pour les prédictions, vous devez mapper les colonnes des données externes aux colonnes du modèle d'exploration de données. Par exemple, si votre modèle prédit le comportement d'achat de clients en fonction des statistiques démographiques et des réponses aux enquêtes, vos données d'entrée contiennent des informations qui correspondent généralement à ce qui est dans le modèle. Vous n'avez pas besoin d'avoir des données correspondantes pour chaque colonne, mais plus le nombre de colonnes correspondant est élevé, meilleurs sont les résultats. Si vous essayez de mapper des colonnes qui ont des types de données différents, vous pouvez obtenir une erreur. Dans ce cas, vous pouvez définir un calcul nommé dans la vue de source de données pour convertir les nouvelles données de la colonne en type de données requis par le modèle. Pour plus d’informations, consultez Définir des calculs nommés dans une vue de source de données (Analysis Services).
Lorsque vous choisissez les données à utiliser pour la prédiction, certaines colonnes de la source de données sélectionnée peuvent être mappées automatiquement aux colonnes du modèle d’exploration de données, selon la similitude des noms et le type de données correspondant. Vous pouvez utiliser la boîte de dialogue Modifier le mappage dans Prédiction de modèle d’exploration de données pour modifier les colonnes qui sont mappées, supprimer les mappages inappropriés, ou créer des mappages pour les colonnes existantes. L’aire de conception Prédiction de modèle d’exploration de données prend également en charge la modification par glisser-déplacer des connexions.
Pour créer une connexion, sélectionnez une colonne dans la table Modèle d’exploration de données et faites-la glisser vers la colonne correspondante dans la table Sélectionner une ou plusieurs tables d’entrée .
Pour supprimer une connexion, sélectionnez la ligne de connexion et appuyez sur la touche Suppr.
La procédure suivante explique comment modifier les jointures qui ont été créées entre la table de cas et une table imbriquée utilisées comme entrées dans une requête de prédiction, à l’aide de la boîte de dialogue Spécifier la jointure imbriquée .
Sélectionner une table d'entrée
Dans la table Sélectionner la ou les tables d’entrée de l’onglet Graphique de précision d’exploration de données dans Designer d’exploration de données en SQL Server Data Tools (SSDT), cliquez sur Sélectionner une table de cas.
La boîte de dialogue Sélectionner une table s’affiche pour vous permettre de sélectionner la table qui contient les données sur lesquelles vous voulez baser les requêtes.
Dans la boîte de dialogue Sélectionner une table , sélectionnez une source de données dans la liste Source de données .
Sous Nom de la table/vue, sélectionnez la table qui contient les données à utiliser pour tester les modèles.
Cliquez sur OK.
Les colonnes de la structure d'exploration de données sont mappées automatiquement aux colonnes portant le même nom dans la table d'entrée.
Modifier la façon dont les données d'entrée sont mappées au modèle
Dans Data Mining Designer in SQL Server Data Tools (SSDT), sélectionnez l’onglet Prédiction du modèle d’exploration de données.
Dans le menu Modèle d’exploration de données , sélectionnez Modifier les connexions.
La boîte de dialogue Modifier le mappage s’ouvre. Dans cette boîte de dialogue, la colonne Colonne du modèle d’exploration de données répertorie les colonnes dans la structure d’exploration de données sélectionnée. La colonne Colonne de table répertorie les colonnes dans la source de données externe que vous avez choisie dans la boîte de dialogue Sélectionner une ou plusieurs tables d’entrée . Les colonnes de la source de données externe sont mappées aux colonnes du modèle d'exploration de données.
Sous Colonne de table, sélectionnez la ligne correspondante à la colonne du modèle d’exploration de données à mapper.
Sélectionnez une nouvelle colonne dans la liste de colonnes disponibles de la source de données externe. Sélectionnez l'élément vide dans la liste pour supprimer le mappage de colonnes.
Cliquez sur OK.
Les nouveaux mappages de colonnes s'affichent dans le Concepteur.
Supprimer une relation entre des tables d'entrée
Dans la table Sélectionner la ou les tables d’entrée de l’onglet Prédiction du modèle d’exploration de données dans Designer d’exploration de données dans SQL Server Data Tools (SSDT), cliquez sur Modifier la jointure.
La boîte de dialogue Spécifier la jointure imbriquée s’ouvre.
Sélectionnez une relation.
Cliquez sur Supprimer la relation.
Cliquez sur OK.
La relation entre la table de cas et la table imbriquée est supprimée.
Créer une relation entre des tables d'entrée
Dans la table Sélectionner une ou plusieurs tables d’entrée de l’onglet Prédiction de modèle d’exploration de données du Concepteur d’exploration de données, cliquez sur Modifier la jointure.
La boîte de dialogue Spécifier la jointure imbriquée s’ouvre.
Cliquez sur Ajouter une relation.
La boîte de dialogue Créer une relation s’ouvre.
Sélectionnez la clé de la table imbriquée dans Colonnes sources.
Sélectionnez la clé de la table de cas dans Colonnes de destination.
Cliquez sur OK dans la boîte de dialogue Créer une relation .
Cliquez sur OK dans la boîte de dialogue Spécifier la jointure imbriquée .
Une relation est créée entre la table de cas et la table imbriquée.
Ajouter une table imbriquée aux tables d'entrées d'une requête de prédiction
Sous l’onglet Prédiction de modèle d’exploration de données du Concepteur d’exploration de données, cliquez sur Sélectionner la table de cas pour ouvrir la boîte de dialogue Sélectionner une table .
Notes
Vous ne pouvez pas ajouter de table imbriquée aux entrées, sauf si vous avez spécifié une table de cas. L'utilisation d'une table imbriquée nécessite que le modèle d'exploration de données que vous utilisez pour la prédiction utilise également une table imbriquée.
Dans la boîte de dialogue Sélectionner une table , sélectionnez une source de données dans la liste Source de données , puis sélectionnez la table dans la vue de source de données qui contient les données de cas. Cliquez sur OK.
Cliquez sur Sélectionner la table imbriquée pour ouvrir la boîte de dialogue Sélectionner une table .
Dans la boîte de dialogue Sélectionner une table , sélectionnez une source de données dans la liste Source de données , puis sélectionnez la table dans la vue de source de données qui contient les données imbriquées. Cliquez sur OK.
Si une relation existe, les colonnes du modèle d'exploration de données sont mappées automatiquement aux colonnes portant le même nom dans la table d'entrée. Vous pouvez modifier la relation entre la table imbriquée et la table de cas en cliquant sur Modifier la jointurequi ouvre la boîte de dialogue Créer une relation .