Partager via


Didacticiel d’exploration de données de base

Bienvenue dans le didacticiel d’exploration de données de base de Microsoft Analysis Services. Microsoft SQL Server fournit un environnement intégré pour créer des modèles d’exploration de données et effectuer des prédictions. Dans ce tutoriel, vous allez suivre un scénario pour une campagne de publipostage ciblée dans laquelle vous utilisez le Machine Learning pour analyser et prédire le comportement d’achat des clients. Le tutoriel montre comment utiliser trois des algorithmes d’exploration de données les plus importants : le clustering, les arbres de décision et Naive Bayes. Vous allez également apprendre à analyser vos résultats à l’aide des visionneuses du modèle d’exploration de données et à créer des prédictions et des graphiques de précision à l’aide des outils d’exploration de données inclus dans Microsoft SQL Server Analysis Services. La société fictive Adventure Works Cycles est utilisée pour tous les exemples.

Lorsque vous êtes à l’aise avec les outils d’exploration de données, nous vous recommandons également de suivre le didacticiel d’exploration de données intermédiaire (Analysis Services - Exploration de données). Les leçons montrent comment utiliser la prévision, l'analyse des paniers d'achat, l'analyse de séries chronologiques, les modèles d'association, les tables imbriquées et le clustering par séquence.

Scénario du didacticiel

Dans ce tutoriel, vous êtes un employé d’Adventure Works Cycles qui a été chargé d’en savoir plus sur les clients de l’entreprise en fonction des achats historiques, puis en utilisant ces données historiques pour effectuer des prédictions qui peuvent être utilisées dans le marketing. L’entreprise n’a jamais fait d’exploration de données auparavant. Vous devez donc créer une base de données spécifiquement pour l’exploration de données et configurer plusieurs modèles d’exploration de données.

Contenu du didacticiel

Ce tutoriel vous explique comment créer et utiliser plusieurs types de méthodes De Machine Learning différents. Vous allez également apprendre à créer une copie d’un modèle d’exploration de données et à appliquer un filtre aux données d’entrée pour obtenir des résultats différents. Ensuite, vous pouvez comparer les résultats des deux modèles en utilisant un diagramme de levée. Enfin, vous allez utiliser l'exploration approfondie pour récupérer des données supplémentaires à partir de la structure d'exploration sous-jacente.

Microsoft Analysis Services Data Mining inclut les fonctionnalités suivantes qui vous aident à développer et comparer facilement plusieurs modèles prédictifs, puis à prendre des mesures sur les résultats :

  • Ensembles de tests de validation -Lorsque vous créez une structure d’exploration de données, vous pouvez désormais diviser les données de la structure d’exploration de données en ensembles d’apprentissage et de test. Cela vous permet de tester des modèles sur des jeux de données similaires et de comparer la précision des modèles associés.

  • Filtres de modèle d’exploration de données -Vous pouvez maintenant attacher des filtres à un modèle d’exploration de données et appliquer le filtre pendant l’entraînement et le test. Cela vous permet de créer facilement des modèles associés sur différents sous-ensembles des données.

  • Exploration approfondie des cas de structure et des colonnes de structure - Vous pouvez désormais facilement passer des modèles généraux du modèle de données à des détails exploitables dans la source de données.

Ce didacticiel contient les leçons suivantes :

Leçon 1 : Préparation de la base de données Analysis Services (didacticiel d’exploration de données de base)
Dans cette leçon, vous allez apprendre à créer une base de données Analysis Services, à ajouter une source de données et une vue de source de données et à préparer la nouvelle base de données à utiliser avec l’exploration de données.

Leçon 2 : Création d’une structure de publipostage ciblée (didacticiel d’exploration de données de base)
Dans cette leçon, vous allez apprendre à créer un modèle d’exploration de données qui peut être utilisé dans le cadre d’un scénario de publipostage ciblé.

Leçon 3 : Ajout et traitement de modèles
Dans cette leçon, vous allez apprendre à ajouter des modèles à une structure. Les modèles que vous créez sont générés avec les algorithmes suivants :

  • Arbres de décision Microsoft

  • Regroupement Microsoft

  • Microsoft Naive Bayes

Leçon 4 : Exploration des modèles de publipostage ciblés (didacticiel d’exploration de données de base)
Dans cette leçon, vous allez apprendre à explorer et à interpréter les résultats de chaque modèle à l’aide des visionneuses.

Leçon 5 : Tester des modèles (didacticiel d’exploration de données de base)
Dans cette leçon, vous effectuez une copie de l’un des modèles de publipostage ciblés, ajoutez un filtre de modèle d’exploration de données pour restreindre les données d’apprentissage à un ensemble particulier de clients, puis évaluez la viabilité du modèle.

Leçon 6 : Création et utilisation de prédictions (didacticiel d’exploration de données de base)
Dans cette leçon finale du didacticiel d’exploration de données de base, vous utilisez le modèle pour prédire quels clients sont les plus susceptibles d’acheter un vélo. Vous allez ensuite explorer les cas sous-jacents pour obtenir des informations de contact.

Spécifications

Vérifiez que les éléments suivants sont installés :

  • Microsoft SQL Server 2014

  • Microsoft SQL Server Analysis Services en mode multidimensionnel

  • Base de données AdventureWorksDW2012 .

Pour améliorer la sécurité, les exemples de bases de données ne sont pas installés avec SQL Server. Pour installer les bases de données officielles pour Microsoft SQL Server, visitez la page Exemples de bases de données Microsoft SQL et sélectionnez SQL Server 2014.

Remarque

Lorsque vous travaillez dans un didacticiel, vous pouvez trouver plus facile de vous déplacer entre les étapes si vous ajoutez la rubrique suivante et les boutons De rubrique précédente à la barre d’outils de la visionneuse de documents.

Voir aussi

Solutions d’exploration de données
Tâches et guide pratique du modèle d’exploration de données
Création et interrogation de modèles d’exploration de données avec DMX : Tutoriels (Analysis Services - Exploration de données)