Data Mining (SSAS)

Analysis Services fournit une plateforme intégrée pour les solutions qui intègrent l’exploration de données. Vous pouvez utiliser des données de cube ou relationnelles pour créer des solutions décisionnelles avec des analyses prévisionnelles.

Avantages de l’exploration de données

L'exploration de données utilise les principes statistiques bien connus pour découvrir des modèles dans vos données, afin de prendre des décisions réfléchies concernant des problèmes complexes. En appliquant les algorithmes d’exploration de données dans Analysis Services à vos données, vous pouvez prévoir des tendances, identifier des modèles, créer des règles et des recommandations, analyser la séquence d’événements dans des jeux de données complexes et obtenir de nouvelles insights.

Dans SQL Server 2014, l’exploration de données est puissante, accessible et intégrée aux outils que de nombreuses personnes préfèrent utiliser pour l’analyse et la création de rapports. Consultez les liens de cette section pour connaître la structure générale de l'exploration de données dont vous avez besoin pour commencer.

Fonctionnalités d'exploration de données clés

SQL Server fournit les fonctionnalités suivantes pour la prise en charge des solutions d'exploration de données intégrées :

  • Plusieurs sources de données : vous n'avez pas à créer d'entrepôt de données ni de cube OLAP pour effectuer l'exploration de données. Vous pouvez utiliser des données tabulaires, des feuilles de calcul et même des fichiers texte provenant de fournisseurs externes. Vous pouvez également facilement extraire des cubes OLAP créés dans Analysis Services. Toutefois, vous ne pouvez pas utiliser les données d'une base de données en mémoire.

  • Nettoyage de données intégré, gestion des données et ETL (extraction, transformation et chargement) : Data Quality Services fournit des outils avancés pour le profilage et le nettoyage des données. Integration Services peut être utilisé pour générer des processus ETL pour nettoyer les données, ainsi que pour créer, traiter, effectuer l'apprentissage et mettre à jour des modèles.

  • Plusieurs algorithmes personnalisables : outre la mise à disposition d'algorithmes comme le clustering, les réseaux neuronaux et les arbres de décision, la plateforme prend en charge le développement de vos propres algorithmes de plug-in personnalisés.

  • Infrastructure de test de modèle : testez vos modèles et jeux de données à l'aide d'outils statistiques importants comme la validation croisée, les matrices de classification, les graphiques de courbes d'élévation et les nuages de points. Créez et gérez facilement des jeux d'apprentissage et de test.

  • Interrogation et extraction : créez des requêtes de prédiction, récupérer les schémas et statistiques de modèles et explorez des données de cas.

  • Outils clients : outre les studios de développement et de conception fournis par SQL Server, vous pouvez utiliser les compléments d'exploration de données pour Excel afin de créer, interroger et parcourir des modèles. Vous pouvez également créer des clients personnalisés, notamment des services Web.

  • Prise en charge du langage de script et des API managées : tous les objets d'exploration de données sont entièrement programmables. L’écriture de scripts est possible via MDX, XMLA ou les extensions PowerShell pour Analysis Services. Utilisez le langage DMX (Data Mining Extensions) pour la création rapide de requêtes et de scripts.

  • Sécurité et déploiement : fournit une sécurité basée sur les rôles via Analysis Services, y compris des autorisations distinctes pour l’extraction des données de modèle et de structure. Déploiement simple des modèles vers d'autres serveurs, afin que les utilisateurs puissent accéder aux modèles ou effectuer des prédictions

Dans cette section

Les rubriques de cette section présentent les principales fonctionnalités de l'exploration de données et des tâches associées de SQL Server.