Charge de travail Applications de science et analyse des données dans Visual Studio

La charge de travail Science des données et applications analytiques de Visual Studio regroupe plusieurs langages et leurs distributions d'exécution respectives :

Python est l’un des principaux langages de script utilisés pour la science des données. Python est facile à apprendre et est pris en charge par un écosystème étendu de packages. Ces packages permettent de répondre aux besoins de nombreux scénarios, comme l’acquisition de données, le nettoyage, l’apprentissage de modèle, le déploiement et le traçage. F# est également un puissant langage .NET fonctionnel applicable à une grande variété de tâches de traitement de données.

Capture d’écran montrant Visual Studio avec des projets de code R, Python et F#.

Installation de la charge de travail

La charge de travail science des données et applications analytiques est disponible dans Visual Studio Installer sous Charges de travail>Autres ensemble d’outils :

Capture d’écran montrant comment sélectionner la charge de travail des applications de science des données et d’analytique dans Visual Studio Installer 2022.

Capture d’écran montrant comment sélectionner la charge de travail des applications de science des données et d’analytique dans Visual Studio Installer 2019.

Par défaut, la charge de travail installe les options suivantes, que vous pouvez modifier dans la section Résumé de la charge de travail dans le programme d’installation de Visual Studio :

  • Prise en charge du langage F# pour poste de travail
  • Python :
    • Prise en charge du langage Python
    • Prise en charge de Python web
    • Outils de développement natifs Python

Intégration de SQL Server

SQL Server prend en charge l’utilisation de Python pour effectuer de l’analytique avancée directement dans SQL Server. (La prise en charge de Python est disponible dans SQL Server 2017 CTP 2.0 et ultérieur.)

Vous profitez des avantages suivants en exécutant votre code là où sont déjà vos données :

  • Élimination des déplacements des données : au lieu de déplacer les données depuis la base de données vers votre application ou votre modèle, vous pouvez générer des applications dans la base de données. Cette fonctionnalité élimine les barrières en matière de sécurité, de conformité, de gouvernance, d’intégrité et de nombreux problèmes similaires liés au déplacement de quantités importantes de données. Vous pouvez aussi consommer des jeux de données qui ne tiennent pas dans la mémoire d’un ordinateur client.

  • Déploiement facile : une fois que votre modèle est prêt, son déploiement en production consiste juste à l’incorporer dans un script T-SQL. Toute application cliente SQL écrite dans n’importe quel langage peut alors tirer parti des modèles et de l’analyse décisionnelle via un appel de procédure stockée. Aucune intégration spécifique au langage n’est nécessaire.

  • Performances et mise à l’échelle de niveau entreprise : vous pouvez utiliser des fonctionnalités avancées de SQL Server, comme les tables en mémoire et les index columnstore, avec des API évolutives à hautes performances dans les packages RevoScale. L’élimination du déplacement des données signifie également que vous évitez les contraintes de mémoire des clients quand la taille de vos données augmente ou quand vous voulez accroître les performances de l’application.

  • Extensibilité enrichie : vous pouvez installer et exécuter les derniers packages open source dans SQL Server pour créer des applications d’apprentissage long et d’intelligence artificielle sur de très grandes quantités de données dans SQL Server. L’installation d’un package dans SQL Server est aussi simple que l’installation d’un package sur votre ordinateur local.

  • Disponibilité élevée sans coût supplémentaire : les intégrations de langage sont disponibles dans toutes les éditions de SQL Server 2017 et ultérieures, notamment l’édition Express.

Installation de l’intégration de SQL Server

Pour tirer pleinement parti de l’intégration de SQL Server, utilisez Visual Studio Installer pour installer la charge de travail Charges de travail>Autres ensemble d’outils>stockage et traitement des données. Sélectionnez l'option SQL Server Data Tools pour activer SQL IntelliSense, la coloration syntaxique et le déploiement :

Capture d’écran montrant comment sélectionner la charge de travail de stockage et de traitement des données dans Visual Studio Installer 2022.

Capture d’écran montrant comment sélectionner la charge de travail de stockage et de traitement des données dans Visual Studio Installer 2019.

Pour plus d’informations, consultez Python dans SQL Server 2017 : l'amélioration de l'apprentissage automatique dans les bases de données (blog).

Autres services et SDK

En plus de ce qui se trouve directement dans la charge de travail Science des données et applications analytiques, les Notebooks dans Visual Studio Code et le SDK Azure pour Python sont également utiles pour la science des données.

Le kit SDK Azure pour Python facilite l’utilisation et la gestion des services Microsoft Azure à partir d’applications fonctionnant sur Windows, Mac et Linux. Pour plus d’informations, consultez Azure pour les développeurs Python.

Vous pouvez combiner l’extension Jupyter avec notebooks dans Visual Studio Code pour prendre en charge le développement Jupyter et améliorer votre projet avec des extensions de langage supplémentaires. Le service inclut des exemples de notebooks en Python, R et F# pour vous aider à démarrer. Pour plus d’informations, consultez les expériences notebooks de Microsoft et GitHub.

Capture d’écran montrant l’utilisation de notebooks avec Jupyter dans une présentation de l’échantillon R.