Environnement analytique d’équipe et d’intelligence artificielle basé sur Data Science Virtual Machine
Data Science Virtual Machine (DSVM) fournit un environnement enrichi sur la plateforme Azure avec des logiciels prédéfinis pour l’intelligence artificielle (IA) et l’analytique des données.
En règle générale, la DSVM est utilisée comme un ordinateur de bureau d’analyse individuel. Cet environnement d’analytique prédéfini partagé améliore la productivité des scientifiques. Puisque les équipes d’analyse volumineuses planifient des environnements pour leurs scientifiques des données et développeurs d’IA, l’infrastructure d’analytique partagée de développement et d’expérimentation est un enjeu récurrent. Cette infrastructure est gérée de manière cohérente avec les stratégies informatiques de l’entreprise, pour faciliter également la collaboration et la cohérence entre les équipes de science des données et les équipes d’analytique.
Une infrastructure partagée améliore l’utilisation informatique de l’environnement d’analytique. Certaines organisations décrivent l’infrastructure de science des données/d’analytique basée sur une équipe comme un bac à sable d’analytique. Cela permet aux scientifiques des données d’accéder à différentes ressources de données pour comprendre et gérer rapidement les données. Cet environnement de bac à sable leur permet également d’exécuter des expériences, de valider des hypothèses et de générer des modèles prédictifs qui n’affectent pas l’environnement de production.
Étant donné que la Data Science Virtual Machine (DSVM) fonctionne au niveau de l’infrastructure Azure, les administrateurs informatiques peuvent la configurer facilement pour qu’elle fonctionne conformément aux stratégies informatiques de l’entreprise. La DSVM offre une flexibilité parfaite pour implémenter différentes architectures de partage et permet un accès contrôlé aux ressources de données de l’entreprise.
Cette section présente les modèles et recommandations que vous pouvez appliquer pour déployer la machine virtuelle DSVM en tant qu’infrastructure de science des données basée sur une équipe. Comme les composants de ces modèles proviennent de l’infrastructure en tant que service (IaaS) Azure, ils s’appliquent à toutes les machines virtuelles Azure. Cette série d’articles est axée sur l’application de ces fonctionnalités d’infrastructure Azure standard à DSVM.
Les principaux composants d’un environnement d’analytique d’équipe d’entreprise sont les suivants :
- Pool de machines virtuelles DSVM mis à l’échelle automatiquement
- Identité commune et accès à l’espace de travail à partir des machines virtuelles DSVM du pool
- Sécuriser l’accès aux sources de données
Cette série d’articles contient des conseils et des astuces couvrant chacune des rubriques précédentes. Elle n’aborde pas toutes les considérations et exigences relatives au déploiement de machines virtuelles DSVM dans des configurations d’entreprise d’envergure. Voici d’autres ressources Azure que vous pouvez utiliser lors de l’implémentation d’instances DSVM dans votre entreprise :
- Sécurité du réseau
- Surveillance et gestion
- Journalisation et audit
- Contrôle d’accès en fonction du rôle Azure (RBAC Azure)
- Définition et application de stratégies
- Logiciel anti-programme malveillant
- Chiffrement
- Découverte et gouvernance des données
Enfin, le Centre des architectures Azure fournit une architecture de bout en bout détaillée et des modèles pour la création et la gestion de votre infrastructure d’analytique basée sur le cloud.