Quels outils la machine virtuelle Azure Science des données inclut-elle ?
Vous pouvez utiliser la machine virtuelle Science des données (DSVM) pour explorer facilement les données et gérer le Machine Learning dans le cloud. Une machine virtuelle DSVM est préconfigurée avec des correctifs de sécurité, des pilotes, des logiciels populaires de science et de développement des données et un système d’exploitation complet. Vous pouvez choisir l’environnement matériel qui fonctionne pour vous, allant de machines centrées sur le processeur à des machines puissantes avec plusieurs GPU, stockage NVMe et de grandes quantités de mémoire. Pour les machines avec des GPU, tous les pilotes sont installés et tous les frameworks Machine Learning sont mis en correspondance avec la version pour la compatibilité GPU. En outre, l’accélération est activée dans tous les logiciels d’application qui prennent en charge les GPU.
La machine virtuelle DSVM est fournie avec les outils de science des données les plus utiles préinstallés.
Générer des solutions de deep learning et de machine learning
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Pilote CUDA, cuDNN, NVIDIA | ✅ | ✅ | ✅ |
Pilote CUDA, cuDNN, NVIDIA dans DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod dans DSVM |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi dans DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch dans DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow dans DSVM |
Intégration avec Azure Machine Learning (Python) | ✅ (SDK Python, exemples) |
✅ (SDK Python, exemples) |
✅ (SDK Python,CLI, exemples) |
Kit de développement logiciel (SDK) Azure Machine Learning |
XGBoost | ✅ (prise en charge de la configuration CUDA) |
✅ (prise en charge de la configuration CUDA) |
✅ (prise en charge de la configuration CUDA) |
XGBoost dans DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit dans DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (Prise en charge MPI, GPU) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Conteneurs Windows uniquement) |
✅ (Conteneurs Windows uniquement) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
Stocker, récupérer et manipuler des données
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Bases de données relationnelles | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server dans DSVM |
Outils de base de données | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (outil d’interrogation), bcp, sqlcmd Pilotes ODBC/JDBC |
|
Azure Storage Explorer | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AZCopy | ✅ |
✅ |
❌ | AzCopy dans DSVM |
Pilote Blob FUSE | ❌ | ❌ | ❌ |
blobfuse dans DSVM |
Outil de migration de données Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB dans DSVM |
Outils en ligne de commande Unix/Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (autonome) | ✅ | ✅ | ✅ |
Programmer en Python, R, Julia et Node.js
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
CRAN-R avec des packages populaires préinstallés | ✅ | ✅ | ✅ | |
Anaconda Python avec des packages populaires préinstallés | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (serveur de bloc-notes multi-utilisateur) | ❌ | ❌ | ✅ | |
JupyterLab (serveur de bloc-notes multi-utilisateur) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Serveur Jupyter Notebook avec les noyaux suivants : | ✅ |
✅ |
✅ | Exemples Jupyter Notebook |
R | Exemples R Jupyter | |||
Python | Exemples Python Jupyter | |||
Julia | Exemples Julia Jupyter | |||
PySpark | Exemples pySpark Jupyter |
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM et Windows Server 2022 DSVM ont ces noyaux Jupyter :
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark (local)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark – HDInsight
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM et Windows Server 2022 DSVM ont les environnements conda suivants :
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Utiliser votre éditeur ou IDE préféré
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio dans DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code dans DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm dans DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git et Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
Organiser et présenter les résultats
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Navigateur Microsoft Edge | ✅ | ✅ | ✅ |