Quels sont les outils qui sont inclus dans Azure Data Science Virtual Machine ?
Data Science Virtual Machine est un moyen simple d’explorer des données et d’utiliser le Machine Learning dans le cloud. Les machines virtuelles de type Data Science Virtual Machine sont préconfigurées avec le système d’exploitation complet, les correctifs de sécurité, les pilotes et des logiciels de science des données et de développement très répandus. Vous pouvez choisir l’environnement matériel, qu’il soit constitué de machines économiques centrées sur le processeur ou de machines très puissantes dotées de plusieurs GPU, d’un stockage NVMe et de grandes quantités de mémoire. Pour les ordinateurs avec GPU, tous les pilotes sont installés, toutes les infrastructures de Machine Learning sont examinées pour déterminer si leur version est compatible avec les GPU, et l’accélération est activée dans tous les logiciels d’application qui prennent en charge les GPU.
Data Science Virtual Machine est fourni avec les outils de science des données les plus utiles préinstallés.
Générer des solutions de deep learning et de machine learning
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Pilote CUDA, cuDNN, NVIDIA | ✅ | ✅ | ✅ |
Pilote CUDA, cuDNN, NVIDIA dans DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod dans DSVM |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi dans DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch dans DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow dans DSVM |
Intégration avec Azure Machine Learning (Python) | ✅ (SDK Python, exemples) |
✅ (SDK Python, exemples) |
✅ (SDK Python,CLI, exemples) |
Kit de développement logiciel (SDK) Azure Machine Learning |
XGBoost | ✅ (prise en charge de la configuration CUDA) |
✅ (prise en charge de la configuration CUDA) |
✅ (prise en charge de la configuration CUDA) |
XGBoost dans DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit dans DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (Prise en charge MPI, GPU) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Conteneurs Windows uniquement) |
✅ (Conteneurs Windows uniquement) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
Stocker, récupérer et manipuler des données
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Bases de données relationnelles | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server dans DSVM |
Outils de base de données | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (outil d’interrogation), bcp, sqlcmd Pilotes ODBC/JDBC |
|
Azure Storage Explorer | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AZCopy | ✅ |
✅ |
❌ | AzCopy dans DSVM |
Pilote Blob FUSE | ❌ | ❌ | ❌ |
blobfuse dans DSVM |
Outil de migration de données Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB dans DSVM |
Outils en ligne de commande Unix/Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (autonome) | ✅ | ✅ | ✅ |
Programmer en Python, R, Julia et Node.js
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
CRAN-R avec packages courants préinstallés | ✅ | ✅ | ✅ | |
Anaconda Python avec packages populaires préinstallés | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (serveur de bloc-notes multi-utilisateur) | ❌ | ❌ | ✅ | |
JupyterLab (serveur de bloc-notes multi-utilisateur) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Serveur Jupyter Notebook avec les noyaux suivants : | ✅ |
✅ |
✅ | Exemples Jupyter Notebook |
R | Exemples R Jupyter | |||
Python | Exemples Python Jupyter | |||
Julia | Exemples Julia Jupyter | |||
PySpark | Exemples pySpark Jupyter |
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM et Windows Server 2022 DSVM ont les noyaux Jupyter suivants :-
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark (local)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark – HDInsight
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM et Windows Server 2022 DSVM ont les environnements conda suivants :-
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Utiliser votre éditeur ou IDE préféré
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio dans DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code dans DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm dans DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git et Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
Organiser et présenter les résultats
Outil | DSVM Windows Server 2019 | Windows Server 2022 DSVM | DSVM Ubuntu 20.04 | Notes d’utilisation |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Navigateur Microsoft Edge | ✅ | ✅ | ✅ |