Jaké nástroje zahrnuje virtuální počítač Azure Datová Věda?
Virtuální počítač Datová Věda (DSVM) můžete použít k snadnému prozkoumání dat a zpracování strojového učení v cloudu. DsVM je předem nakonfigurovaný s opravami zabezpečení, ovladači, oblíbeným softwarem pro datové vědy a vývoj a kompletním operačním systémem. Můžete si vybrat hardwarové prostředí, které vám vyhovuje, od méně nákladných počítačů orientovaných na procesor až po výkonné počítače s více GRAFICKÝmi procesory, úložištěm NVMe a velkým množstvím paměti. Pro počítače s GPU se nainstalují všechny ovladače a všechny architektury strojového učení se shodují s kompatibilitou GPU. Akcelerace je navíc povolená ve všech aplikačních softwaru, který podporuje GPU.
Virtuální počítač pro datové vědy se dodává s nejužitečnějšími nástroji pro datové vědy, které jsou předinstalované.
Vytváření řešení hlubokého učení a strojového učení
Nástroj | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Poznámky k využití |
---|---|---|---|---|
CUDA, cuDNN, ovladač NVIDIA | ✅ | ✅ | ✅ |
CUDA, cuDNN, ovladač NVIDIA na DSVM |
Horovod | ❌ | ❌ | ✅ | Horovod na DSVM |
NVidia System Management Interface (nvidia-smi) | ✅ | ✅ | ✅ | nvidia-smi na DSVM |
PyTorch | ✅ | ✅ | ✅ | PyTorch na DSVM |
TensorFlow | ✅ | ✅ |
✅ | TensorFlow na DSVM |
Integrace se službou Azure Machine Learning (Python) | ✅ (Python SDK, ukázky) |
✅ (Python SDK, ukázky) |
✅ (Python SDK, rozhraní příkazového řádku, ukázky) |
Azure Machine Learning SDK |
XGBoost | ✅ (Podpora CUDA) |
✅ (Podpora CUDA) |
✅ (Podpora CUDA) |
XGBoost na DSVM |
Vowpal Wabbit | ✅ | ✅ | ✅ |
Vowpal Wabbit na DSVM |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (PODPORA GPU, MPI) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Pouze kontejnery Windows) |
✅ (Pouze kontejnery Windows) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
Modul runtime ONNX | ❌ | ❌ | ✅ |
Ukládání, načítání a manipulace s daty
Nástroj | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Poznámky k využití |
---|---|---|---|---|
Relační databáze | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server na DSVM |
Databázové nástroje | SQL Server Management Studio Služba SSIS (SQL Server Integration Services) bcp, sqlcmd |
SQL Server Management Studio Služba SSIS (SQL Server Integration Services) bcp, sqlcmd |
SQuirreL SQL (dotazovací nástroj), bcp, sqlcmd Ovladače ODBC/JDBC |
|
Azure Storage Explorer | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AzCopy | ✅ |
✅ |
❌ | AzCopy na DSVM |
Ovladač Blob FUSE | ❌ | ❌ | ❌ |
Blobfuse na DSVM |
Nástroj pro migraci dat Azure Cosmos DB | ✅ | ✅ | ❌ | Azure Cosmos DB na DSVM |
Nástroje příkazového řádku systému Unix/Linux | ❌ | ❌ | ✅ | |
Apache Spark 3.1 (samostatně) | ✅ | ✅ | ✅ |
Program v Pythonu, R, Julii a Node.js
Nástroj | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Poznámky k využití |
---|---|---|---|---|
CRAN-R s předinstalovanými oblíbenými balíčky | ✅ | ✅ | ✅ | |
Anaconda Python s předinstalovanými oblíbenými balíčky | ✅ | ✅ (Miniconda) |
✅ (Miniconda) |
|
Julia (Julialang) | ✅ | ✅ | ✅ | |
JupyterHub (server s více uživateli poznámkového bloku) | ❌ | ❌ | ✅ | |
JupyterLab (server s více uživateli poznámkového bloku) | ✅ | ✅ | ✅ | |
Node.js | ✅ | ✅ | ✅ | |
Jupyter Notebook Server s následujícími jádry: | ✅ |
✅ |
✅ | Ukázky Poznámkového bloku Jupyter |
R | Ukázky Jupyter jazyka R | |||
Python | Ukázky Jupyter v Pythonu | |||
Julia | Julia Jupyter Samples | |||
PySpark | Ukázky pySpark Jupyter |
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM a Windows Server 2022 DSVM mají tato jádra Jupyter:
- Výchozí python3.8
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 – Spark (místní)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark – HDInsight
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM a Windows Server 2022 DSVM mají následující prostředí conda:
- Výchozí python3.8
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
Použití preferovaného editoru nebo integrovaného vývojového prostředí
Nástroj | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Poznámky k využití |
---|---|---|---|---|
Poznámkový blok++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | Visual Studio na DSVM |
Visual Studio Code | ✅ |
✅ |
✅ |
Visual Studio Code na DSVM |
PyCharm Community Edition | ✅ |
✅ |
✅ |
PyCharm na DSVM |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vitalita | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git a Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
Uspořádání a prezentování výsledků
Nástroj | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | Poznámky k využití |
---|---|---|---|---|
Microsoft 365 (Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Prohlížeč Microsoft Edge | ✅ | ✅ | ✅ |