Azure 데이터 과학 Virtual Machine에는 어떤 도구가 포함됩니까?
데이터 과학 DSVM(Virtual Machine)을 사용하여 데이터를 쉽게 탐색하고 클라우드에서 기계 학습을 처리할 수 있습니다. DSVM은 보안 패치, 드라이버, 인기 있는 데이터 과학 및 개발 소프트웨어 및 완전한 운영 체제로 미리 구성됩니다. 저렴한 CPU 중심 컴퓨터에서 여러 GPU, NVMe 스토리지 및 대용량 메모리가 있는 강력한 머신에 이르기까지 적합한 하드웨어 환경을 선택할 수 있습니다. GPU가 있는 컴퓨터의 경우 모든 드라이버가 설치되고 모든 기계 학습 프레임워크가 GPU 호환성을 위해 버전과 일치합니다. 또한 GPU를 지원하는 모든 애플리케이션 소프트웨어에서 가속이 활성화됩니다.
DSVM에는 미리 설치된 가장 유용한 데이터 과학 도구가 함께 제공됩니다.
딥 러닝 및 기계 학습 솔루션 빌드
도구 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 사용법 참고 사항 |
---|---|---|---|---|
CUDA, cuDNN, NVIDIA 드라이버 | ✅ | ✅ | ✅ |
DSVM의 CUDA, cuDNN, NVIDIA 드라이버 |
Horovod | ❌ | ❌ | ✅ | DSVM의 Horovod |
NVidia System Management 인터페이스(nvidia-smi) | ✅ | ✅ | ✅ | DSVM의 nvidia-smi |
PyTorch | ✅ | ✅ | ✅ | DSVM의 PyTorch |
Tensorflow | ✅ | ✅ |
✅ | DSVM의 TensorFlow |
Azure Machine Learning(Python)과의 통합 | ✅ (Python SDK, 샘플) |
✅ (Python SDK, 샘플) |
✅ (Python/R SDK,CLI, 샘플) |
Azure Machine Learning SDK |
XGBoost | ✅ (CUDA 지원) |
✅ (CUDA 지원) |
✅ (CUDA 지원) |
DSVM의 XGBoost |
Vowpal Wabbit | ✅ | ✅ | ✅ |
DSVM의 Vowpal Wabbit |
Weka | ❌ | ❌ | ❌ | |
LightGBM | ❌ | ❌ | ✅ (GPU, MPI 지원) |
|
H2O | ❌ | ❌ | ✅ | |
CatBoost | ❌ | ❌ | ✅ | |
Intel MKL | ❌ | ❌ | ✅ | |
OpenCV | ❌ | ❌ | ✅ | |
Dlib | ❌ | ❌ | ✅ | |
Docker | ✅ (Windows 컨테이너만 해당) |
✅ (Windows 컨테이너만 해당) |
✅ | |
Nccl | ❌ | ❌ | ✅ | |
Rattle | ❌ | ❌ | ❌ | |
PostgreSQL | ❌ | ❌ | ✅ | |
ONNX Runtime | ❌ | ❌ | ✅ |
데이터 저장, 검색 및 조작
도구 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 사용법 참고 사항 |
---|---|---|---|---|
관계형 데이터베이스 | SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
SQL Server 2019 Developer Edition |
DSVM의 SQL Server |
데이터베이스 도구 | SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQL Server Management Studio SQL Server Integration Services bcp, sqlcmd |
SQuirreL SQL (쿼리 도구), bcp, sqlcmd ODBC/JDBC 드라이버 |
|
Azure Storage Explorer | ✅ |
✅ |
||
Azure CLI | ✅ |
✅ |
✅ |
|
AZCopy | ✅ |
✅ |
❌ | DSVM의 AzCopy |
Blob FUSE 드라이버 | ❌ | ❌ | ❌ |
DSVM의 blobfuse |
Azure Cosmos DB 데이터 마이그레이션 도구 | ✅ | ✅ | ❌ | DSVM의 Azure Cosmos DB |
Unix/Linux 명령줄 도구 | ❌ | ❌ | ✅ | |
Apache Spark 3.1(독립 실행형) | ✅ | ✅ | ✅ |
Python, R, Julia 및 Node.js 프로그램
도구 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 사용법 참고 사항 |
---|---|---|---|---|
인기 있는 패키지가 미리 설치된 CRAN-R | ✅ | ✅ | ✅ | |
인기 있는 패키지가 미리 설치된 Anaconda Python | ✅ | ✅ (미니콘다) |
✅ (Miniconda) |
|
줄리아 (줄리아랑) | ✅ | ✅ | ✅ | |
JupyterHub(다중 사용자 노트북 서버) | ❌ | ❌ | ✅ | |
JupyterLab(다중 사용자 노트북 서버) | ✅ | ✅ | ✅ | |
Node.JS | ✅ | ✅ | ✅ | |
Jupyter Notebook Server - 다음 커널 포함: | ✅ |
✅ |
✅ | Jupyter Notebook 샘플 |
R | R Jupyter 샘플 | |||
Python | Python Jupyter 샘플 | |||
Julia | Julia Jupyter 샘플 | |||
PySpark | pySpark Jupyter 샘플 |
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM 및 Windows Server 2022 DSVM 에는 다음과 같은 Jupyter 커널이 있습니다.
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
- R
- Python 3.7 - Spark(로컬)
- Julia 1.6.0
- R Spark – HDInsight
- Scala Spark – HDInsight
- Python 3 Spark - HDInsight
Ubuntu 20.04 DSVM, Windows Server 2019 DSVM 및 Windows Server 2022 DSVM 에는 다음과 같은 conda 환경이 있습니다.
- Python3.8-default
- Python3.8-Tensorflow-Pytorch
- Python3.8-AzureML
기본 설정 편집기 또는 IDE 사용
도구 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 사용법 참고 사항 |
---|---|---|---|---|
Notepad++ | ✅ |
✅ |
❌ |
|
Nano | ✅ |
✅ |
❌ |
|
Visual Studio 2019 Community Edition | ✅ |
✅ | ❌ | DSVM의 Visual Studio |
Visual Studio Code | ✅ |
✅ |
✅ |
DSVM의 Visual Studio Code |
PyCharm Community Edition | ✅ |
✅ |
✅ |
DSVM의 PyCharm |
IntelliJ IDEA | ❌ | ❌ | ✅ | |
Vim | ❌ | ❌ | ✅ |
|
Emacs | ❌ | ❌ | ✅ |
|
Git 및 Git Bash | ✅ |
✅ |
✅ |
|
OpenJDK 11 | ✅ |
✅ |
✅ |
|
.NET Framework | ✅ |
✅ |
❌ | |
Azure SDK | ✅ |
✅ | ✅ |
결과 구성 및 표시
도구 | Windows Server 2019 DSVM | Windows Server 2022 DSVM | Ubuntu 20.04 DSVM | 사용법 참고 사항 |
---|---|---|---|---|
Microsoft 365(Word, Excel, PowerPoint) | ✅ | ✅ | ❌ | |
Microsoft Teams | ✅ | ✅ | ❌ | |
Power BI Desktop | ✅ | ✅ |
❌ | |
Microsoft Edge Browser | ✅ | ✅ | ✅ |