Was ist Azure Data Science Virtual Machine für Linux und Windows?
Data Science Virtual Machine (DSVM) ist ein benutzerdefiniertes VM-Image, das auf der Azure-Cloudplattform verfügbar ist und Data Science verarbeiten kann. Es hat viele beliebte Data Science-Tools vorinstalliert und vorkonfiguriert, damit Sie sofort intelligente Anwendungen für die erweiterte Analyse erstellen können.
Die DSVM-Instanz ist für folgende Betriebssysteme verfügbar:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
Außerdem bieten wir Azure DSVM for PyTorch an, ein Ubuntu 20.04-Image aus dem Azure Marketplace, das für große, verteilte Deep Learning-Workloads optimiert ist. Die vorinstallierte DSVM ist überprüft und verfügt über die aktuelle PyTorch-Version, um Setupkosten zu senken und die Amortisation zu beschleunigen. Sie wird mit verschiedenen Optimierungsfunktionen ausgeliefert:
- ONNX-Runtime
- DeepSpeed
- MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- Ein aktueller Stapel mit den neuesten kompatiblen Versionen von Ubuntu, Python, PyTorch und CUDA
Vergleich mit Azure Machine Learning
Die DSVM ist ein benutzerdefiniertes VM-Image für Data Science, Azure Machine Learning hingegen ist eine End-to-End-Plattform, die Folgendes abdeckt:
- Vollständig verwaltete Computeressourcen
- Compute-Instanzen
- Computecluster für verteilte ML-Aufgaben
- Rückschlusscluster für die Echtzeitbewertung
- Datenspeicher (z. B. Blob, ADLS Gen2, SQL DB)
- Experimentnachverfolgung
- Modellverwaltung
- Notebooks
- Umgebungen (Verwalten von Conda- und R-Abhängigkeiten)
- Bezeichnungen
- Pipelines (Automatisieren von Data Science-End-to-End-Workflows)
Vergleich mit Azure Machine Learning Compute-Instanzen
Bei Azure Machine Learning Compute-Instanzen handelt es sich um ein vollständig konfiguriertes und verwaltetes VM-Image, DSVM hingegen eine nicht verwaltete VM.
Wichtige Unterschiede zwischen einer DSVM- und einer Azure Machine Learning-Computeinstanz:
Funktion | Data Science VM |
Azure Machine Learning Compute-Instanz |
---|---|---|
Vollständig verwaltet | Nein | Ja |
Sprachunterstützung | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Python und R |
Betriebssystem | Ubuntu Windows |
Ubuntu |
Vorkonfigurierte GPU-Option | Ja | Ja |
Option zum Hochskalieren | Ja | Ja |
SSH-Zugriff | Ja | Ja |
RDP-Zugriff | Ja | Nein |
Integriert Gehostete Notebooks |
Nein (zusätzliche Konfigurationsschritte erforderlich) |
Ja |
Integriertes einmaliges Anmelden | Ohne (zusätzliche Konfigurationsschritte erforderlich) |
Ja |
Integrierte Zusammenarbeit | Nein | Ja |
Vorinstallierte Tools | Jupyter(lab), VS Code, Visual Studio, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter (Lab) |
Beispiele für DSVM-Kundenanwendungsfälle
Kurzfristige Experimente und Auswertungen
DSVM kann neue Data Science-Tools auswerten oder erlernen. Testen Sie einige unserer veröffentlichten Beispiele und exemplarischen Vorgehensweisen.
Deep Learning mit GPUs
In DSVM können Ihre Trainingsmodelle Deep Learning-Algorithmen auf Hardware verwenden, die auf Grafikprozessoren (Graphics Processing Units, GPUs) basiert. Wenn Sie die VM-Skalierungsfunktionen der Azure-Plattform nutzen, unterstützt DSVM Sie bei der bedarfsgerechten Nutzung von GPU-basierter Hardware in der Cloud. Sie können zu einer GPU-basierten VM wechseln, wenn Sie große Modelle trainieren oder schnelle Berechnungen benötigen, und dabei den gleichen Betriebssystem-Datenträger beibehalten. Für DSVM können Sie beliebige GPU-fähige VM-SKUs der N-Serie auswählen. Kostenlose Azure-Konten unterstützen keine GPU-fähigen VM-SKUs.
Die Windows-Editionen von DSVM enthalten vorinstallierte GPU-Treiber und -Frameworks sowie GPU-Versionen der Deep Learning-Frameworks. Unter Linux-Editionen ist GPU-basiertes Deep Learning in der DSVM-Instanz mit Ubuntu aktiviert.
Sie können die Ubuntu- oder Windows-Editionen von DSVM auch auf einem virtuellen Azure-Computer bereitstellen, der nicht auf GPUs basiert. In diesem Fall werden alle Deep Learning-Frameworks auf den CPU-Modus zurückgesetzt.
Informieren Sie sich ausführlicher über die verfügbaren Deep Learning- und KI-Frameworks.
Data Science-Schulung und -Ausbildung
Ausbilder in Unternehmen und Dozenten, die Data Science-Kurse leiten, stellen in der Regel ein Image eines virtuellen Computers bereit. Durch das Image wird gewährleistet, dass für die Kursteilnehmer eine konsistente Umgebung eingerichtet wird und die Beispiele erwartungsgemäß funktionieren.
DSVM erstellt eine bedarfsgerechte Umgebung mit einem konsistenten Setup, das den Support erleichtert und Inkompatibilitätsprobleme vermeidet. Wenn diese Umgebungen häufig bereitgestellt werden müssen, insbesondere für kürzere Schulungen, bringt dies erhebliche Vorteile.
Was beinhaltet die DSVM?
Weitere Informationen finden Sie in dieser vollständigen Liste der Tools für Windows- und Linux-DSVMs.
Nächste Schritte
Weitere Informationen finden Sie in den folgenden Ressourcen: