Was ist Azure Data Science Virtual Machine für Linux und Windows?
Data Science Virtual Machine (DSVM) ist ein angepasstes, auf der Azure-Cloudplattform basierendes VM-Image, das speziell für Data Science erstellt wurde. Es hat viele beliebte Data Science-Tools vorinstalliert und vorkonfiguriert, damit Sie sofort intelligente Anwendungen für die erweiterte Analyse erstellen können.
Die DSVM-Instanz ist für folgende Betriebssysteme verfügbar:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
Außerdem freuen wir uns, Ihnen Azure DSVM for PyTorch anbieten zu können, ein Ubuntu 20.04-Image aus dem Azure Marketplace, das für große, verteilte Deep Learning-Workloads optimiert ist. Die neueste PyTorch-Version ist vorinstalliert und validiert, um Setupkosten zu senken und die Time-to-Value zu verkürzen. Das Image enthält verschiedene Optimierungsfunktionen (ONNX Runtime, DeepSpeed, MSCCL, ORTMoE, Fairscale, Nvidia Apex) sowie einen aktuellen Stapel mit den neuesten kompatiblen Versionen von Ubuntu, Python, PyTorch und CUDA.
Vergleich mit Azure Machine Learning
Die DSVM ist ein benutzerdefiniertes VM-Image für Data Science, Azure Machine Learning hingegen ist eine End-to-End-Plattform, die Folgendes umfasst:
- Vollständig verwaltete Computeressourcen
- Compute-Instanzen
- Computecluster für verteilte ML-Aufgaben
- Rückschlusscluster für die Echtzeitbewertung
- Datenspeicher (z. B. Blob, ADLS Gen2, SQL DB)
- Experimentnachverfolgung
- Modellverwaltung
- Notebooks
- Umgebungen (Verwalten von Conda- und R-Abhängigkeiten)
- Bezeichnungen
- Pipelines (Automatisieren von Data Science-End-to-End-Workflows)
Vergleich mit Azure Machine Learning Compute-Instanzen
Bei Azure Machine Learning Compute-Instanzen handelt es sich um ein vollständig konfiguriertes und verwaltetes VM-Image, DSVM hingegen eine nicht verwaltete VM.
Wichtige Unterschiede:
Funktion | Data Science VM |
Azure Machine Learning Compute-Instanz |
---|---|---|
Vollständig verwaltet | Nein | Ja |
Sprachunterstützung | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Python und R |
Betriebssystem | Ubuntu Windows |
Ubuntu |
Vorkonfigurierte GPU-Option | Ja | Ja |
Option zum Hochskalieren | Ja | Ja |
SSH-Zugriff | Ja | Ja |
RDP-Zugriff | Ja | Nein |
Integriert Gehostete Notebooks |
Nein (zusätzliche Konfigurationsschritte erforderlich) |
Ja |
Integriertes einmaliges Anmelden | Ohne (zusätzliche Konfigurationsschritte erforderlich) |
Ja |
Integrierte Zusammenarbeit | Nein | Ja |
Vorinstallierte Tools | Jupyter(lab), VS Code, Visual Studio, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter (Lab) |
Beispiele für Anwendungsfälle
Hier sind einige gängige Anwendungsfälle für DSVM-Kund*innen aufgeführt.
Kurzfristige Experimente und Auswertungen
Mit DSVM können Sie neue Data Science-Tools testen oder kennenlernen, insbesondere indem Sie einige unserer veröffentlichten Beispiele und exemplarischen Vorgehensweisen durcharbeiten.
Deep Learning mit GPUs
In DSVM können Ihre Trainingsmodelle Deep Learning-Algorithmen auf Hardware verwenden, die auf Grafikprozessoren (Graphics Processing Units, GPUs) basiert. Dank der VM-Skalierungsfunktionen der Azure-Plattform unterstützt Sie DSVM bei der bedarfsgerechten Nutzung von GPU-basierter Hardware in der Cloud. Sie können zu einem GPU-basierten virtuellen Computer wechseln, wenn Sie große Modelle trainieren oder schnelle Berechnungen benötigen, und dabei den gleichen Betriebssystem-Datenträger beibehalten. Für DSVM können Sie beliebige GPU-fähige VM-SKUs der N-Serie auswählen. Beachten Sie, dass GPU-fähige VM-SKUs in kostenlosen Azure-Konten nicht unterstützt werden.
Die Windows-Editionen von DSVM enthalten vorinstallierte GPU-Treiber und -Frameworks sowie GPU-Versionen der Deep Learning-Frameworks. Unter Linux-Editionen ist GPU-basiertes Deep Learning in der DSVM-Instanz mit Ubuntu aktiviert.
Sie können die Ubuntu- oder Windows-Editionen von DSVM auch auf einem virtuellen Azure-Computer bereitstellen, der nicht auf GPUs basiert. In diesem Fall werden alle Deep Learning-Frameworks auf den CPU-Modus zurückgesetzt.
Informieren Sie sich ausführlicher über die verfügbaren Deep Learning- und KI-Frameworks.
Data Science-Schulung und -Ausbildung
Ausbilder in Unternehmen und Dozenten, die Data Science-Kurse leiten, stellen in der Regel ein Image eines virtuellen Computers bereit. Durch das Image wird gewährleistet, dass für die Kursteilnehmer eine konsistente Umgebung eingerichtet wird und die Beispiele erwartungsgemäß funktionieren.
DSVM erstellt eine bedarfsgerechte Umgebung mit einem konsistenten Setup, das den Support erleichtert und Inkompatibilitätsprobleme vermeidet. Wenn diese Umgebungen häufig bereitgestellt werden müssen, insbesondere für kürzere Schulungen, bringt dies erhebliche Vorteile.
Was ist in DSVM enthalten?
Eine vollständige Liste der Tools für Windows- und Linux-DSVM-Instanzen finden Sie hier.
Nächste Schritte
Weitere Informationen finden Sie in diesen Artikeln: