Was ist Azure Data Science Virtual Machine für Linux und Windows?

Data Science Virtual Machine (DSVM) ist ein angepasstes, auf der Azure-Cloudplattform basierendes VM-Image, das speziell für Data Science erstellt wurde. Es hat viele beliebte Data Science-Tools vorinstalliert und vorkonfiguriert, damit Sie sofort intelligente Anwendungen für die erweiterte Analyse erstellen können.

Die DSVM-Instanz ist für folgende Betriebssysteme verfügbar:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Außerdem freuen wir uns, Ihnen Azure DSVM for PyTorch anbieten zu können, ein Ubuntu 20.04-Image aus dem Azure Marketplace, das für große, verteilte Deep Learning-Workloads optimiert ist. Die neueste PyTorch-Version ist vorinstalliert und validiert, um Setupkosten zu senken und die Time-to-Value zu verkürzen. Das Image enthält verschiedene Optimierungsfunktionen (ONNX Runtime​, DeepSpeed​, MSCCL​, ORTMoE​, Fairscale​, Nvidia Apex​) sowie einen aktuellen Stapel mit den neuesten kompatiblen Versionen von Ubuntu, Python, PyTorch und CUDA.

Vergleich mit Azure Machine Learning

Die DSVM ist ein benutzerdefiniertes VM-Image für Data Science, Azure Machine Learning hingegen ist eine End-to-End-Plattform, die Folgendes umfasst:

  • Vollständig verwaltete Computeressourcen
    • Compute-Instanzen
    • Computecluster für verteilte ML-Aufgaben
    • Rückschlusscluster für die Echtzeitbewertung
  • Datenspeicher (z. B. Blob, ADLS Gen2, SQL DB)
  • Experimentnachverfolgung
  • Modellverwaltung
  • Notebooks
  • Umgebungen (Verwalten von Conda- und R-Abhängigkeiten)
  • Bezeichnungen
  • Pipelines (Automatisieren von Data Science-End-to-End-Workflows)

Vergleich mit Azure Machine Learning Compute-Instanzen

Bei Azure Machine Learning Compute-Instanzen handelt es sich um ein vollständig konfiguriertes und verwaltetes VM-Image, DSVM hingegen eine nicht verwaltete VM.

Wichtige Unterschiede:

Funktion Data Science
VM
Azure Machine Learning
Compute-Instanz
Vollständig verwaltet Nein Ja
Sprachunterstützung Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python und R
Betriebssystem Ubuntu
Windows
Ubuntu
Vorkonfigurierte GPU-Option Ja Ja
Option zum Hochskalieren Ja Ja
SSH-Zugriff Ja Ja
RDP-Zugriff Ja Nein
Integriert
Gehostete Notebooks
Nein
(zusätzliche Konfigurationsschritte erforderlich)
Ja
Integriertes einmaliges Anmelden Ohne
(zusätzliche Konfigurationsschritte erforderlich)
Ja
Integrierte Zusammenarbeit Nein Ja
Vorinstallierte Tools Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter (Lab)

Beispiele für Anwendungsfälle

Hier sind einige gängige Anwendungsfälle für DSVM-Kund*innen aufgeführt.

Kurzfristige Experimente und Auswertungen

Mit DSVM können Sie neue Data Science-Tools testen oder kennenlernen, insbesondere indem Sie einige unserer veröffentlichten Beispiele und exemplarischen Vorgehensweisen durcharbeiten.

Deep Learning mit GPUs

In DSVM können Ihre Trainingsmodelle Deep Learning-Algorithmen auf Hardware verwenden, die auf Grafikprozessoren (Graphics Processing Units, GPUs) basiert. Dank der VM-Skalierungsfunktionen der Azure-Plattform unterstützt Sie DSVM bei der bedarfsgerechten Nutzung von GPU-basierter Hardware in der Cloud. Sie können zu einem GPU-basierten virtuellen Computer wechseln, wenn Sie große Modelle trainieren oder schnelle Berechnungen benötigen, und dabei den gleichen Betriebssystem-Datenträger beibehalten. Für DSVM können Sie beliebige GPU-fähige VM-SKUs der N-Serie auswählen. Beachten Sie, dass GPU-fähige VM-SKUs in kostenlosen Azure-Konten nicht unterstützt werden.

Die Windows-Editionen von DSVM enthalten vorinstallierte GPU-Treiber und -Frameworks sowie GPU-Versionen der Deep Learning-Frameworks. Unter Linux-Editionen ist GPU-basiertes Deep Learning in der DSVM-Instanz mit Ubuntu aktiviert.

Sie können die Ubuntu- oder Windows-Editionen von DSVM auch auf einem virtuellen Azure-Computer bereitstellen, der nicht auf GPUs basiert. In diesem Fall werden alle Deep Learning-Frameworks auf den CPU-Modus zurückgesetzt.

Informieren Sie sich ausführlicher über die verfügbaren Deep Learning- und KI-Frameworks.

Data Science-Schulung und -Ausbildung

Ausbilder in Unternehmen und Dozenten, die Data Science-Kurse leiten, stellen in der Regel ein Image eines virtuellen Computers bereit. Durch das Image wird gewährleistet, dass für die Kursteilnehmer eine konsistente Umgebung eingerichtet wird und die Beispiele erwartungsgemäß funktionieren.

DSVM erstellt eine bedarfsgerechte Umgebung mit einem konsistenten Setup, das den Support erleichtert und Inkompatibilitätsprobleme vermeidet. Wenn diese Umgebungen häufig bereitgestellt werden müssen, insbesondere für kürzere Schulungen, bringt dies erhebliche Vorteile.

Was ist in DSVM enthalten?

Eine vollständige Liste der Tools für Windows- und Linux-DSVM-Instanzen finden Sie hier.

Nächste Schritte

Weitere Informationen finden Sie in diesen Artikeln: