Share via


Wat is de Azure Data Science Virtual Machine voor Linux en Windows?

De Datawetenschap Virtual Machine (DSVM) is een aangepaste VM-installatiekopieën die beschikbaar zijn op het Azure-cloudplatform en kunnen gegevenswetenschap verwerken. Het bevat veel populaire data science-hulpprogramma's die vooraf zijn geïnstalleerd en vooraf zijn geconfigureerd om intelligente toepassingen te bouwen voor geavanceerde analyses.

De DSVM is beschikbaar op:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Daarnaast bieden we Azure DSVM voor PyTorch: een Ubuntu 20.04-installatiekopie van Azure Marketplace die is geoptimaliseerd voor grote, gedistribueerde Deep Learning-workloads. Deze vooraf geïnstalleerde DSVM wordt gevalideerd met de nieuwste PyTorch-versie om de installatiekosten te verlagen en de waarde te versnellen. Het wordt geleverd met verschillende optimalisatiefuncties:

  • ONNX Runtime
  • DeepSpeed
  • MSCCL
  • ORTMoE
  • Fairscale
  • Nvidia Apex
  • Een up-to-date stack met de nieuwste compatibele versies van Ubuntu, Python, PyTorch en CUDA

Vergelijking met Azure Machine Learning

De DSVM is een aangepaste VM-installatiekopieën voor Datawetenschap, maar Azure Machine Learning is een end-to-end platform dat betrekking heeft op:

  • Volledig beheerde compute
    • Rekeninstanties
    • Rekenclusters voor gedistribueerde ML-taken
    • Deductieclusters voor realtime scoren
  • Gegevensarchieven (bijvoorbeeld blob, ADLS Gen2, SQL DB)
  • Experimenten volgen
  • Modelbeheer
  • Notebooks
  • Omgevingen (Conda- en R-afhankelijkheden beheren)
  • Labels
  • Pijplijnen (end-to-end datatechnologiewerkstromen automatiseren)

Vergelijking met Azure Machine Learning Compute-exemplaren

Azure Machine Learning Compute Instances zijn een volledig geconfigureerde en beheerde VM-installatiekopieën, terwijl de DSVM een niet-beheerde VM is.

Belangrijke verschillen tussen een DSVM en een Azure Machine Learning-rekenproces:

Functie Gegevenswetenschap
VM
Azure Machine Learning
Rekenproces
Volledig beheerd Nr. Ja
Taalondersteuning Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python en R
Besturingssysteem Ubuntu
Windows
Ubuntu
Vooraf geconfigureerde GPU-optie Ja Ja
Optie voor omhoog schalen Ja Ja
SSH-toegang Ja Ja
RDP-toegang Ja Nr.
Ingebouwd
Gehoste notebooks
Nee
(hiervoor is aanvullende configuratie vereist)
Ja
Ingebouwde SSO No
(hiervoor is aanvullende configuratie vereist)
Ja
Ingebouwde samenwerking Nr. Ja
Vooraf geïnstalleerde hulpprogramma's Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Voorbeeld van DSVM-gebruiksvoorbeelden voor klanten

Kortetermijnexperimenten en evaluatie

De DSVM kan nieuwe hulpprogramma's voor gegevenswetenschap evalueren of leren. Probeer enkele van onze gepubliceerde voorbeelden en scenario's.

Deep Learning met GPU's

In de DSVM kunnen uw trainingsmodellen deep learning-algoritmen gebruiken op gpu-gebaseerde hardware (Graphics Processing Unit). Als u profiteert van de vm-schaalmogelijkheden van het Azure-platform, helpt de DSVM u gpu-gebaseerde hardware in de cloud te gebruiken, afhankelijk van uw behoeften. U kunt overschakelen naar een VM op basis van GPU wanneer u grote modellen traint of wanneer u snelle berekeningen nodig hebt terwijl u dezelfde besturingssysteemschijf behoudt. U kunt een van de SKU's van de N-serie met GPU-functionaliteit voor virtuele machines kiezen met DSVM. Gratis Azure-accounts bieden geen ondersteuning voor SKU's voor virtuele machines met GPU.

Een Windows-editie-DSVM is vooraf geïnstalleerd met GPU-stuurprogramma's, frameworks en GPU-versies van deep learning-frameworks. In de Linux-edities is deep learning voor GPU's ingeschakeld op de Ubuntu-DSVM's.

U kunt de Ubuntu- of Windows DSVM-edities ook implementeren op een virtuele Azure-machine die niet is gebaseerd op GPU's. In dit geval vallen alle deep learning-frameworks terug op de CPU-modus.

Meer informatie over beschikbare deep learning en AI-frameworks.

Training en opleiding in data science

Instructeurs en docenten die lessen in data science geven, verstrekken gewoonlijk een installatiekopie van de VM. De afbeelding zorgt ervoor dat leerlingen/studenten beide een consistente installatie hebben en dat de voorbeelden voorspelbaar werken.

De DSVM maakt een omgeving op aanvraag met een consistente installatie om de ondersteuning en incompatibiliteitsproblemen te vereenvoudigen. In gevallen waarin deze omgevingen regelmatig moeten worden gebouwd, met name voor kortere trainingen, hebben hier aanzienlijk baat bij.

Wat bevat de DSVM?

Zie deze volledige lijst met hulpprogramma's op zowel Windows- als Linux-DSVM's voor meer informatie.

Volgende stappen

Ga voor meer informatie naar deze bronnen: