Udostępnij za pośrednictwem


Co to jest maszyna wirtualna usługi Azure Nauka o danych dla systemów Linux i Windows?

Maszyna wirtualna Nauka o danych (DSVM) to dostosowany obraz maszyny wirtualnej dostępny na platformie w chmurze platformy Azure i może obsługiwać naukę o danych. Ma wiele popularnych narzędzi do nauki o danych wstępnie zainstalowanych i wstępnie skonfigurowanych w celu szybkiego rozpoczęcia tworzenia inteligentnych aplikacji do zaawansowanej analizy.

Maszyna DSVM jest dostępna w następujących miejscach:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Ponadto oferujemy maszynę Wirtualną DSVM platformy Azure dla platformy PyTorch — obraz z systemem Ubuntu 20.04 z witryny Azure Marketplace zoptymalizowany pod kątem dużych, rozproszonych obciążeń uczenia głębokiego. Ta wstępnie zainstalowana maszyna DSVM jest weryfikowana przy użyciu najnowszej wersji PyTorch, aby zmniejszyć koszty instalacji i skrócić czas na wartość. Pakiet jest dostarczany z różnymi funkcjami optymalizacji:

  • Środowisko uruchomieniowe ONNX
  • DeepSpeed
  • LISTA MSCCL
  • ORTMoE
  • Fairscale
  • Nvidia Apex
  • Aktualny stos z najnowszymi zgodnymi wersjami systemów Ubuntu, Python, PyTorch i CUDA

Porównanie z usługą Azure Machine Learning

Maszyna DSVM to dostosowany obraz maszyny wirtualnej dla Nauka o danych, ale usługa Azure Machine Learning to kompleksowa platforma obejmująca:

  • W pełni zarządzane obliczenia
    • Wystąpienia obliczeniowe
    • Klastry obliczeniowe dla rozproszonych zadań uczenia maszynowego
    • Klastry wnioskowania na potrzeby oceniania w czasie rzeczywistym
  • Magazyny danych (na przykład Blob, ADLS Gen2, SQL DB)
  • Śledzenie eksperymentów
  • Zarządzanie modelem
  • Notesy
  • Środowiska (zarządzanie zależnościami conda i R)
  • Etykietowanie
  • Potoki (automatyzowanie przepływów pracy analizy danych typu end-to-end)

Porównanie z wystąpieniami obliczeniowymi usługi Azure Machine Learning

Wystąpienia obliczeniowe usługi Azure Machine Learning to w pełni skonfigurowany i zarządzany obraz maszyny wirtualnej, a maszyna WIRTUALNa DSVM jest niezarządzaną maszyną wirtualną.

Kluczowe różnice między maszyną DSVM a wystąpieniem obliczeniowym usługi Azure Machine Learning:

Funkcja Analiza danych
VM
Azure Machine Learning
Wystąpienie obliczeniowe
W pełni zarządzana Nie. Tak
Obsługa języków Python, R, Julia, SQL, C#,
Java, Node.js, F#
Języki Python i R
System operacyjny Ubuntu
Windows
Ubuntu
Wstępnie skonfigurowana opcja procesora GPU Tak Tak
Opcja skalowania w górę Tak Tak
Dostęp SSH Tak Tak
Dostęp RDP Tak Nie.
Wbudowana
Hostowane notesy
Nie.
(wymaga dodatkowej konfiguracji)
Tak
Wbudowane logowanie jednokrotne Nie
(wymaga dodatkowej konfiguracji)
Tak
Wbudowana współpraca Nie. Tak
Wstępnie zainstalowane narzędzia Jupyter(lab), VS Code,
Visual Studio, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(laboratorium)

Przykładowe przypadki użycia maszyny WIRTUALNEJ DSVM

Krótkoterminowe eksperymenty i ocena

Maszyna DSVM może oceniać lub uczyć się nowych narzędzi do nauki o danych. Wypróbuj niektóre z naszych opublikowanych przykładów i przewodników.

Uczenie głębokie za pomocą procesorów GPU

W maszynie DSVM modele trenowania mogą używać algorytmów uczenia głębokiego na sprzęcie opartym na procesorach graficznych (GPU). Jeśli korzystasz z możliwości skalowania maszyn wirtualnych platformy Azure, maszyna DSVM ułatwia korzystanie ze sprzętu opartego na procesorze GPU w chmurze zgodnie z potrzebami. Możesz przełączyć się na maszynę wirtualną opartą na procesorze GPU podczas trenowania dużych modeli lub gdy potrzebujesz obliczeń o dużej szybkości podczas przechowywania tego samego dysku systemu operacyjnego. Możesz wybrać jedną z jednostek SKU maszyny wirtualnej z obsługą procesora GPU z serii N z maszyną DSVM. Bezpłatne konta platformy Azure nie obsługują jednostek SKU maszyn wirtualnych z obsługą procesora GPU.

Maszyna DSVM z systemem Windows jest wstępnie zainstalowana ze sterownikami, strukturami i procesorami GPU platform uczenia głębokiego. W wersjach systemu Linux uczenie głębokie na procesorach GPU jest włączone na maszynach DSVM z systemem Ubuntu.

Można również wdrożyć wersje DSVM z systemem Ubuntu lub Windows na maszynie wirtualnej platformy Azure, która nie jest oparta na procesorach GPU. W takim przypadku wszystkie struktury uczenia głębokiego wracają do trybu procesora CPU.

Dowiedz się więcej na temat dostępnych struktur uczenia głębokiego i sztucznej inteligencji.

Szkolenia i edukacja w zakresie nauki o danych

Instruktorzy i nauczyciele prowadzący zajęcia z zakresu nauki o danych zwykle udostępniają obraz maszyny wirtualnej. Obraz zapewnia, że zarówno uczniowie mają spójną konfigurację, jak i że próbki działają przewidywalnie.

Maszyna DSVM tworzy środowisko na żądanie ze spójną konfiguracją, aby ułatwić obsługę i niezgodność. To rozwiązanie oferuje znaczące korzyści w sytuacjach, w których jest konieczne częste tworzenie takich środowisk (zwłaszcza w przypadku krótszych szkoleń).

Co obejmuje maszyna DSVM?

Aby uzyskać więcej informacji, zobacz tę pełną listę narzędzi na maszynach DSVM z systemami Windows i Linux.

Następne kroki

Aby uzyskać więcej informacji, odwiedź następujące zasoby: