Co to jest maszyna wirtualna usługi Azure Nauka o danych dla systemów Linux i Windows?
Maszyna wirtualna Nauka o danych (DSVM) to dostosowany obraz maszyny wirtualnej dostępny na platformie w chmurze platformy Azure i może obsługiwać naukę o danych. Ma wiele popularnych narzędzi do nauki o danych wstępnie zainstalowanych i wstępnie skonfigurowanych w celu szybkiego rozpoczęcia tworzenia inteligentnych aplikacji do zaawansowanej analizy.
Maszyna DSVM jest dostępna w następujących miejscach:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
Ponadto oferujemy maszynę Wirtualną DSVM platformy Azure dla platformy PyTorch — obraz z systemem Ubuntu 20.04 z witryny Azure Marketplace zoptymalizowany pod kątem dużych, rozproszonych obciążeń uczenia głębokiego. Ta wstępnie zainstalowana maszyna DSVM jest weryfikowana przy użyciu najnowszej wersji PyTorch, aby zmniejszyć koszty instalacji i skrócić czas na wartość. Pakiet jest dostarczany z różnymi funkcjami optymalizacji:
- Środowisko uruchomieniowe ONNX
- DeepSpeed
- LISTA MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- Aktualny stos z najnowszymi zgodnymi wersjami systemów Ubuntu, Python, PyTorch i CUDA
Porównanie z usługą Azure Machine Learning
Maszyna DSVM to dostosowany obraz maszyny wirtualnej dla Nauka o danych, ale usługa Azure Machine Learning to kompleksowa platforma obejmująca:
- W pełni zarządzane obliczenia
- Wystąpienia obliczeniowe
- Klastry obliczeniowe dla rozproszonych zadań uczenia maszynowego
- Klastry wnioskowania na potrzeby oceniania w czasie rzeczywistym
- Magazyny danych (na przykład Blob, ADLS Gen2, SQL DB)
- Śledzenie eksperymentów
- Zarządzanie modelem
- Notesy
- Środowiska (zarządzanie zależnościami conda i R)
- Etykietowanie
- Potoki (automatyzowanie przepływów pracy analizy danych typu end-to-end)
Porównanie z wystąpieniami obliczeniowymi usługi Azure Machine Learning
Wystąpienia obliczeniowe usługi Azure Machine Learning to w pełni skonfigurowany i zarządzany obraz maszyny wirtualnej, a maszyna WIRTUALNa DSVM jest niezarządzaną maszyną wirtualną.
Kluczowe różnice między maszyną DSVM a wystąpieniem obliczeniowym usługi Azure Machine Learning:
Funkcja | Analiza danych VM |
Azure Machine Learning Wystąpienie obliczeniowe |
---|---|---|
W pełni zarządzana | Nie. | Tak |
Obsługa języków | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Języki Python i R |
System operacyjny | Ubuntu Windows |
Ubuntu |
Wstępnie skonfigurowana opcja procesora GPU | Tak | Tak |
Opcja skalowania w górę | Tak | Tak |
Dostęp SSH | Tak | Tak |
Dostęp RDP | Tak | Nie. |
Wbudowana Hostowane notesy |
Nie. (wymaga dodatkowej konfiguracji) |
Tak |
Wbudowane logowanie jednokrotne | Nie (wymaga dodatkowej konfiguracji) |
Tak |
Wbudowana współpraca | Nie. | Tak |
Wstępnie zainstalowane narzędzia | Jupyter(lab), VS Code, Visual Studio, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter(laboratorium) |
Przykładowe przypadki użycia maszyny WIRTUALNEJ DSVM
Krótkoterminowe eksperymenty i ocena
Maszyna DSVM może oceniać lub uczyć się nowych narzędzi do nauki o danych. Wypróbuj niektóre z naszych opublikowanych przykładów i przewodników.
Uczenie głębokie za pomocą procesorów GPU
W maszynie DSVM modele trenowania mogą używać algorytmów uczenia głębokiego na sprzęcie opartym na procesorach graficznych (GPU). Jeśli korzystasz z możliwości skalowania maszyn wirtualnych platformy Azure, maszyna DSVM ułatwia korzystanie ze sprzętu opartego na procesorze GPU w chmurze zgodnie z potrzebami. Możesz przełączyć się na maszynę wirtualną opartą na procesorze GPU podczas trenowania dużych modeli lub gdy potrzebujesz obliczeń o dużej szybkości podczas przechowywania tego samego dysku systemu operacyjnego. Możesz wybrać jedną z jednostek SKU maszyny wirtualnej z obsługą procesora GPU z serii N z maszyną DSVM. Bezpłatne konta platformy Azure nie obsługują jednostek SKU maszyn wirtualnych z obsługą procesora GPU.
Maszyna DSVM z systemem Windows jest wstępnie zainstalowana ze sterownikami, strukturami i procesorami GPU platform uczenia głębokiego. W wersjach systemu Linux uczenie głębokie na procesorach GPU jest włączone na maszynach DSVM z systemem Ubuntu.
Można również wdrożyć wersje DSVM z systemem Ubuntu lub Windows na maszynie wirtualnej platformy Azure, która nie jest oparta na procesorach GPU. W takim przypadku wszystkie struktury uczenia głębokiego wracają do trybu procesora CPU.
Dowiedz się więcej na temat dostępnych struktur uczenia głębokiego i sztucznej inteligencji.
Szkolenia i edukacja w zakresie nauki o danych
Instruktorzy i nauczyciele prowadzący zajęcia z zakresu nauki o danych zwykle udostępniają obraz maszyny wirtualnej. Obraz zapewnia, że zarówno uczniowie mają spójną konfigurację, jak i że próbki działają przewidywalnie.
Maszyna DSVM tworzy środowisko na żądanie ze spójną konfiguracją, aby ułatwić obsługę i niezgodność. To rozwiązanie oferuje znaczące korzyści w sytuacjach, w których jest konieczne częste tworzenie takich środowisk (zwłaszcza w przypadku krótszych szkoleń).
Co obejmuje maszyna DSVM?
Aby uzyskać więcej informacji, zobacz tę pełną listę narzędzi na maszynach DSVM z systemami Windows i Linux.
Następne kroki
Aby uzyskać więcej informacji, odwiedź następujące zasoby: