Apa itu Azure Data Science Virtual Machine untuk Linux dan Windows?
Ilmu Data Virtual Machine (DSVM) adalah gambar VM yang disesuaikan yang tersedia di platform cloud Azure, dan dapat menangani ilmu data. Ini memiliki banyak alat ilmu data populer yang telah diinstal dan telah dikonfigurasi sebelumnya untuk memulai membangun aplikasi cerdas untuk analitik tingkat lanjut.
DSVM tersedia di:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
Selain itu, kami menawarkan Azure DSVM untuk PyTorch - gambar Ubuntu 20.04 dari Marketplace Azure dioptimalkan untuk beban kerja pembelajaran mendalam besar dan terdistribusi. DSVM yang telah diinstal sebelumnya ini divalidasi dengan versi PyTorch terbaru, untuk mengurangi biaya penyiapan dan mempercepat waktu ke nilai. Muncul paket dengan berbagai fitur pengoptimalan:
- ONNX Runtime
- DeepSpeed
- MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- Tumpukan terbaru dengan versi terbaru yang kompatibel dari Ubuntu, Python, PyTorch, dan CUDA
Perbandingan dengan Azure Machine Learning
DSVM adalah gambar VM yang disesuaikan untuk Ilmu Data, tetapi Azure Pembelajaran Mesin adalah platform end-to-end yang mencakup:
- Komputasi yang Dikelola Penuh
- Instans Komputasi
- Kluster Komputasi untuk tugas ML yang didistribusikan
- Kluster Interferensi untuk penilaian real time
- Datastore (misalnya Blob, ADLS Gen2, SQL DB)
- Pelacakan eksperimen
- Manajemen model
- Notebook
- Lingkungan (mengelola ketergantungan R dan conda)
- Pemberian label
- Alur (mengotomatiskan alur kerja Data science End-to-End)
Perbandingan dengan Azure Pembelajaran Mesin Compute Instances
Azure Pembelajaran Mesin Compute Instances adalah gambar VM yang dikonfigurasi dan dikelola sepenuhnya, sementara DSVM adalah VM yang tidak dikelola.
Perbedaan utama antara DSVM dan instans komputasi Azure Pembelajaran Mesin:
Fitur | Ilmu data VM |
Pembelajaran Mesin Azure Instans Komputasi |
---|---|---|
Dikelola Sepenuhnya | Tidak | Ya |
Dukungan Bahasa | Python, R, Julia, SQL, C#, Java, Node.js, F# |
Python, dan R |
Sistem Operasi | Ubuntu Windows |
Ubuntu |
Opsi GPU Prakonfigurasi | Ya | Ya |
Opsi meningkatkan skala | Ya | Ya |
Akses SSH | Ya | Ya |
Akses RDP | Ya | Tidak |
Bawaan Notebook yang Dihosting |
No (memerlukan konfigurasi tambahan) |
Ya |
SSO Bawaan | Tanpa (memerlukan konfigurasi tambahan) |
Ya |
Kolaborasi Bawaan | Tidak | Ya |
Alat yang Telah Diinstal Sebelumnya | Jupyter(lab), Visual Studio Code, Studio Visual, PyCharm, Juno, Power BI Desktop, SSMS, Microsoft Office 365, Apache Drill |
Jupyter(lab) |
Contoh kasus penggunaan pelanggan DSVM
Eksperimen dan evaluasi jangka pendek
DSVM dapat mengevaluasi atau mempelajari alat ilmu data baru. Coba beberapa sampel dan panduan kami yang diterbitkan.
Pembelajaran mendalam dengan GPU
Dalam DSVM, model pelatihan Anda dapat menggunakan algoritma pembelajaran mendalam pada perangkat keras berbasis unit pemrosesan grafis (GPU). Jika Anda memanfaatkan kemampuan penskalaan VM platform Azure, DSVM membantu Anda memanfaatkan perangkat keras berbasis GPU di cloud, sesuai dengan kebutuhan Anda. Anda dapat beralih ke VM berbasis GPU saat melatih model besar, atau saat Anda membutuhkan komputasi berkecepatan tinggi saat Anda menyimpan disk OS yang sama. Anda dapat memilih salah satu SKU komputer virtual dengan dukungan GPU seri N dengan DSVM. Akun gratis Azure tidak mendukung SKU komputer virtual dengan dukungan GPU.
DSVM edisi Windows telah diinstal sebelumnya dengan driver GPU, kerangka kerja, dan versi GPU dari kerangka kerja pembelajaran mendalam. Pada edisi Linux, pembelajaran mendalam pada GPU diaktifkan di DSVM Ubuntu.
Anda juga dapat menyebarkan edisi DSVM Ubuntu atau Windows ke komputer virtual Azure yang tidak didasarkan pada GPU. Dalam hal ini, semua kerangka kerja pembelajaran mendalam kembali ke mode CPU.
Pelajari selengkapnya tentang kerangka kerja AI dan pembelajaran mendalam yang tersedia.
Pelatihan dan edukasi ilmu data
Pelatih dan pendidik perusahaan yang mengajar kelas ilmu data biasanya menyediakan citra komputer virtual. Gambar memastikan bahwa siswa memiliki penyiapan yang konsisten dan bahwa sampel berfungsi secara terprediksi.
DSVM menciptakan lingkungan sesuai permintaan dengan pengaturan yang konsisten, untuk memudahkan dukungan dan tantangan ketidaksesuaian. Kasus-kasus di mana lingkungan ini harus sering dibangun, terutama untuk kelas pelatihan yang lebih pendek, untuk mendapatkan manfaat secara substansial.
Apa yang disertakan DSVM?
Untuk informasi selengkapnya, lihat daftar lengkap alat ini di DSVM Windows dan Linux.
Langkah berikutnya
Untuk informasi selengkapnya, kunjungi sumber daya ini: