Apa itu Data Science Virtual Machine?

Selesai

Ilmu Data Virtual Machine (DSVM) berjalan di platform cloud Azure. Gambar DSVM untuk

  • Server Windows 2019
  • Server Ubuntu 20.04 LTS

tersedia. Anda dapat menjalankan DSVM pada seri dan ukuran komputer virtual Azure yang berbeda. Pilihan umum untuk DSVM meliputi:

Seri umum Gunakan huruf besar
Tujuan umum Rasio CPU/memori yang seimbang
Seri E yang optimal memori Analitik data dalam memori
Komputasi GPU seri N Eksperimen dan inferensi pembelajaran mesin

Komputer virtual seri N dilengkapi platform akselerasi NVIDIA Tesla dan teknologi NVIDIA GRID 2.0. Alat dan pustaka DSVM yang dapat menggunakan akselerasi GPU telah dikonfigurasi sebelumnya dengan driver dan versi pustaka yang sesuai.

Bagaimana cara kerja Data Science Virtual Machine

Setelah Anda menentukan sistem operasi dan platform perangkat keras, Azure membuat komputer virtual dan sumber daya terkait. Sumber daya terkait mencakup akun penyimpanan dan grup keamanan jaringan.

Saat Anda memulai komputer virtual, Azure memulihkan gambar ke jenis perangkat keras yang ditentukan, dan meluncurkan sistem operasi. Anda kemudian dapat terhubung, seperti yang ditunjukkan dalam modul ini. Setelah terhubung, Anda menggunakan komputer virtual dengan cara yang sama seperti Anda akan menggunakan komputer lain. Setelah selesai, Anda mematikan mesin dengan fasilitas sistem operasi atau portal Azure.

Biaya dan biaya Anda didasarkan pada jenis perangkat keras (daya komputasi, RAM, dan penyimpanan) yang Anda tentukan. Anda ditagihkan hanya untuk waktu komputer virtual berjalan, pada granularitas setengah menit.

Kapan waktu untuk menggunakan Data Science Virtual Machine

Tujuan DSVM adalah lingkungan yang bebas konflik, dan prakonfigurasi untuk ilmu data dan pembelajaran mesin. Pengalaman ini akrab dan dapat digunakan oleh para profesional data di semua tingkat keterampilan.

Alih-alih meluncurkan ruang kerja yang sebanding sendiri, Anda dapat menyiapkan DSVM. Pilihan tersebut dapat menghemat waktu penginstalan, konfigurasi, dan manajemen paket ber hari atau bahkan berpekanan . Setelah DSVM Anda dialokasikan, Anda dapat segera mulai mengerjakan proyek ilmu data Anda.

Contoh kasus penggunaan

DSVM cocok untuk beberapa kasus penggunaan.

Memindahkan beban kerja ilmu data ke cloud

DSVM menyediakan konfigurasi dasar untuk tim ilmu data. Konfigurasi ini memastikan bahwa semua ilmuwan data di tim memiliki pengaturan yang konsisten untuk memverifikasi eksperimen dan mempromosikan kolaborasi. Ini juga menurunkan biaya melalui pengurangan beban sysadmin. Pengurangan ini menyusutkan waktu yang diperlukan untuk mengevaluasi, menginstal, dan memelihara paket perangkat lunak untuk analitik tingkat lanjut.

Pelatihan dan edukasi ilmu data

Pelatih dan pendidik perusahaan yang mengajar kelas ilmu data biasanya menyediakan citra komputer virtual. Citra memastikan bahwa siswa memiliki pengaturan yang konsisten, dan sampel bekerja secara terprediksi.

DSVM menciptakan lingkungan sesuai permintaan dengan pengaturan, yang konsisten yang meringankan tantangan dukungan dan kompatibilitas. Kasus-kasus di mana lingkungan ini harus sering dibangun, terutama untuk kelas pelatihan yang lebih pendek, untuk mendapatkan manfaat secara substansial.

Kapasitas elastis sesuai permintaan untuk proyek skala besar

Hackathon/kompetisi ilmu data, atau pemodelan dan eksplorasi data skala besar, memerlukan kapasitas perangkat keras yang diskalakan, biasanya untuk durasi singkat. DSVM dapat membantu mereplikasi lingkungan ilmu data, dengan cepat dan sesuai permintaan. Lingkungan yang direplikasi ini kemudian dapat berjalan pada sumber daya komputasi bertenaga tinggi seperti yang diperlukan skenario Anda.

Eksperimen dan evaluasi jangka pendek

Anda dapat menggunakan DSVM untuk mengevaluasi atau mempelajari alat ilmu data baru. DSVM memiliki sampel dan panduan yang sudah diinstal.

Pembelajaran mendalam dengan GPU

Dalam DSVM, model pelatihan Anda dapat menggunakan algoritma pembelajaran mendalam pada perangkat keras berbasis GPU. DSVM memanfaatkan kemampuan penskalaan VM platform Azure, untuk membantu Anda menggunakan perangkat keras berbasis GPU di cloud.

Anda dapat beralih ke VM berbasis GPU saat melatih model besar, atau saat Anda memerlukan komputasi berkecepatan tinggi sambil menyimpan disk OS yang sama. Anda dapat memilih salah satu SKU komputer virtual dengan dukungan GPU seri N dengan DSVM. Akun gratis Azure tidak mendukung SKU komputer virtual dengan dukungan GPU.

Untuk alat dan kerangka kerja yang mendukung akselerasi GPU, DSVM dikonfigurasi dengan driver, alat GPU, dan versi dan konfigurasi kerangka kerja yang tepat. Jika Anda menggunakan Python, beberapa lingkungan conda yang dikonfigurasi tersedia, untuk menghindari kebingungan. Misalnya, PyTorch dan TensorFlow beroperasi di lingkungan terpisah.

Anda juga dapat menggunakan DSVM edisi Ubuntu atau Windows ke komputer virtual Azure yang tidak berbasis GPU. Dalam hal ini, semua kerangka kerja pembelajaran mendalam kembali ke model CPU.

Skenario kami, di mana Anda menyelidiki data bank untuk membantu memprediksi tren, menyentuh beberapa kasus penggunaan ini: kolaborasi, kapasitas, dan eksplorasi. Anda memutuskan bahwa Ubuntu DSVM adalah pilihan yang baik, karena memungkinkan Anda menggunakan alat yang sudah dikenal seperti CRAN-R dan disk data yang ada. Selain itu, Tidak mengharuskan Anda untuk berinvestasi dalam mempelajari teknologi baru sampai Anda bekerja dengan data Anda untuk sementara waktu.