Apa yang dimaksud dengan instans komputasi Azure Machine Learning?
Instans komputasi Azure Machine Learning adalah stasiun kerja berbasis cloud yang dikelola untuk ilmuwan data. Setiap instans komputasi hanya memiliki satu pemilik, meskipun Anda dapat berbagi file di antara beberapa instans komputasi.
Instans komputasi memudahkan untuk memulai pengembangan Azure Pembelajaran Mesin dan menyediakan kemampuan manajemen dan kesiapan perusahaan untuk administrator TI.
Gunakan instans komputasi sebagai lingkungan pengembangan yang terkonfigurasi dan terkelola sepenuhnya di cloud untuk pembelajaran mesin. Hal ini juga dapat digunakan sebagai target komputasi pada pelatihan dan inferensi untuk tujuan pengembangan dan pengujian.
Agar fungsionalitas Jupyter instans komputasi berfungsi, pastikan bahwa komunikasi soket web tidak dinonaktifkan. Pastikan jaringan Anda mengizinkan koneksi soket web ke *.instances.azureml.net dan *.instances.azureml.ms.
Penting
Item yang ditandai (pratinjau) dalam artikel ini sedang dalam pratinjau publik. Versi pratinjau disediakan tanpa perjanjian tingkat layanan, dan tidak disarankan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk mengetahui informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.
Mengapa menggunakan instans komputasi?
Instans komputasi adalah stasiun kerja berbasis cloud terkelola sepenuhnya yang dioptimalkan untuk lingkungan pengembangan pembelajaran mesin Anda. Itu memberikan manfaat berikut:
Manfaat utama | Deskripsi |
---|---|
Produktivitas | Anda dapat membuat dan menyebarkan model menggunakan notebooks terintegrasi dan alat berikut di studio Azure Machine Learning: - Jupyter - JupyterLab - VS Code (pratinjau) Instans komputasi terintegrasi penuh dengan ruang kerja dan studio Azure Machine Learning. Anda dapat berbagi notebooks dan data dengan ilmuwan data lain di ruang kerja. |
Terkelola & aman | Kurangi jejak keamanan Anda dan tambahkan kepatuhan terhadap persyaratan keamanan perusahaan. Instans komputasi menyediakan kebijakan manajemen yang kuat dan konfigurasi jaringan yang aman seperti: - Penyediaan otomatis dari templat Resource Manager untuk SDK Azure Machine Learning - Kontrol akses berbasis peran Azure (Azure RBAC) - Dukungan jaringan virtual - Kebijakan Azure untuk menonaktifkan akses SSH - Kebijakan Azure untuk memberlakukan pembuatan di jaringan virtual - Matikan otomatis/mulai otomatis berdasarkan jadwal TLS 1.2 Diaktifkan |
Dikonfigurasi sebelumnya untuk ML | Hemat waktu pada tugas penyiapan dengan paket ML yang telah dikonfigurasi sebelumnya dan terbaru, kerangka kerja pembelajaran mendalam, driver GPU. |
Dapat disesuaikan sepenuhnya | Dukungan luas untuk jenis VM Azure termasuk GPU dan penyesuaian tingkat rendah yang berkelanjutan seperti menginstal paket dan driver membuat skenario tingkat lanjut menjadi mudah. Anda juga dapat menggunakan skrip pengaturan untuk mengotomatiskan penyesuaian |
- Amankan instans komputasi Anda tanpa IP publik.
- Instans komputasi juga merupakan target komputasi pelatihan yang aman yang mirip dengan kluster komputasi, tetapi merupakan simpul tunggal.
- Anda dapat membuat instans komputasi sendiri, atau administrator dapat membuat instans komputasi atas nama Anda.
- Anda juga dapat menggunakan skrip penyiapan untuk cara otomatis untuk menyesuaikan dan mengonfigurasi instans komputasi sesuai kebutuhan Anda.
- Untuk menghemat biaya, buat jadwal untuk memulai dan menghentikan instans komputasi secara otomatis, atau mengaktifkan matikan diam
Alat dan lingkungan
Instans komputasi Azure Machine Learning memungkinkan Anda membuat, melatih, dan menyebarkan model dalam pengalaman notebook terintegrasi penuh di ruang kerja Anda.
Anda dapat menjalankan notebook dari ruang kerja Azure Pembelajaran Mesin, Jupyter, JupyterLab, atau Visual Studio Code. Visual Studio Code Desktop dapat dikonfigurasi untuk mengakses instans komputasi Anda. Atau gunakan Visual Studio Code untuk Web, langsung dari browser, dan tanpa penginstalan atau dependensi yang diperlukan.
Kami sarankan Anda mencoba Visual Studio Code untuk Web untuk memanfaatkan integrasi yang mudah dan lingkungan pengembangan yang kaya yang disediakannya. Visual Studio Code untuk Web memberi Anda banyak fitur Visual Studio Code Desktop yang Anda sukai, termasuk penyorotan pencarian dan sintaksis saat menjelajah dan mengedit. Untuk informasi selengkapnya tentang menggunakan Visual Studio Code Desktop dan VISUAL Code untuk Web, lihat Meluncurkan Visual Studio Code yang terintegrasi dengan Azure Pembelajaran Mesin (pratinjau) dan Bekerja di VISUAL Code yang terhubung dari jarak jauh ke instans komputasi (pratinjau).
Anda dapat menginstal paket dan menambahkan kernel ke instans komputer Anda.
Alat dan lingkungan berikut sudah diinstal pada instans komputasi:
Alat & lingkungan umum | Detail |
---|---|
Driver | CUDA cuDNN NVIDIA Blob FUSE |
Pustaka MPI Intel | |
Azure CLI | |
Sampel Azure Machine Learning | |
Docker | |
Nginx. | |
NCCL 2.0 | |
Protobuf |
R alat & lingkungan | Detail |
---|---|
Kernel R |
Anda dapat Menambahkan RStudio atau Posit Workbench (sebelumnya RStudio Workbench) saat membuat instans.
PYTHON alat & lingkungan | Detail |
---|---|
Anaconda Python | |
Jupyter dan ekstensi | |
Jupyterlab dan ekstensi | |
Azure Pembelajaran Mesin SDK untuk Python dari PyPI |
Termasuk azure-ai-ml dan banyak paket tambahan azure umum. Untuk melihat daftar lengkapnya, buka jendela terminal pada instans komputasi Anda dan jalankan conda list -n azureml_py310_sdkv2 ^azure |
Paket PyPI lainnya | jupytext tensorboard nbconvert notebook Pillow |
paket Conda | cython numpy ipykernel scikit-learn matplotlib tqdm joblib nodejs |
Paket pembelajaran mendalam | PyTorch TensorFlow Keras Horovod MLFlow pandas-ml scrapbook |
Paket ONNX | keras2onnx onnx onnxconverter-common skl2onnx onnxmltools |
Contoh Python Pembelajaran Mesin Azure |
Instans komputasi memiliki Ubuntu sebagai OS dasar.
Mengakses file
Notebook dan skrip Python disimpan di akun penyimpanan default ruang kerja Anda di berbagi file Azure. File-file ini terletak di bawah direktori "File pengguna" Anda. Penyimpanan ini memudahkan untuk berbagi notebooks di antara instans komputasi. Akun penyimpanan juga menyimpan notebooks Anda dengan aman saat Anda menghentikan atau menghapus instans komputasi.
Akun berbagi file Azure dari ruang kerja Anda dipasang sebagai drive pada instans komputasi. Drive ini adalah direktori kerja default untuk Jupyter, Jupyter Labs, RStudio, dan Posit Workbench. Ini berarti bahwa notebook dan file lain yang Anda buat di Jupyter, JupyterLab, VS Code untuk Web, RStudio, atau Posit secara otomatis disimpan pada berbagi file dan tersedia untuk digunakan dalam instans komputasi lain juga.
File dalam berbagi file dapat diakses dari semua instans komputasi di ruang kerja yang sama. Setiap perubahan pada file ini pada instans komputasi akan dipertahankan dengan andal hingga berbagi file.
Anda juga dapat mengkloning sampel Azure Machine Learning terbaru ke folder di bagian direktori file pengguna di berbagi file ruang kerja.
Menulis file kecil dapat menjadi lebih lambat di drive jaringan daripada menulis ke disk lokal instans komputasi itu sendiri. Jika Anda menulis banyak file kecil, coba gunakan direktori langsung pada instans komputasi, seperti /tmp
direktori. Perhatikan bahwa file-file ini tidak akan dapat diakses dari instans komputasi lainnya.
Jangan simpan data pelatihan di berbagi file notebooks. Untuk informasi tentang berbagai opsi untuk menyimpan data, lihat Mengakses data dalam pekerjaan.
Anda dapat menggunakan direktori /tmp
pada instans komputasi untuk data sementara. Namun, jangan menulis file data yang besar pada disk OS instans komputasi. Disk OS pada instans komputasi memiliki kapasitas 120 GB. Anda juga dapat menyimpan data pelatihan sementara pada disk sementara yang dipasang di /mnt. Ukuran disk sementara dapat dikonfigurasi berdasarkan ukuran mesin virtual yang dipilih dan dapat menyimpan jumlah data yang lebih besar jika mesin virtual dengan ukuran yang lebih tinggi dipilih. Paket perangkat lunak apa pun yang Anda instal disimpan pada disk OS instans komputasi. Perhatikan bahwa enkripsi kunci yang dikelola pelanggan saat ini tidak didukung untuk disk OS. Disk OS untuk instans komputasi dienkripsi dengan kunci yang dikelola Microsoft.
Anda juga dapat memasang penyimpanan data dan himpunan data.
Buat
Ikuti langkah-langkah dalam Membuat sumber daya yang Anda butuhkan untuk mulai membuat instans komputasi dasar.
Untuk opsi lainnya, lihat membuat instans komputasi baru.
Sebagai administrator, Anda dapat membuat instans komputasi untuk orang lain di ruang kerja. SSO harus dinonaktifkan untuk instans komputasi tersebut.
Anda juga dapat menggunakan skrip penyiapan untuk cara otomatis untuk menyesuaikan dan mengonfigurasi instans komputasi.
Cara lain untuk membuat instans komputasi:
- Langsung dari pengalaman notebook terintegrasi.
- Dari template Azure Resource Manager. Untuk template contoh, lihat membuat template instans komputasi Azure Machine Learning.
- Dengan SDK Azure Machine Learning
- Dari ekstensi CLI untuk Azure Machine Learning
Core khusus per wilayah per kuota keluarga VM dan kuota total regional, yang berlaku untuk pembuatan instans komputasi, disatukan dan dibagikan dengan kuota kluster komputasi pelatihan Azure Machine Learning. Menghentikan instans komputasi tidak membebaskan kuota untuk memastikan Anda dapat memulai ulang instans komputasi. Jangan hentikan instans komputasi melalui terminal OS dengan melakukan penonaktifan sudo.
Instans komputasi dilengkapi dengan disk OS P10. Jenis disk sementara tergantung pada ukuran VM yang dipilih. Saat ini, tidak mungkin untuk mengubah jenis disk OS.
Target komputasi
Instans komputasi dapat digunakan sebagai target komputasi pelatihan yang serupa dengan kluster pelatihan komputasi Azure Machine Learning. Tetapi instans komputasi hanya memiliki node tunggal, sementara kluster komputasi dapat memiliki lebih banyak node.
Instans komputasi:
- Memiliki antrean pekerjaan.
- Menjalankan pekerjaan dengan aman di lingkungan jaringan virtual, tanpa mengharuskan perusahaan untuk membuka port SSH. Pekerjaan dijalankan dalam lingkungan ter-kontainer dan mengemas dependensi model Anda dalam kontainer Docker.
- Dapat menjalankan beberapa pekerjaan kecil secara paralel. Satu pekerjaan per vCPU dapat berjalan secara paralel saat pekerjaan lainnya diantrekan.
- Mendukung pekerjaan pelatihan terdistribusi single-node multi-GPU
Anda dapat menggunakan instans komputasi sebagai target penyebaran inferensi lokal untuk skenario pengujian/debug.
Tip
Instans komputasi memiliki disk OS 120GB. Jika Anda kehabisan ruang disk dan masuk ke status tidak dapat digunakan, harap kosongkan setidaknya 5 GB ruang disk pada disk OS (dipasang di /) melalui terminal instans komputasi dengan menghapus file/folder dan kemudian lakukan sudo reboot
. Disk sementara akan dibebaskan setelah dimulai ulang; Anda tidak perlu membersihkan ruang pada disk sementara secara manual. Untuk mengakses terminal, buka halaman daftar komputasi atau halaman detail instans komputasi dan klik tautan Terminal. Anda dapat memeriksa ruang disk yang tersedia dengan menjalankan df -h
di terminal. Kosongkan setidaknya 5 GB ruang sebelum melakukan sudo reboot
. Harap jangan menghentikan atau memulai ulang instans komputasi melalui Studio hingga ruang disk 5 GB kosong. Matikan otomatis, termasuk mulai atau hentikan terjadwal serta matikan saat tidak digunakan, tidak akan berfungsi jika disk CI penuh.
Langkah berikutnya
- Buat sumber daya yang Anda butuhkan untuk memulai.
- Tutorial: Melatih model ML pertama Anda menunjukkan cara menggunakan instans komputasi dengan notebook terintegrasi.