Bagikan melalui


Apa itu ruang kerja Azure Machine Learning?

Ruang kerja adalah tempat untuk berkolaborasi dengan kolega untuk membuat artefak pembelajaran mesin dan pekerjaan terkait grup. Misalnya, eksperimen, pekerjaan, himpunan data, model, komponen, dan titik akhir inferensi. Artikel ini menjelaskan ruang kerja, cara mengelola akses ke ruang kerja, dan cara menggunakannya untuk mengatur pekerjaan Anda.

Siap memulai? Buat ruang kerja.

Tugas yang dilakukan dalam ruang kerja

Untuk tim pembelajaran mesin, ruang kerja adalah tempat untuk mengatur pekerjaan mereka. Berikut adalah beberapa tugas yang bisa Anda mulai dari ruang kerja:

  • Membuat pekerjaan - Pekerjaan adalah pelatihan yang Anda gunakan untuk membangun model Anda. Anda dapat mengelompokkan pekerjaan ke dalam eksperimen untuk membandingkan metrik.
  • Pipeline Penulis - Pipeline adalah alur kerja yang dapat digunakan kembali untuk pelatihan dan pelatihan ulang model Anda.
  • Mendaftarkan aset data - Aset data membantu dalam pengelolaan data yang Anda gunakan untuk pelatihan model dan pengembangan alur kerja.
  • Daftarkan model - Setelah Anda memiliki model yang ingin Anda sebarkan, Anda membuat model terdaftar.
  • Menyebarkan model - Gunakan model terdaftar dan skrip penilaian untuk menyebarkan model.

Selain mengelompokkan hasil pembelajaran mesin Anda, ruang kerja juga menghosting konfigurasi sumber daya:

  • Target komputasi digunakan untuk menjalankan eksperimen Anda.
  • Datastore menentukan bagaimana Anda dan orang lain dapat terhubung ke sumber data saat menggunakan aset data.
  • Pengaturan keamanan - Jaringan, kontrol identitas dan akses, dan pengaturan enkripsi.

Menata ruang kerja

Untuk pemimpin tim dan administrator pembelajaran mesin, ruang kerja berfungsi sebagai kontainer untuk manajemen akses, manajemen biaya, dan isolasi data. Berikut adalah beberapa tips untuk mengatur ruang kerja:

  • Gunakan peran pengguna untuk manajemen izin di ruang kerja antar pengguna. Misalnya ilmuwan data, insinyur pembelajaran mesin, atau admin.
  • Menetapkan akses ke grup pengguna: Dengan menggunakan grup pengguna Microsoft Entra, Anda tidak perlu menambahkan pengguna individual ke setiap ruang kerja, dan ke sumber daya lain yang memerlukan akses ke grup pengguna yang sama.
  • Membuat ruang kerja per proyek: Meskipun ruang kerja dapat digunakan untuk beberapa proyek, membatasinya ke satu proyek per ruang kerja memungkinkan pelaporan biaya terakumulasi ke tingkat proyek. Ini juga memungkinkan Anda mengelola konfigurasi seperti penyimpanan data dalam cakupan setiap proyek.
  • Berbagi sumber daya Azure: Ruang kerja mengharuskan Anda membuat beberapa sumber daya terkait. Bagikan sumber daya ini antar ruang kerja untuk menyimpan langkah-langkah penyiapan berulang.
  • Aktifkan layanan mandiri: Buat terlebih dahulu dan amankan sumber daya terkait sebagai admin TI, dan gunakan peran pengguna untuk memungkinkan ilmuwan data membuat ruang kerja sendiri.
  • Berbagi aset: Anda dapat berbagi aset antar ruang kerja menggunakan registri Azure Pembelajaran Mesin.

Bagaimana konten saya disimpan di ruang kerja?

Ruang kerja Anda menyimpan riwayat semua sesi pelatihan, dengan log, metrik, output, metadata silsilah, dan rekaman skrip Anda. Saat Anda melakukan tugas di Azure Pembelajaran Mesin, artefak dihasilkan. Metadata dan data mereka disimpan di ruang kerja dan pada sumber daya terkait.

Sumber daya terkait

Saat membuat ruang kerja baru, Anda diharuskan membawa sumber daya Azure lainnya untuk menyimpan data Anda. Jika tidak disediakan oleh Anda, Azure Machine Learning secara otomatis membuat sumber daya ini.

  • Akun Azure Storage. Menyimpan artefak pembelajaran mesin seperti log pekerjaan. Secara default, akun penyimpanan ini digunakan saat Anda mengunggah data ke ruang kerja. Buku catatan Jupyter yang digunakan dengan instans komputasi Azure Machine Learning juga disimpan di sini.

    Penting

    Anda tidak dapat menggunakan akun Azure Storage yang sudah ada jika:

    • Akun jenis BlobStorage
    • Akun premium (Premium_LRS dan Premium_GRS)
    • Akun dengan namespace hierarkis (digunakan dengan Azure Data Lake Storage Gen2).

    Anda dapat menggunakan penyimpanan premium atau namespace hierarkis sebagai penyimpanan tambahan dengan membuat datastore.

    Jangan aktifkan namespace hierarkis pada akun penyimpanan setelah meningkatkan ke tujuan umum v2.

    Jika Anda sudah memiliki akun penyimpanan v1 serbaguna, Anda dapat meningkatkannya ke v2 serbaguna setelah ruang kerja dibuat.

  • Azure Container Registry (ACR). Kontainer Docker yang dibuat disimpan saat Anda membangun lingkungan kustom melalui Azure Machine Learning. Menyebarkan model AutoML dan profil data memicu pembuatan lingkungan kustom.

    Ruang kerja dapat dibuat tanpa ACR sebagai dependensi jika Anda tidak memiliki kebutuhan untuk membangun kontainer docker kustom. Azure Pembelajaran Mesin dapat membaca dari registri kontainer eksternal.

    ACR secara otomatis disediakan saat Anda membuat gambar docker kustom. Gunakan kontrol akses berbasis peran Azure (Azure RBAC) untuk mencegah kontainer docker pelanggan dibuat.

    Penting

    Jika pengaturan langganan Anda memerlukan penambahan tag ke sumber daya di bawahnya, ACR yang dibuat oleh Azure Machine Learning gagal, karena kami tidak dapat mengatur tag ke ACR.

  • Azure Application Insights. Membantu Anda memantau dan mengumpulkan informasi diagnostik dari titik akhir inferensi Anda.

    Untuk informasi lebih lanjut, lihat Pemantauan titik akhir online.

  • Azure Key Vault. Menyimpan rahasia yang digunakan oleh target komputasi dan informasi sensitif lainnya yang dibutuhkan ruang kerja.

Membuat ruang kerja

Ada beberapa cara untuk membuat ruang kerja. Untuk memulai, gunakan salah satu opsi berikut:

Untuk mengotomatiskan pembuatan ruang kerja menggunakan pengaturan keamanan pilihan Anda:

  • Templat Azure Resource Manager / Bicep menyediakan sintaksis deklaratif untuk menyebarkan sumber daya Azure. Opsi alternatif adalah menggunakan Terraform. Lihat juga templat Bicep atau templat Terraform.

  • Gunakan Azure Machine Learning CLI v1 atau Azure Machine Learning SDK v1 untuk Python untuk pembuatan prototipe dan sebagai bagian dari alur kerja MLOps Anda.

    Penting

    Artikel ini memberikan informasi tentang penggunaan Azure Machine Learning SDK v1. SDK v1 tidak digunakan lagi per 31 Maret 2025. Dukungan untuk itu akan berakhir pada 30 Juni 2026. Anda dapat menginstal dan menggunakan SDK v1 hingga tanggal tersebut.

    Kami merekomendasikan agar Anda beralih ke SDK v2 sebelum 30 Juni 2026. Untuk informasi selengkapnya tentang SDK v2, lihat Apa itu Azure Machine Learning CLI dan Python SDK v2? dan referensi SDK v2.

    Penting

    Beberapa perintah CLI Azure dalam artikel ini menggunakan ekstensi azure-cli-ml, atau v1, untuk Azure Machine Learning. Dukungan untuk ekstensi v1 akan berakhir pada 30 September 2025. Anda dapat menginstal dan menggunakan ekstensi v1 hingga tanggal tersebut.

    Kami menyarankan agar Anda beralih ke ekstensi ml, atau v2 sebelum 30 September 2025. Untuk informasi selengkapnya tentang ekstensi v2, lihat Ekstensi Azure Pembelajaran Mesin CLI dan Python SDK v2.

  • Gunakan REST API langsung di lingkungan pembuatan skrip, untuk integrasi platform atau dalam alur kerja MLOps.

Alat untuk interaksi dan manajemen ruang kerja

Setelah ruang kerja disiapkan, Anda dapat berinteraksi dengan ruang kerja dengan cara berikut:

Tugas manajemen ruang kerja berikut ini tersedia di setiap antarmuka.

Tugas manajemen ruang kerja Portal Studio Python SDK Azure CLI (antarmuka baris perintah Azure) Kode VS
Membuat ruang kerja
Mengelola akses ruang kerja
Membuat dan mengelola sumber daya komputasi
Membuat instans komputasi

Peringatan

Memindahkan ruang kerja Azure Machine Learning Anda ke langganan lain, atau memindahkan langganan pemilik ke penyewa baru, tidak didukung. Melakukannya dapat menyebabkan kesalahan.

Sub-sumber daya

Saat Anda membuat kluster dan instans komputasi di Azure Machine Learning, sumber daya sub dibuat.

  • VM: menyediakan daya komputasi untuk instans komputasi dan kluster komputasi, yang Anda gunakan untuk menjalankan pekerjaan.
  • Load Balancer: penyeimbang beban jaringan dibuat untuk setiap instans komputasi dan kluster komputasi untuk mengelola lalu lintas bahkan saat instans/kluster komputasi dihentikan.
  • Virtual Network: membantu sumber daya Azure berkomunikasi satu sama lain, internet, dan jaringan lokal lainnya.
  • Bandwidth: merangkum semua transfer data keluar di seluruh wilayah.

Langkah berikutnya

Untuk mempelajari lebih lanjut tentang merencanakan ruang kerja untuk kebutuhan organisasi Anda, lihat Mengatur dan menyiapkan Azure Machine Learning.

Untuk mulai menggunakan Azure Machine Learning, lihat: