Bagikan melalui


Apa itu ruang kerja Azure Machine Learning?

Ruang kerja adalah tempat untuk berkolaborasi dengan kolega untuk membuat artefak pembelajaran mesin dan pekerjaan terkait grup. Misalnya, eksperimen, pekerjaan, himpunan data, model, komponen, dan titik akhir inferensi. Artikel ini menjelaskan ruang kerja, cara mengelola akses ke ruang kerja, dan cara menggunakannya untuk mengatur pekerjaan Anda.

Siap memulai? Buat ruang kerja.

Tugas yang dilakukan dalam ruang kerja

Untuk tim pembelajaran mesin, ruang kerja adalah tempat untuk mengatur pekerjaan mereka. Berikut adalah beberapa tugas yang bisa Anda mulai dari ruang kerja:

  • Membuat pekerjaan - Pekerjaan adalah pelatihan yang Anda gunakan untuk membangun model Anda. Anda dapat mengelompokkan pekerjaan ke dalam eksperimen untuk membandingkan metrik.
  • Alur penulis - Alur adalah alur kerja yang dapat digunakan kembali untuk melatih dan melatih kembali model Anda.
  • Mendaftarkan aset data - Aset data membantu manajemen data yang Anda gunakan untuk pelatihan model dan pembuatan alur.
  • Daftarkan model - Setelah Anda memiliki model yang ingin Anda sebarkan, Anda membuat model terdaftar.
  • Buat titik akhir online - Gunakan model terdaftar dan skrip penilaian untuk membuat titik akhir online.
  • Menyebarkan model - Gunakan model terdaftar dan skrip penilaian untuk menyebarkan model.

Selain mengelompokkan hasil pembelajaran mesin Anda, ruang kerja juga menghosting konfigurasi sumber daya:

  • Target komputasi digunakan untuk menjalankan eksperimen Anda.
  • Datastore menentukan bagaimana Anda dan orang lain dapat terhubung ke sumber data saat menggunakan aset data.
  • Pengaturan keamanan - Jaringan, kontrol identitas dan akses, dan pengaturan enkripsi.

Menata ruang kerja

Untuk prospek dan administrator tim pembelajaran mesin, ruang kerja berfungsi sebagai kontainer untuk manajemen akses, manajemen biaya, dan isolasi data. Berikut adalah beberapa tips untuk mengatur ruang kerja:

  • Gunakan peran pengguna untuk manajemen izin di ruang kerja antar pengguna. Misalnya ilmuwan data, insinyur pembelajaran mesin, atau admin.
  • Menetapkan akses ke grup pengguna: Dengan menggunakan grup pengguna Microsoft Entra, Anda tidak perlu menambahkan pengguna individual ke setiap ruang kerja, dan ke sumber daya lain yang memerlukan akses ke grup pengguna yang sama.
  • Membuat ruang kerja per proyek: Meskipun ruang kerja dapat digunakan untuk beberapa proyek, membatasinya ke satu proyek per ruang kerja memungkinkan pelaporan biaya terakumulasi ke tingkat proyek. Ini juga memungkinkan Anda mengelola konfigurasi seperti penyimpanan data dalam cakupan setiap proyek.
  • Berbagi sumber daya Azure: Ruang kerja mengharuskan Anda membuat beberapa sumber daya terkait. Bagikan sumber daya ini antar ruang kerja untuk menyimpan langkah-langkah penyiapan berulang.
  • Aktifkan layanan mandiri: Buat terlebih dahulu dan amankan sumber daya terkait sebagai admin TI, dan gunakan peran pengguna untuk memungkinkan ilmuwan data membuat ruang kerja sendiri.
  • Berbagi aset: Anda dapat berbagi aset antar ruang kerja menggunakan registri Azure Pembelajaran Mesin.

Bagaimana konten saya disimpan di ruang kerja?

Ruang kerja Anda menyimpan riwayat semua eksekusi pelatihan, dengan log, metrik, output, metadata silsilah data, dan rekam jepret skrip Anda. Saat Anda melakukan tugas di Azure Pembelajaran Mesin, artefak dihasilkan. Metadata dan data mereka disimpan di ruang kerja dan pada sumber daya terkait.

Sumber daya terkait

Saat membuat ruang kerja baru, Anda diharuskan membawa sumber daya Azure lainnya untuk menyimpan data Anda. Jika tidak disediakan oleh Anda, sumber daya ini secara otomatis dibuat oleh Azure Pembelajaran Mesin.

  • Akun Azure Storage. Menyimpan artefak pembelajaran mesin seperti log pekerjaan. Secara default, akun penyimpanan ini digunakan saat Anda mengunggah data ke ruang kerja. Buku catatan Jupyter yang digunakan dengan instans komputasi Azure Machine Learning juga disimpan di sini.

    Penting

    Anda tidak dapat menggunakan akun Azure Storage yang sudah ada jika:

    • Akun jenis BlobStorage
    • Akun premium (Premium_LRS dan Premium_GRS)
    • Akun dengan namespace hierarkis (digunakan dengan Azure Data Lake Storage Gen2).

    Anda dapat menggunakan penyimpanan premium atau namespace hierarkis sebagai penyimpanan tambahan dengan membuat datastore.

    Jangan aktifkan ruang nama hierarkis pada akun penyimpanan setelah memutakhirkan ke v2 tujuan umum.

    Jika Anda membawa akun penyimpanan v1 tujuan umum yang ada, Anda dapat meningkatkannya ke tujuan umum v2 setelah ruang kerja dibuat.

  • Azure Container Registry (ACR). Menyimpan kontainer docker yang dibuat, saat Anda membangun lingkungan kustom melalui Azure Pembelajaran Mesin. Menyebarkan model AutoML dan profil data juga akan memicu pembuatan lingkungan kustom.

    Ruang kerja dapat dibuat tanpa ACR sebagai dependensi jika Anda tidak memiliki kebutuhan untuk membangun kontainer docker kustom. Azure Pembelajaran Mesin dapat membaca dari registri kontainer eksternal.

    ACR akan secara otomatis disediakan saat Anda membuat gambar docker kustom. Gunakan kontrol akses berbasis peran Azure (Azure RBAC) untuk mencegah kontainer docker pelanggan dibuat.

    Penting

    Jika pengaturan langganan Anda memerlukan penambahan tag ke sumber daya di bawahnya, ACR yang dibuat oleh Azure Pembelajaran Mesin akan gagal, karena kami tidak dapat mengatur tag ke ACR.

  • Azure Application Insights. Membantu Anda memantau dan mengumpulkan informasi diagnostik dari titik akhir inferensi Anda.

    Untuk informasi lebih lanjut, lihat Memantau titik akhir online.

  • Azure Key Vault. Menyimpan rahasia yang digunakan oleh target komputasi dan informasi sensitif lainnya yang dibutuhkan ruang kerja.

Membuat ruang kerja

Ada beberapa cara untuk membuat ruang kerja. Untuk memulai, gunakan salah satu opsi berikut:

Untuk mengotomatiskan pembuatan ruang kerja menggunakan pengaturan keamanan pilihan Anda:

  • Templat Azure Resource Manager / Bicep menyediakan sintaksis deklaratif untuk menyebarkan sumber daya Azure. Opsi alternatif adalah menggunakan Terraform. Lihat juga templat Bicep atau templat Terraform.
  • Gunakan REST API langsung di lingkungan pembuatan skrip, untuk integrasi platform atau dalam alur kerja MLOps.

Alat untuk interaksi dan manajemen ruang kerja

Setelah ruang kerja disiapkan, Anda dapat berinteraksi dengan ruang kerja dengan cara berikut:

Tugas manajemen ruang kerja berikut ini tersedia di setiap antarmuka.

Tugas manajemen ruang kerja Portal Studio Python SDK Azure CLI Kode VS
Membuat ruang kerja
Mengelola akses ruang kerja
Membuat dan mengelola sumber daya komputasi
Membuat instans komputasi

Peringatan

Memindahkan ruang kerja Azure Machine Learning Anda ke langganan lain, atau memindahkan langganan yang dimiliki ke penyewa baru, tidak didukung. Melakukannya dapat menyebabkan kesalahan.

Sub sumber daya

Saat Anda membuat kluster komputasi dan instans komputasi di Azure Pembelajaran Mesin, sub sumber daya dibuat.

  • VM: menyediakan daya komputasi untuk instans komputasi dan kluster komputasi, yang Anda gunakan untuk menjalankan pekerjaan.
  • Load Balancer: penyeimbang beban jaringan dibuat untuk setiap instans komputasi dan kluster komputasi untuk mengelola lalu lintas bahkan saat instans/kluster komputasi dihentikan.
  • Virtual Network: membantu sumber daya Azure berkomunikasi satu sama lain, internet, dan jaringan lokal lainnya.
  • Bandwidth: merangkum semua transfer data keluar di seluruh wilayah.

Langkah berikutnya

Untuk mempelajari lebih lanjut tentang merencanakan ruang kerja untuk kebutuhan organisasi Anda, lihat Mengatur dan menyiapkan Azure Machine Learning.

Untuk mulai menggunakan Azure Machine Learning, lihat: