Bagikan melalui


Pembelajaran Mesin registri untuk MLOps

Artikel ini menjelaskan bagaimana registri Azure Pembelajaran Mesin memisahkan aset pembelajaran mesin dari ruang kerja, memungkinkan Anda menggunakan MLOps di seluruh lingkungan pengembangan, pengujian, dan produksi. Lingkungan Anda dapat bervariasi berdasarkan kompleksitas sistem IT Anda. Faktor-faktor berikut memengaruhi jumlah dan jenis lingkungan yang Anda butuhkan:

  • Kebijakan keamanan dan kepatuhan. Lingkungan produksi mungkin perlu diisolasi dari lingkungan pengembangan dalam hal kontrol akses, arsitektur jaringan, dan paparan data.
  • Langganan. Lingkungan pengembangan dan lingkungan produksi sering menggunakan langganan terpisah untuk tujuan penagihan, anggaran, dan manajemen biaya.
  • Wilayah. Anda mungkin perlu menyebarkan ke wilayah Azure yang berbeda untuk mendukung persyaratan latensi dan redundansi.

Dalam skenario sebelumnya, Anda mungkin menggunakan ruang kerja Azure Pembelajaran Mesin yang berbeda untuk pengembangan, pengujian, dan produksi. Konfigurasi ini menyajikan potensi tantangan berikut untuk pelatihan dan penyebaran model:

  • Anda mungkin perlu melatih model di ruang kerja pengembangan, tetapi menyebarkannya ke titik akhir di ruang kerja produksi, mungkin di langganan atau wilayah Azure yang berbeda. Dalam hal ini, Anda harus dapat melacak kembali pekerjaan pelatihan. Misalnya, jika Anda mengalami masalah akurasi atau performa dengan penyebaran produksi, Anda perlu menganalisis metrik, log, kode, lingkungan, dan data yang Anda gunakan untuk melatih model.

  • Anda mungkin perlu mengembangkan alur pelatihan dengan data pengujian atau data anonim di ruang kerja pengembangan, tetapi melatih kembali model dengan data produksi di ruang kerja produksi. Dalam hal ini, Anda mungkin perlu membandingkan metrik pelatihan pada sampel vs. data produksi untuk memastikan pengoptimalan pelatihan berfungsi dengan baik dengan data aktual.

MLOps lintas ruang kerja dengan registri

Registri, seperti repositori Git, memisahkan aset pembelajaran mesin dari ruang kerja dan menghosting aset di lokasi pusat, membuatnya tersedia untuk semua ruang kerja di organisasi Anda.

Untuk mempromosikan model di seluruh lingkungan pengembangan, pengujian, dan produksi, Anda dapat mulai dengan mengembangkan model secara berulang di lingkungan pengembangan. Ketika Anda memiliki model kandidat yang baik, Anda dapat menerbitkannya ke registri. Anda kemudian dapat menyebarkan model dari registri ke titik akhir di ruang kerja yang berbeda.

Tip

Jika Anda sudah memiliki model yang terdaftar di ruang kerja, Anda dapat mempromosikan model ke registri. Anda juga dapat mendaftarkan model langsung di registri dari output pekerjaan pelatihan.

Untuk mengembangkan alur di satu ruang kerja lalu menjalankannya di ruang kerja lain, mulailah dengan mendaftarkan komponen dan lingkungan yang membentuk blok penyusun alur. Saat Anda mengirimkan pekerjaan alur, komputasi dan data pelatihan, yang unik untuk setiap ruang kerja, tentukan ruang kerja yang akan dijalankan.

Diagram berikut menunjukkan promosi alur pelatihan antara ruang kerja eksplorasi dan pengembangan, lalu promosi model terlatih untuk pengujian dan produksi.

Diagram alur dan penggunaan model di seluruh lingkungan.

Langkah berikutnya