Registri Pembelajaran Mesin untuk MLOps

Dalam artikel ini, Anda akan mempelajari cara menskalakan MLOps di seluruh lingkungan pengembangan, pengujian, dan produksi. Lingkungan Anda dapat bervariasi dari beberapa hingga banyak berdasarkan kompleksitas lingkungan TI Anda dan dipengaruhi oleh faktor-faktor seperti:

  • Kebijakan keamanan dan kepatuhan - Apakah lingkungan produksi perlu diisolasi dari lingkungan pengembangan dalam hal kontrol akses, arsitektur jaringan, paparan data, dll.?
  • Langganan - Apakah lingkungan pengembangan Anda berada dalam satu lingkungan langganan dan produksi dalam langganan yang berbeda? Seringkali langganan terpisah digunakan untuk mempertanyakan tujuan penagihan, anggaran, dan manajemen biaya.
  • Wilayah - Apakah Anda perlu menyebarkan ke wilayah Azure yang berbeda untuk mendukung persyaratan latensi dan redundansi?

Dalam skenario seperti itu, Anda mungkin menggunakan ruang kerja Azure Machine Learning yang berbeda untuk pengembangan, pengujian, dan produksi. Konfigurasi ini menyajikan tantangan berikut untuk pelatihan dan penyebaran model:

  • Anda perlu melatih model di ruang kerja pengembangan tetapi menyebarkannya titik akhir di ruang kerja produksi, mungkin di langganan atau wilayah Azure yang berbeda. Dalam hal ini, Anda harus dapat melacak kembali pekerjaan pelatihan. Misalnya, untuk menganalisis metrik, log, kode, lingkungan, dan data yang digunakan untuk melatih model jika Anda mengalami masalah akurasi atau performa dengan penyebaran produksi.
  • Anda perlu mengembangkan alur pelatihan dengan data pengujian atau data anonim di ruang kerja pengembangan tetapi melatih kembali model dengan data produksi di ruang kerja produksi. Dalam hal ini, Anda mungkin perlu membandingkan metrik pelatihan pada data sampel vs produksi untuk memastikan pengoptimalan pelatihan berperforma baik dengan data aktual.

MLOps lintas ruang kerja dengan registri

Registri, seperti repositori Git, memisahkan aset ML dari ruang kerja dan menghostingnya di lokasi pusat, membuatnya tersedia untuk semua ruang kerja di organisasi Anda.

Jika Anda ingin mempromosikan model di seluruh lingkungan (dev, test, prod), mulailah dengan mengembangkan model secara berulang dalam dev. Ketika Anda memiliki model kandidat yang baik, Anda dapat menerbitkannya ke registri. Anda kemudian dapat menyebarkan model dari registri ke titik akhir di ruang kerja yang berbeda.

Tip

Jika Anda sudah memiliki model yang terdaftar di ruang kerja, Anda dapat mempromosikannya ke registri. Anda juga dapat mendaftarkan model langsung di registri dari output pekerjaan pelatihan.

Jika Anda ingin mengembangkan alur di satu ruang kerja dan kemudian menjalankannya di ruang kerja lain, mulailah dengan mendaftarkan komponen dan lingkungan yang membentuk blok penyusun alur. Saat Anda mengirimkan pekerjaan alur, ruang kerja yang dijalankannya dipilih oleh data komputasi dan pelatihan, yang unik untuk setiap ruang kerja.

Diagram berikut mengilustrasikan promosi alur antara ruang kerja eksplorasi dan dev, lalu promosi model antara pengembangan, pengujian, dan produksi.

Diagram alur dan penggunaan model di seluruh lingkungan.

Langkah berikutnya