Mengidentifikasi aset Azure Pembelajaran Mesin

Selesai

Sebagai ilmuwan data, Anda sebagian besar akan bekerja dengan aset di ruang kerja Azure Pembelajaran Mesin. Aset dibuat dan digunakan pada berbagai tahap proyek dan meliputi:

  • Model
  • Lingkungan
  • Data
  • Komponen

Membuat dan mengelola model

Produk akhir pelatihan model adalah model itu sendiri. Anda dapat melatih model pembelajaran mesin dengan berbagai kerangka kerja, seperti Scikit-learn atau PyTorch. Cara umum untuk menyimpan model tersebut adalah dengan mengemas model sebagai file acar Python (.pkl ekstensi).

Atau, Anda dapat menggunakan MLflow platform sumber terbuka untuk menyimpan model Anda dalam format MLModel.

Format apa pun yang Anda pilih, file biner akan mewakili model dan metadata yang sesuai. Untuk mempertahankan file tersebut, Anda dapat membuat atau mendaftarkan model di ruang kerja.

Saat membuat model di ruang kerja, Anda akan menentukan nama dan versi. Sangat berguna ketika Anda menyebarkan model terdaftar, penerapan versi memungkinkan Anda melacak model tertentu yang ingin Anda gunakan.

Membuat dan mengelola lingkungan

Saat Anda bekerja dengan komputasi cloud, penting untuk memastikan bahwa kode Anda berjalan pada komputasi apa pun yang tersedia untuk Anda. Apakah Anda ingin menjalankan skrip pada instans komputasi, atau kluster komputasi, kode harus berhasil dijalankan.

Bayangkan bekerja di Python atau R, menggunakan kerangka kerja sumber terbuka untuk melatih model, di perangkat lokal Anda. Jika Anda ingin menggunakan pustaka seperti Scikit-learn atau PyTorch, Anda harus menginstalnya di perangkat Anda.

Demikian pula, ketika Anda menulis kode yang menggunakan kerangka kerja atau pustaka apa pun, Anda harus memastikan komponen yang diperlukan diinstal pada komputasi yang akan menjalankan kode. Untuk mencantumkan semua persyaratan yang diperlukan, Anda dapat membuat lingkungan. Saat membuat lingkungan, Anda harus menentukan nama dan versi.

Lingkungan menentukan paket perangkat lunak, variabel lingkungan, dan pengaturan perangkat lunak untuk menjalankan skrip. Lingkungan disimpan sebagai gambar di Azure Container Registry yang dibuat dengan ruang kerja saat digunakan untuk pertama kalinya.

Setiap kali Anda ingin menjalankan skrip, Anda dapat menentukan lingkungan yang perlu digunakan oleh target komputasi. Lingkungan akan menginstal semua persyaratan yang diperlukan pada komputasi sebelum menjalankan skrip, membuat kode Anda kuat dan dapat digunakan kembali di seluruh target komputasi.

Membuat dan mengelola data

Sedangkan datastore berisi informasi koneksi ke layanan penyimpanan data Azure, aset data merujuk ke file atau folder tertentu.

Anda dapat menggunakan aset data untuk mengakses data dengan mudah setiap saat, tanpa harus memberikan autentikasi setiap kali Anda ingin mengaksesnya.

Saat membuat aset data di ruang kerja, Anda akan menentukan jalur untuk menunjuk ke file atau folder, serta nama dan versi.

Membuat dan mengelola komponen

Untuk melatih model pembelajaran mesin, Anda akan menulis kode. Di seluruh proyek, mungkin ada kode yang dapat Anda gunakan kembali. Alih-alih menulis kode dari awal, Anda harus menggunakan kembali cuplikan kode dari proyek lain.

Untuk mempermudah berbagi kode, Anda dapat membuat komponen di ruang kerja. Untuk membuat komponen, Anda harus menentukan nama, versi, kode, dan lingkungan yang diperlukan untuk menjalankan kode.

Anda dapat menggunakan komponen saat membuat alur. Oleh karena itu, komponen sering mewakili langkah dalam alur, misalnya untuk menormalkan data, untuk melatih model regresi, atau untuk menguji model terlatih pada himpunan data validasi.