Pengumpulan data dari model dalam produksi
BERLAKU UNTUK:Ekstensi ml Azure CLI v2 (saat ini)Python SDK azure-ai-ml v2 (saat ini)
Dalam artikel ini, Anda mempelajari tentang pengumpulan data dari model yang disebarkan ke titik akhir online Azure Pembelajaran Mesin.
Pengumpul Azure Pembelajaran Mesin Data menyediakan pengelogan data input dan output secara real time dari model yang disebarkan ke titik akhir online terkelola atau titik akhir online Kubernetes. Azure Pembelajaran Mesin menyimpan data inferensi yang dicatat di penyimpanan blob Azure. Data ini kemudian dapat digunakan dengan mulus untuk pemantauan model, penelusuran kesalahan, atau audit, sehingga, memberikan pengamatan ke dalam performa model yang Anda sebarkan.
Pengumpul data menyediakan:
- Pengelogan data inferensi ke lokasi pusat (Azure Blob Storage)
- Dukungan untuk titik akhir online terkelola dan titik akhir online Kubernetes
- Definisi pada tingkat penyebaran, memungkinkan perubahan maksimum pada konfigurasinya
- Dukungan untuk payload dan pengelogan kustom
Mode pengelogan
Pengumpul data menyediakan dua mode pengelogan: pencatatan payload dan pengelogan kustom. Pengelogan payload memungkinkan Anda mengumpulkan permintaan HTTP dan menanggapi data payload dari model yang Anda sebarkan. Dengan pengelogan kustom, Azure Pembelajaran Mesin memberi Anda Python SDK untuk pengelogan panda DataFrames langsung dari skrip penilaian Anda. Dengan menggunakan pengelogan kustom Python SDK, Anda dapat mencatat data input dan output model, selain data sebelum, selama, dan setelah transformasi data apa pun (atau pra-pemrosesan).
Konfigurasi pengumpul data
Pengumpul data dapat dikonfigurasi pada tingkat penyebaran, dan konfigurasi ditentukan pada waktu penyebaran. Anda dapat mengonfigurasi tujuan penyimpanan Azure Blob yang akan menerima data yang dikumpulkan. Anda juga dapat mengonfigurasi laju pengambilan sampel (mulai dari 0 – 100%) data yang akan dikumpulkan.
Batasan
Pengumpul data memiliki batasan berikut:
- Pengumpul data hanya mendukung pengelogan untuk titik akhir Azure Pembelajaran Mesin online (atau real-time) (Terkelola atau Kubernetes).
- Pengumpul data Python SDK hanya mendukung pengelogan data tabular melalui pandas DataFrames.