Raccolta di dati da modelli in produzione
SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)
Questo articolo illustra la raccolta di dati da modelli distribuiti in endpoint online di Azure Machine Learning.
L'agente di raccolta dati di Azure Machine Learning fornisce la registrazione in tempo reale dei dati di input e output dei modelli distribuiti in endpoint online gestiti o endpoint online Kubernetes. Azure Machine Learning archivia i dati di inferenza registrati nell'archiviazione BLOB di Azure. Questi dati possono quindi essere usati senza problemi per il monitoraggio del modello, il debug o il controllo, in modo da garantire l'osservabilità delle prestazioni dei modelli distribuiti.
L'agente di raccolta dati fornisce:
- Registrazione dei dati di inferenza in una posizione centrale (Archiviazione BLOB di Azure)
- Supporto per endpoint online gestiti ed endpoint online Kubernetes
- Definizione a livello di distribuzione, consentendo il numero massimo di modifiche alla configurazione
- Supporto sia per il payload che per la registrazione personalizzata
Modalità di registrazione
L'agente di raccolta dati offre due modalità di registrazione: registrazione del payload e registrazione personalizzata. La registrazione del payload consente di raccogliere i dati del payload della richiesta HTTP e della risposta dai modelli distribuiti. Con la registrazione personalizzata, Azure Machine Learning offre Python SDK per la registrazione di dataframe Pandas direttamente dallo script di assegnazione dei punteggi. Usando Python SDK per la registrazione personalizzata, è possibile registrare i dati di input e output del modello, oltre ai dati prima, durante e dopo qualsiasi trasformazione dei dati (o pre-elaborazione).
Configurazione dell'agente di raccolta dati
L'agente di raccolta dati può essere configurato a livello di distribuzione e la configurazione viene specificata in fase di distribuzione. È possibile configurare la destinazione di archiviazione BLOB di Azure che riceverà i dati raccolti. È anche possibile configurare la frequenza di campionamento (compresa tra 0 e 100%) dei dati da raccogliere.
Limiti
L'agente di raccolta dati presenta le limitazioni seguenti:
- L'agente di raccolta dati supporta solo la registrazione per gli endpoint di Azure Machine Learning online (o in tempo reale) (gestiti o Kubernetes).
- L'SDK Python dell'agente di raccolta dati supporta solo la registrazione di dati tabulari tramite Pandas DataFrame.