Recopilación de datos de modelos en producción

Artículo
04/16/2024

SE APLICA A:Extensión ML de la CLI de Azure v2 (actual)SDK de Python azure-ai-ml v2 (actual)

En este artículo, obtendrá información sobre la recopilación de datos de los modelos que están implementados en puntos de conexión en línea de Azure Machine Learning.

El recopilador de datos de Azure Machine Learning proporciona un registro en tiempo real de los datos de entrada y salida de los modelos que están implementados en puntos de conexión en línea administrados o puntos de conexión en línea de Kubernetes. Azure Machine Learning almacena los datos de inferencia registrados en Azure Blob Storage. Estos datos se pueden usar sin problemas para la supervisión, depuración o auditoría del modelo, lo que proporciona observabilidad del rendimiento de los modelos implementados.

El recopilador de datos proporciona:

Registro de los datos de inferencia en una ubicación central (Azure Blob Storage)
Compatibilidad con puntos de conexión en línea administrados y puntos de conexión en línea de Kubernetes
Definición en el nivel de implementación, lo que permite los cambios máximos en su configuración
Compatibilidad con el registro personalizado y de la carga

Modos de registro

El recopilador de datos proporciona dos modos de registro: registro de la carga y registro personalizado. El registro de la carga permite recopilar los datos de la carga de la respuesta y la solicitud HTTP de los modelos implementados. Con el registro personalizado, Azure Machine Learning proporciona un SDK de Python para registrar los DataFrames de Pandas directamente desde el script de puntuación. Con el SDK de Python de registro personalizado, puede registrar los datos de entrada y salida del modelo, además de los datos antes, durante y después de cualquier transformación de datos (o preprocesamiento).

Configuración del recopilador de datos

El recopilador de datos se puede configurar en el nivel de implementación y la configuración se especifica en el momento de la implementación. Puede configurar el destino de Azure Blob Storage que recibirá los datos recopilados. También puede configurar la tasa de muestreo (que oscila entre 0 y 100 %) de los datos que se van a recopilar.

Limitaciones

El recopilador de datos tiene las siguientes limitaciones:

El recopilador de datos solo admite el registro de puntos de conexión de Azure Machine Learning en línea (o en tiempo real), tanto administrados como de Kubernetes.
El SDK de Python del recopilador de datos solo admite el registro de datos tabulares mediante DataFrames de pandas.

Share via

Recopilación de datos de modelos en producción

Modos de registro

Configuración del recopilador de datos

Limitaciones

Pasos siguientes

Recursos adicionales