Descripción y creación de puntos de conexión por lotes

Completado

Para obtener un modelo para generar predicciones por lotes, puede implementar el modelo en un punto de conexión por lotes.

Aprenderá a usar puntos de conexión por lotes para la puntuación por lotes asincrónica.

Predicciones por lotes

Para obtener predicciones por lotes, puede implementar un modelo en un endpoint. Un punto de conexión es un punto de conexión HTTPS al que puede llamar para desencadenar una tarea de evaluación por lotes. La ventaja de este punto de conexión es que puede desencadenar el trabajo de puntuación por lotes desde otro servicio, como Azure Synapse Analytics o Azure Databricks. Un punto de conexión por lotes permite integrar la puntuación por lotes con una canalización de ingesta y transformación de datos existente.

Cada vez que se invoca el punto de conexión, se envía un trabajo de puntuación por lotes al área de trabajo de Azure Machine Learning. El trabajo normalmente usa un clúster de computación para puntuar varias entradas. Los resultados se pueden almacenar en un almacén de datos, conectado al área de trabajo de Azure Machine Learning.

Crear un punto de conexión por lotes

Para implementar un modelo en un endpoint de procesamiento por lotes, primero deberá crear dicho endpoint.

Para crear un punto de conexión por lotes, usará la clase BatchEndpoint. Los nombres de punto de conexión de Batch deben ser únicos dentro de una región de Azure.

Para crear un punto de conexión, use el siguiente comando:

# create a batch endpoint
endpoint = BatchEndpoint(
    name="endpoint-example",
    description="A batch endpoint",
)

ml_client.batch_endpoints.begin_create_or_update(endpoint)

Sugerencia

Explore la documentación de referencia para crear un punto de conexión por lotes con el SDK de Python v2.

Implementación de un modelo en un punto de conexión por lotes

Puede implementar varios modelos en un punto de conexión por lotes. Siempre que llame al punto de conexión por lotes, que desencadena un trabajo de puntuación por lotes, se usará la implementación predeterminada, a menos que se especifique lo contrario.

Captura de pantalla de la página de detalles de un punto de conexión por lotes, en la que se muestra la implementación predeterminada.

Uso de clústeres de cálculo para implementaciones por lotes

El recurso ideal para las implementaciones por lotes es el clúster de computación de Azure Machine Learning. Si desea que el trabajo de puntuación por lotes procese los nuevos datos en lotes paralelos, debe aprovisionar un clúster de proceso con más de una instancia máxima.

Para crear un clúster de proceso, puede usar la AMLCompute clase .

from azure.ai.ml.entities import AmlCompute

cpu_cluster = AmlCompute(
    name="aml-cluster",
    type="amlcompute",
    size="STANDARD_DS11_V2",
    min_instances=0,
    max_instances=4,
    idle_time_before_scale_down=120,
    tier="Dedicated",
)

cpu_cluster = ml_client.compute.begin_create_or_update(cpu_cluster)