Migración a inferencia en tiempo real sin servidor

Importante

  • Esta documentación se ha retirado y es posible que no se actualice. Los productos, servicios o tecnologías mencionados en este contenido ya no se admiten.
  • Las instrucciones de este artículo son para la versión preliminar de Model Serving, anteriormente Serverless Real-Time inferencia, funcionalidad. Databricks recomienda migrar los flujos de trabajo de servicio del modelo a la funcionalidad disponible con carácter general. Consulte Servicio de modelos con Azure Databricks.

Importante

Esta característica está en versión preliminar pública.

En este artículo se muestra cómo habilitar la inferencia en tiempo real sin servidor en el área de trabajo y cómo cambiar los modelos del uso del Servicio de Modelos de MLflow heredado al servicio de modelos con inferencia en tiempo real sin servidor.

Para obtener información general sobre la inferencia en tiempo real sin servidor, consulte Servicio de implementación de modelos con inferencia en tiempo real del modelo sin servidor.

Requisitos

Cambios significativos

  • En inferencia de Real-Time sin servidor, el formato de la solicitud al punto de conexión y la respuesta del punto de conexión son ligeramente diferentes de la servicio de modelos de MLflow heredado. Consulte Puntuación de un punto de conexión de modelo para obtener más información sobre el nuevo protocolo de formato.
  • En Inferencia en tiempo real sin servidor, la dirección URL del punto de conexión incluye model-endpoint en lugar de model
  • La inferencia en tiempo real sin servidor incluye compatibilidad total para administrar recursos con flujos de trabajo de API y está listo para producción.

Habilitación de la inferencia en tiempo real sin servidor para el área de trabajo

Importante

La inferencia en tiempo real sin servidor debe estar habilitada para el área de trabajo. La primera vez que está habilitada para el área de trabajo, el administrador del área de trabajo debe leer y aceptar los términos y condiciones.

Para habilitar de la inferencia en tiempo real sin servidor para el área de trabajo:

  1. Inscripción en la versión preliminar.
    1. Póngase en contacto con el equipo de la cuenta de Azure Databricks para solicitar unirse a la versión preliminar pública de inferencia Real-Time sin servidor.
    2. Databricks le enviará un formulario de Google.
    3. Rellene el formulario y envíelo a Databricks. El formulario incluye información sobre el área de trabajo que se va a inscribir.
    4. Espere hasta que Databricks le notifique que el área de trabajo está inscrita en la versión preliminar.
  2. Como administrador del área de trabajo, vaya a la página de configuración del administrador.
  3. Seleccione Configuración del área de trabajo.
  4. Seleccione MLflow Serverless Real-Time Inference Enablement.

Deshabilitación del servicio de modelos de MLflow heredado en los modelos

Antes de habilitar la inferencia en tiempo real sin servidor para los modelos, debe deshabilitar el Servicio de Modelos de MLflow heredado en los modelos que se proporcionan actualmente.

Los pasos siguientes muestran cómo realizarlo mediante la UI.

  1. En la barra lateral del área de trabajo de Machine Learning, vaya a Modelos.
  2. Seleccione el modelo para el que desea deshabilitar legacy MLflow Model Serving.
  3. En la pestaña Servicio, seleccione Detener.
  4. Aparecerá un mensaje para confirmarlo. Seleccione Detener servicio.

Habilitación de la inferencia en tiempo real sin servidor en los modelos

Una vez habilitada la inferencia en tiempo real sin servidor en el área de trabajo, verá la siguiente pantalla en la pestaña Servicio de los modelos registrados. Para habilitar la Inferencia en tiempo real sin servidor para ese modelo, haga clic en el botón Habilitar inferencia en tiempo real sin servidor.

Panel Servicio

Importante

Si no ve ese botón, sino que, en su lugar, ve un botón Habilitar servicio, significa que está usando puntos de conexión para el Servicio de Modelos MLflow heredados, en lugar de puntos de conexión del modelo sin servidor. Póngase en contacto con un administrador para habilitar la característica en esta área de trabajo.

Recursos adicionales