Compartir a través de


Agrega un recurso de punto de conexión para servir un modelo a una aplicación de Databricks

Agregue puntos de conexión de servicio de modelos como recursos de Databricks Apps para que la aplicación pueda consultar modelos de aprendizaje automático para la inferencia. Los puntos de conexión de servicio de modelos controlan las predicciones del modelo y proporcionan una interfaz coherente para acceder a los modelos implementados.

Añadir un recurso de punto de conexión para servir el modelo

Antes de agregar un modelo que sirve un punto de conexión como recurso, revise los requisitos previos del recurso de la aplicación.

  1. Al crear o editar una aplicación, vaya al paso Configurar .
  2. En la sección Recursos de la aplicación, haga clic en + Agregar recurso.
  3. Seleccione Servicio de punto de conexión como tipo de recurso.
  4. Elija un punto de conexión de servicio de modelo de los puntos de conexión disponibles en el área de trabajo.
  5. Seleccione el nivel de permiso adecuado para la aplicación:
    • Puede ver: Vea los metadatos del punto de conexión, incluidos los nombres de modelo, las versiones y la configuración de la carga de trabajo. No se pueden enviar solicitudes de inferencia.
    • Puede consultar: Enviar solicitudes de inferencia y ver metadatos. Úselo para la mayoría de las aplicaciones que necesitan predicciones de modelo.
    • Puede administrar: Control administrativo total, incluidos los permisos de visualización, edición, consulta, eliminación y administración.
  6. (Opcional) Especifique una clave de recurso personalizada, que es la forma en que hace referencia al punto de conexión de servicio del modelo en la configuración de la aplicación. La clave predeterminada es serving-endpoint.

Nota:

El punto de conexión de servicio del modelo debe estar en el estado READY para procesar solicitudes de inferencia desde su aplicación.

Variables de entorno

Al implementar una aplicación con un recurso de punto de conexión de servicio de modelo, Azure Databricks expone el nombre del punto de conexión de servicio a través de variables de entorno a las que puede hacer referencia mediante el campo valueFrom.

Por ejemplo:

SERVING_ENDPOINT=<your-serving-endpoint-name>

Para obtener más información, consulte Uso de variables de entorno para acceder a los recursos.

Eliminar un recurso de extremo de servicio de modelo

Al quitar un modelo que atiende el recurso de punto de conexión de una aplicación, la entidad de servicio de la aplicación pierde el acceso al punto de conexión. El propio punto de conexión de servicio del modelo permanece sin cambios y sigue estando disponible para otros usuarios y aplicaciones que tienen los permisos adecuados.

Procedimientos recomendados

Tenga en cuenta lo siguiente cuando trabaje con el modelo que atiende los recursos de punto de conexión:

  • Conceda permisos mínimos. Use Can view para el menor acceso o Can query para la mayoría de las aplicaciones que necesitan enviar solicitudes de inferencia, a menos que la aplicación necesite realizar tareas administrativas específicamente en el punto de conexión.
  • Evite las consultas de larga duración siempre que sea posible, ya que las solicitudes de inferencia pueden provocar un tiempo de espera agotado.
  • Compruebe el estado del punto de conexión antes de enviar solicitudes. Los puntos de conexión deben estar en READY estado para procesar consultas.
  • Considere la posibilidad de limitar la velocidad de las solicitudes de inferencia para evitar sobrecargar el punto de conexión, especialmente durante períodos de tráfico alto.