Compartir a través de


Modelado que atiende la observabilidad con Genie Code

Importante

Esta característica está en versión preliminar pública.

En este artículo se describe cómo Genie Code puede ayudarle a diagnosticar problemas, analizar el rendimiento y obtener orientación para los puntos de servicio de los modelos.

Nota:

Actualmente, Genie Code solo admite puntos de servicio de conexión para modelos personalizados.

¿Con qué puede ayudar Genie Code?

Cuando se usa Genie Code en una página de punto de conexión de servicio de modelos, se convierte en un complemento de observabilidad para el servicio de modelos. Puede analizar el estado del punto de conexión, diagnosticar errores de implementación, investigar problemas de latencia y proporcionar instrucciones de procedimientos recomendados, todo desde el panel Código de Genie.

Panel de Genie Code en una página de endpoint

Genie Code es un asesor de solo lectura en este modo. Puede inspeccionar los puntos de conexión y proporcionar recomendaciones, pero no puede modificar configuraciones ni implementaciones. Tiene instrucciones claras, paso a paso y vínculos a la documentación para que pueda realizar cambios usted mismo.

Empieza ahora

Primeros pasos:

  1. Vaya a una página de servicio de implementación de modelos.
  2. Haga clic en el icono Asistente para bases de datos. Para abrir el panel Genie Code.
  3. En la esquina inferior derecha, seleccione Agente. Esto activa el modo agente de Genie Code.
  4. Escriba un mensaje que describa lo que necesita ayuda. Por ejemplo, "Comprobar el estado de este punto de conexión" o "¿Por qué mi latencia es tan alta?"

Capabilities

Comprobaciones de estado y diagnósticos

Genie Code puede analizar el estado y la configuración del punto de conexión para identificar posibles problemas:

  • Compruebe el estado del punto de conexión y los estados de implementación.
  • Revise la configuración con las prácticas recomendadas.
  • Evaluar el escalado y el uso de recursos.

Solución de problemas y análisis

Genie Code puede ayudar a resolver problemas con los puntos de conexión:

  • Diagnostique errores de implementación mediante registros de compilación, eventos y estado de punto de conexión.
  • Investigue problemas de alta latencia o tiempo de espera mediante métricas, eventos e datos de tabla de inferencia.
  • Analice los patrones de error de los registros de servicio y las tablas de inferencia.
  • Identificar configuraciones incorrectas o restricciones de recursos.
  • Compare las configuraciones actuales y pendientes con la evaluación de riesgos.

Instrucciones y procedimientos recomendados

Genie Code tiene recomendaciones basadas en la configuración del punto de conexión:

  • Se recomiendan configuraciones de escalado óptimas para cargas de trabajo de producción y desarrollo.
  • Explicar los estados de punto de conexión y las transiciones.
  • Guíarte en la configuración de monitoreo y observabilidad.
  • Busque la documentación de Azure Databricks y proporcione vínculos a artículos pertinentes.

Casos de uso

Pruebe estas indicaciones para empezar:

  • Comprobaciones de estado:
    • "Compruebe el estado de este punto de conexión".
    • "¿Mi punto de conexión está configurado correctamente?"
    • Revise la configuración de escalamiento de mi endpoint.
  • Errores de implementación:
    • /diagnosticar o "¿Por qué falló mi implementación?"
    • "Ayudarme a corregir errores de implementación".
    • "Mi punto de conexión está bloqueado en un estado pendiente".
  • Depuración de latencia:
    • "¿Por qué mi latencia es tan alta?"
    • "Analice el pico de latencia de esta mañana".
    • "Muéstrame las métricas de rendimiento de las últimas 24 horas".
  • Revisión de configuración:
    • "¿Qué ha cambiado en mi configuración pendiente?"
    • ¿Es adecuada la configuración de simultaneidad que tengo en producción?
    • "Muéstrame mi configuración de la tabla de inferencia".
  • Historial de solicitudes:
    • "Mostrar las solicitudes recientes a este punto de conexión."
    • ¿Qué errores están experimentando mis usuarios?
    • "Analice los patrones de error de la última semana".

Información adicional