Compartir a través de


Métricas disponibles para la supervisión de la versión preliminar de RAG de Edge, habilitada por Azure Arc

En la tabla siguiente se enumeran las métricas disponibles para Edge RAG.

Nombre de la métrica Descripción
Recuento de errores de API Recuento de solicitudes de API con error
Recuento de solicitudes de API Número total de solicitudes de API
Duración de la solicitud de API en segundos Histograma de duraciones de solicitud
Recuento de éxitos de API Recuento de solicitudes de API exitosas
Recuento de solicitudes de API de evaluación Número total de solicitudes de API de evaluación
Recuento omitido con errores Contador de archivos con errores omitidos (ingesta)
Tasa de ingesta de archivos Total de archivos ingeridos por trabajo
Recuento de solicitudes de API del modelo de búsqueda híbrida Número total de solicitudes de API del modelo de búsqueda híbrida
Comentarios de respuesta de inferencia Comentarios de la respuesta de inferencia
Recuento de solicitudes de API de inferencia Número total de solicitudes de API de inferencia
Tiempo de ingesta Tiempo total de ingesta en minutos
Recuento de solicitudes de API de ingesta Número total de solicitudes de API de ingesta
Tiempo de preprocesamiento de entrada (milisegundos) Tiempo de preprocesamiento de entrada en milisegundos
Número de evaluaciones Número de evaluaciones
Número de trabajos Número de trabajos
Llamar al tiempo total de LLM en segundos Tiempo total en segundos para invocar la función "call_llm"
Inserción de tiempo total de generación en segundos Tiempo total necesario para generar incrustaciones a partir del modelo local
Tiempo total de generación de inserción de búsqueda híbrida en segundos Tiempo total necesario para generar incrustaciones de búsqueda híbrida a partir del modelo local
Reranking Generation Total Time in Seconds Tiempo total necesario para generar la reranking a partir del modelo local
Obtener resumen del historial de chat tiempo total en milisegundos Tiempo total en milisegundos para invocar la función "get_chat_history_summary"
Obtener tiempo total de carga de LLM en milisegundos Tiempo total en milisegundos para invocar la función "get_llm_payload"
Obtener tiempo total de búsqueda híbrida en milisegundos Tiempo total de búsqueda híbrida en milisegundos
Tiempo total de inferencia en segundos Tiempo total de inferencia en segundos
Tiempo total de búsqueda de fragmentos en milisegundos Tiempo total en milisegundos para invocar la función "search_chunks"
Tiempo total de búsqueda en milisegundos Tiempo total necesario para la búsqueda
Tiempo total de búsqueda de similitud en milisegundos Tiempo total necesario para buscar documentos similares
Recuento de solicitudes de API de base de datos vectoriales Número total de solicitudes de API a Vector DB

Supervisión de RAG perimetral