Métricas disponibles para la supervisión de la versión preliminar de RAG de Edge, habilitada por Azure Arc

2025-05-19

En la tabla siguiente se enumeran las métricas disponibles para Edge RAG.

Nombre de la métrica	Descripción
Recuento de errores de API	Recuento de solicitudes de API con error
Recuento de solicitudes de API	Número total de solicitudes de API
Duración de la solicitud de API en segundos	Histograma de duraciones de solicitud
Recuento de éxitos de API	Recuento de solicitudes de API exitosas
Recuento de solicitudes de API de evaluación	Número total de solicitudes de API de evaluación
Recuento omitido con errores	Contador de archivos con errores omitidos (ingesta)
Tasa de ingesta de archivos	Total de archivos ingeridos por trabajo
Recuento de solicitudes de API del modelo de búsqueda híbrida	Número total de solicitudes de API del modelo de búsqueda híbrida
Comentarios de respuesta de inferencia	Comentarios de la respuesta de inferencia
Recuento de solicitudes de API de inferencia	Número total de solicitudes de API de inferencia
Tiempo de ingesta	Tiempo total de ingesta en minutos
Recuento de solicitudes de API de ingesta	Número total de solicitudes de API de ingesta
Tiempo de preprocesamiento de entrada (milisegundos)	Tiempo de preprocesamiento de entrada en milisegundos
Número de evaluaciones	Número de evaluaciones
Número de trabajos	Número de trabajos
Llamar al tiempo total de LLM en segundos	Tiempo total en segundos para invocar la función "call_llm"
Inserción de tiempo total de generación en segundos	Tiempo total necesario para generar incrustaciones a partir del modelo local
Tiempo total de generación de inserción de búsqueda híbrida en segundos	Tiempo total necesario para generar incrustaciones de búsqueda híbrida a partir del modelo local
Reranking Generation Total Time in Seconds	Tiempo total necesario para generar la reranking a partir del modelo local
Obtener resumen del historial de chat tiempo total en milisegundos	Tiempo total en milisegundos para invocar la función "get_chat_history_summary"
Obtener tiempo total de carga de LLM en milisegundos	Tiempo total en milisegundos para invocar la función "get_llm_payload"
Obtener tiempo total de búsqueda híbrida en milisegundos	Tiempo total de búsqueda híbrida en milisegundos
Tiempo total de inferencia en segundos	Tiempo total de inferencia en segundos
Tiempo total de búsqueda de fragmentos en milisegundos	Tiempo total en milisegundos para invocar la función "search_chunks"
Tiempo total de búsqueda en milisegundos	Tiempo total necesario para la búsqueda
Tiempo total de búsqueda de similitud en milisegundos	Tiempo total necesario para buscar documentos similares
Recuento de solicitudes de API de base de datos vectoriales	Número total de solicitudes de API a Vector DB

Supervisión de RAG perimetral

Compartir a través de

Métricas disponibles para la supervisión de la versión preliminar de RAG de Edge, habilitada por Azure Arc

Contenido relacionado

Comentarios

Recursos adicionales