Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En la tabla siguiente se enumeran las métricas disponibles para Edge RAG.
Nombre de la métrica | Descripción |
---|---|
Recuento de errores de API | Recuento de solicitudes de API con error |
Recuento de solicitudes de API | Número total de solicitudes de API |
Duración de la solicitud de API en segundos | Histograma de duraciones de solicitud |
Recuento de éxitos de API | Recuento de solicitudes de API exitosas |
Recuento de solicitudes de API de evaluación | Número total de solicitudes de API de evaluación |
Recuento omitido con errores | Contador de archivos con errores omitidos (ingesta) |
Tasa de ingesta de archivos | Total de archivos ingeridos por trabajo |
Recuento de solicitudes de API del modelo de búsqueda híbrida | Número total de solicitudes de API del modelo de búsqueda híbrida |
Comentarios de respuesta de inferencia | Comentarios de la respuesta de inferencia |
Recuento de solicitudes de API de inferencia | Número total de solicitudes de API de inferencia |
Tiempo de ingesta | Tiempo total de ingesta en minutos |
Recuento de solicitudes de API de ingesta | Número total de solicitudes de API de ingesta |
Tiempo de preprocesamiento de entrada (milisegundos) | Tiempo de preprocesamiento de entrada en milisegundos |
Número de evaluaciones | Número de evaluaciones |
Número de trabajos | Número de trabajos |
Llamar al tiempo total de LLM en segundos | Tiempo total en segundos para invocar la función "call_llm" |
Inserción de tiempo total de generación en segundos | Tiempo total necesario para generar incrustaciones a partir del modelo local |
Tiempo total de generación de inserción de búsqueda híbrida en segundos | Tiempo total necesario para generar incrustaciones de búsqueda híbrida a partir del modelo local |
Reranking Generation Total Time in Seconds | Tiempo total necesario para generar la reranking a partir del modelo local |
Obtener resumen del historial de chat tiempo total en milisegundos | Tiempo total en milisegundos para invocar la función "get_chat_history_summary" |
Obtener tiempo total de carga de LLM en milisegundos | Tiempo total en milisegundos para invocar la función "get_llm_payload" |
Obtener tiempo total de búsqueda híbrida en milisegundos | Tiempo total de búsqueda híbrida en milisegundos |
Tiempo total de inferencia en segundos | Tiempo total de inferencia en segundos |
Tiempo total de búsqueda de fragmentos en milisegundos | Tiempo total en milisegundos para invocar la función "search_chunks" |
Tiempo total de búsqueda en milisegundos | Tiempo total necesario para la búsqueda |
Tiempo total de búsqueda de similitud en milisegundos | Tiempo total necesario para buscar documentos similares |
Recuento de solicitudes de API de base de datos vectoriales | Número total de solicitudes de API a Vector DB |