Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In der folgenden Tabelle sind die Metriken aufgeführt, die für Edge RAG verfügbar sind.
Metrikname | BESCHREIBUNG |
---|---|
API-Fehleranzahl | Anzahl der fehlgeschlagenen API-Anforderungen |
API-Anforderungsanzahl | Gesamtanzahl der API-Anforderungen |
API-Anforderungsdauer in Sekunden | Histogramm der Anforderungsdauern |
API-Erfolgsanzahl | Anzahl der erfolgreichen API-Anforderungen |
Anzahl der Auswertungs-API-Anforderungen | Gesamtanzahl der Auswertungs-API-Anforderungen |
Fehlgeschlagene Übersprungene Anzahl | Fehler/ Übersprungener Dateizähler (Erfassung) |
Dateiaufnahmerate | Gesamtanzahl der Dateien, die pro Auftrag aufgenommen wurden |
Anzahl der Hybridsuchmodell-API-Anforderungsanzahl | Gesamtanzahl der API-Anforderungen des Hybridsuchmodells |
Feedback zur Rückschlussantwort | Feedback der Rückschlussantwort |
Anzahl der Inference-API-Anforderungen | Gesamtanzahl der Inference-API-Anforderungen |
Erfassungszeit | Gesamtaufnahmedauer in Minuten |
Anzahl der Aufnahme-API-Anforderungen | Gesamtanzahl der Ingestion-API-Anforderungen |
Eingabevorverarbeitungszeit (Millisekunden) | Eingabevorverarbeitungszeit in Millisekunden |
Anzahl der Auswertungen | Anzahl der Auswertungen |
Anzahl der Aufträge | Anzahl der Aufträge |
Gesamtzeit der LLM-Anrufdauer in Sekunden | Gesamtzeit in Sekunden zum Aufrufen der Funktion "call_llm" |
Gesamtzeit der Generation in Sekunden einbetten | Gesamtaufwand für das Generieren von Einbettungen aus dem lokalen Modell |
Gesamtzeit der Hybridsuche beim Einbetten der Generation in Sekunden | Gesamtdauer für die Erstellung von Einbettungen der Hybridsuche aus dem lokalen Modell |
Gesamtzeit der Generation in Sekunden neu ankurbeln | Gesamtzeitaufwand für die Generierung von Reranking aus dem lokalen Modell |
Zusammenfassung der Gesamtzeit des Chatverlaufs in Millisekunden abrufen | Gesamtzeit in Millisekunden zum Aufrufen der Funktion "get_chat_history_summary" |
Abrufen der Gesamtzeit der LLM-Nutzlast in Millisekunden | Gesamtzeit in Millisekunden zum Aufrufen der Funktion "get_llm_payload" |
Gesamtzeit der Hybridsuche in Millisekunden abrufen | Gesamtdauer der Hybridsuche in Millisekunden |
Ableitungs-Gesamtzeit in Sekunden | Gesamtinferenzzeit in Sekunden |
Gesamtzeit der Suchvorgänge in Millisekunden | Gesamtzeit in Millisekunden zum Aufrufen der Funktion "search_chunks" |
Gesamtdauer der Suche in Millisekunden | Gesamtdauer für die Suche |
Ähnlichkeitssuche Gesamtzeit in Millisekunden | Gesamtdauer für die Suche nach ähnlichen Dokumenten |
Anzahl der Vektor-DB-API-Anforderungen | Gesamtanzahl der API-Anforderungen an Vector DB |