Freigeben über


Metriken für die Überwachung von Edge RAG Preview, aktiviert von Azure Arc

In der folgenden Tabelle sind die Metriken aufgeführt, die für Edge RAG verfügbar sind.

Metrikname BESCHREIBUNG
API-Fehleranzahl Anzahl der fehlgeschlagenen API-Anforderungen
API-Anforderungsanzahl Gesamtanzahl der API-Anforderungen
API-Anforderungsdauer in Sekunden Histogramm der Anforderungsdauern
API-Erfolgsanzahl Anzahl der erfolgreichen API-Anforderungen
Anzahl der Auswertungs-API-Anforderungen Gesamtanzahl der Auswertungs-API-Anforderungen
Fehlgeschlagene Übersprungene Anzahl Fehler/ Übersprungener Dateizähler (Erfassung)
Dateiaufnahmerate Gesamtanzahl der Dateien, die pro Auftrag aufgenommen wurden
Anzahl der Hybridsuchmodell-API-Anforderungsanzahl Gesamtanzahl der API-Anforderungen des Hybridsuchmodells
Feedback zur Rückschlussantwort Feedback der Rückschlussantwort
Anzahl der Inference-API-Anforderungen Gesamtanzahl der Inference-API-Anforderungen
Erfassungszeit Gesamtaufnahmedauer in Minuten
Anzahl der Aufnahme-API-Anforderungen Gesamtanzahl der Ingestion-API-Anforderungen
Eingabevorverarbeitungszeit (Millisekunden) Eingabevorverarbeitungszeit in Millisekunden
Anzahl der Auswertungen Anzahl der Auswertungen
Anzahl der Aufträge Anzahl der Aufträge
Gesamtzeit der LLM-Anrufdauer in Sekunden Gesamtzeit in Sekunden zum Aufrufen der Funktion "call_llm"
Gesamtzeit der Generation in Sekunden einbetten Gesamtaufwand für das Generieren von Einbettungen aus dem lokalen Modell
Gesamtzeit der Hybridsuche beim Einbetten der Generation in Sekunden Gesamtdauer für die Erstellung von Einbettungen der Hybridsuche aus dem lokalen Modell
Gesamtzeit der Generation in Sekunden neu ankurbeln Gesamtzeitaufwand für die Generierung von Reranking aus dem lokalen Modell
Zusammenfassung der Gesamtzeit des Chatverlaufs in Millisekunden abrufen Gesamtzeit in Millisekunden zum Aufrufen der Funktion "get_chat_history_summary"
Abrufen der Gesamtzeit der LLM-Nutzlast in Millisekunden Gesamtzeit in Millisekunden zum Aufrufen der Funktion "get_llm_payload"
Gesamtzeit der Hybridsuche in Millisekunden abrufen Gesamtdauer der Hybridsuche in Millisekunden
Ableitungs-Gesamtzeit in Sekunden Gesamtinferenzzeit in Sekunden
Gesamtzeit der Suchvorgänge in Millisekunden Gesamtzeit in Millisekunden zum Aufrufen der Funktion "search_chunks"
Gesamtdauer der Suche in Millisekunden Gesamtdauer für die Suche
Ähnlichkeitssuche Gesamtzeit in Millisekunden Gesamtdauer für die Suche nach ähnlichen Dokumenten
Anzahl der Vektor-DB-API-Anforderungen Gesamtanzahl der API-Anforderungen an Vector DB

Edge-RAG überwachen