Überwachen von Abfrageanforderungen in Azure KI-Suche

In diesem Artikel wird erläutert, wie Sie die Abfrageleistung und das Volume mithilfe integrierter Metriken und Diagnoseprotokollierung messen. Außerdem wird erläutert, wie die von Anwendungsbenutzern eingegebenen Abfragezeichenfolgen abgerufen werden.

Das Azure-Portal zeigt grundlegende Metriken zur Abfragelatenz, zur Abfragelast (QPS) und zur Drosselung an. Historische Daten, die in diese Metriken eingespeist werden, können im Azure-Portal 30 Tage lang abgerufen werden. Für eine längere Aufbewahrung oder zum Melden von Betriebsdaten und Abfragezeichenfolgen müssen Sie die Diagnoseprotokollierung aktivieren und eine Speicheroption für die Beibehaltung protokollierter Vorgänge und Metriken auswählen. Wir empfehlen Log Analytics Workspace als Ziel für protokollierte Vorgänge. Kusto-Abfragen und Datenerkundung zielen auf einen Log Analytics Arbeitsbereich ab.

Zu den Bedingungen, die die Integrität der Datenmessung maximieren, gehören:

  • Verwenden Sie einen abrechnenden Dienst (einen Dienst, der entweder auf der Stufe "Einfach" oder "Standard" erstellt wurde). Der kostenlose Dienst wird von mehreren Abonnenten geteilt, wodurch eine gewisse Volatilität bei lastenverlagerungen eingeführt wird.

  • Verwenden Sie nach Möglichkeit ein einzelnes Replikat und eine einzelne Partition, um eine enthaltene und isolierte Umgebung zu erstellen. Wenn Sie mehrere Replikate verwenden, werden Abfragemetriken über mehrere Knoten gemittelt, wodurch die Genauigkeit der Ergebnisse verringert werden kann. Ebenso bedeuten mehrere Partitionen, dass Daten geteilt werden, wobei einige Partitionen möglicherweise unterschiedliche Daten haben, wenn die Indizierung ebenfalls ausgeführt wird. Wenn Sie die Abfrageleistung optimieren, bietet ein einzelner Knoten und eine Partition eine stabilere Umgebung zum Testen.

Abfragevolume (QPS)

Das Volumen wird als Suchabfragen pro Sekunde (QPS) gemessen, einer integrierten Metrik, die als Mittelwert, Anzahl, Mindest- oder Höchstwerte von Abfragen gemeldet werden kann, die innerhalb eines einminütigen Fensters ausgeführt werden. Einminütige Intervalle (TimeGrain = "PT1M") für Metriken werden innerhalb des Systems festgelegt.

Azure KI-Suche behält standardmäßig 30 Tage Metrikdaten bei. Sie können die Protokollierung für eine längere Aufbewahrung aktivieren. QPS steht im Azure-Portal auf der Registerkarte Monitoring Ihres Suchdiensts zur Verfügung.

Screenshot der Registerkarte

Weitere Informationen zur Metrik SearchQueriesPerSecond finden Sie unter Suchabfragen pro Sekunde.

Abfrageleistung

Dienstweite Abfrageleistung wird als Suchlatenz und gedrosselte Abfragen gemessen. Diese Metriken sind auch auf der Registerkarte "Überwachung " verfügbar.

Suchlatenz

Die Suchlatenz gibt an, wie lange eine Abfrage abgeschlossen werden muss. Weitere Informationen zur SearchLatency-Metrik finden Sie unter Suchlatenz.

Betrachten Sie das folgende Beispiel für Suchlatenzmetriken : 86 Abfragen wurden mit einer durchschnittlichen Dauer von 23,26 Millisekunden abgefragt. Mindestens 0 gibt an, dass einige Abfragen gelöscht wurden. Die längst ausgeführte Abfrage dauerte 1000 Millisekunden. Die Gesamtausführungszeit betrug 2 Sekunden.

Latenzaggregationen

Gedrosselte Abfragen

Gedrosselte Abfragen sind Abfragen, die nicht verarbeitet, sondern gelöscht werden. In den meisten Fällen ist die Drosselung ein normaler Bestandteil der Dienstausführung. Es ist nicht notwendigerweise ein Hinweis darauf, dass etwas falsch ist. Weitere Informationen zur Metrik ThrottledSearchQueriesPercentage finden Sie unter Prozentsatz der gedrosselten Suchabfragen.

Im folgenden Screenshot ist die erste Zahl die Anzahl (oder die Anzahl der Metriken, die an das Protokoll gesendet wurden). Andere Aggregationen, die oben oder beim Zeigen über die Metrik angezeigt werden, umfassen Mittelwert, Maximum und Summe. In diesem Beispiel wurden keine Anforderungen verworfen.

Gedrosselte Aggregationen

Erkunden von Metriken im Azure-Portal

Ein schneller Blick auf die aktuellen Zahlen ist auf der Registerkarte "Überwachung" der Dienstübersichtsseite sichtbar. Dort werden drei Metriken angezeigt: Suchlatenz, Suchabfragen pro Sekunde (pro Sucheinheit) und Prozentsatz gedrosselter Suchabfragen, über feste Intervalle, die in Stunden, Tagen und Wochen gemessen werden, mit der Möglichkeit, den Aggregationstyp zu ändern.

Öffnen Sie den Metrik-Explorer im Menü "Überwachung ", um Daten zu analysieren, zu vergrößern und zu visualisieren, um Trends oder Anomalien zu untersuchen. Erfahren Sie mehr über den Metrik-Explorer, indem Sie dieses Lernprogramm zum Erstellen eines Metrikdiagramms abschließen.

  1. Wählen Sie im Abschnitt "Überwachung " die Option "Metriken " aus, um den Metrik-Explorer mit dem Bereich zu öffnen, der auf Ihren Suchdienst festgelegt ist.

  2. Wählen Sie unter "Metrik" eine aus der Dropdownliste aus, und überprüfen Sie die Liste der verfügbaren Aggregationen für einen bevorzugten Typ. Die Aggregation definiert, wie die gesammelten Werte für jedes Zeitintervall stichprobeniert werden.

    Metriken-Explorer für QPS-Metrik

  3. Legen Sie in der oberen rechten Ecke das Zeitintervall fest.

  4. Wählen Sie eine Visualisierung aus. Der Standardwert ist ein Liniendiagramm.

  5. Überlagern Sie weitere Aggregationen, indem Sie Add metric wählen und verschiedene Aggregationen auswählen.

  6. Vergrößern Sie einen interessanten Bereich im Liniendiagramm. Setzen Sie den Mauszeiger am Anfang des Bereichs, wählen Sie die linke Maustaste aus, halten Sie sie gedrückt, ziehen Sie auf die andere Seite des Bereichs, und lassen Sie die Schaltfläche los. Das Diagramm zoomt in diesen Zeitraum ein.

Zurückgeben von Abfragezeichenfolgen, die von Benutzern eingegeben wurden

Wenn Sie die Ressourcenprotokollierung aktivieren, erfasst das System Abfrageanforderungen in der AzureDiagnostics-Tabelle . Als Voraussetzung müssen Sie bereits ein Ziel für protokollierte Vorgänge, entweder einen Log Analytics-Arbeitsbereich oder eine andere Speicheroption, angegeben haben.

  1. Wählen Sie im Abschnitt "Überwachung" Logs aus, um ein leeres Abfragefenster in Log Analytics zu öffnen.

  2. Führen Sie den folgenden Ausdruck für Suchvorgänge Query.Search aus, und geben Sie ein tabellarisches Resultset zurück, das aus dem Vorgangsnamen, der Abfragezeichenfolge, dem abgefragten Index und der Anzahl der gefundenen Dokumente besteht. Die letzten beiden Anweisungen schließen aus einer leeren oder nicht angegebenen Suche bestehende Abfragezeichenfolgen über einen Beispielindex aus, wodurch unnötige Informationen in den Ergebnissen reduziert werden.

       AzureDiagnostics
    | project OperationName, Query_s, IndexName_s, Documents_d
    | where OperationName == "Query.Search"
    | where Query_s != "?api-version=2026-04-01&search=*"
    | where IndexName_s != "hotels-sample"
    
  3. Legen Sie optional einen Spaltenfilter für Query_s fest, um nach einer bestimmten Syntax oder Zeichenfolge zu suchen. Zum Beispiel können Sie über ist gleich?api-version=2026-04-01&search=*&%24filter=HotelName filtern.

    Protokollierte Abfragezeichenfolgen

Während diese Technik für die Ad-hoc-Untersuchung funktioniert, können Sie beim Erstellen eines Berichts die Abfragezeichenfolgen in einem Layout konsolidieren und präsentieren, das für die Analyse besser geeignet ist.

Erkennen lang andauernder Abfragen

Fügen Sie die Spalte "Dauer" hinzu, um die Zahlen für alle Abfragen abzurufen, nicht nur diejenigen, die als Metrik abgerufen werden. Das Sortieren dieser Daten zeigt Ihnen, welche Abfragen am längsten abgeschlossen sind.

  1. Wählen Sie im Abschnitt "Überwachung " die Option "Protokolle " aus, um Protokollinformationen abzufragen.

  2. Führen Sie die folgende grundlegende Abfrage aus, um Abfragen zurückzugeben, sortiert nach Dauer in Millisekunden. Die am längsten laufenden Abfragen befinden sich oben.

    AzureDiagnostics
    | project OperationName, resultSignature_d, DurationMs, Query_s, Documents_d, IndexName_s
    | where OperationName == "Query.Search"
    | sort by DurationMs
    

    Abfragen nach Dauer sortieren

Erstellen einer metrischen Warnung

Eine Metrikwarnung richtet einen Schwellenwert für das Senden einer Benachrichtigung oder das Auslösen einer Korrekturmaßnahme ein, die Sie im Voraus definieren. Sie können Warnungen im Zusammenhang mit der Abfrageausführung erstellen, aber Sie können sie auch für ressourcenintegrität, Suchdienstkonfigurationsänderungen, Qualifikationsausführung und Dokumentverarbeitung (Indizierung) erstellen.

Alle Schwellenwerte sind benutzerdefinierte, daher sollten Sie eine Vorstellung davon haben, welche Aktivitätsebene die Warnung auslösen soll.

Bei der Abfrageüberwachung wird häufig eine Metrikwarnung für Suchlatenz und gedrosselte Abfragen erstellt. Wenn Sie wissen , wann Abfragen verworfen werden, können Sie nach Abhilfemaßnahmen suchen, die die Auslastung verringern oder die Kapazität erhöhen. Wenn beispielsweise gedrosselte Abfragen während der Indizierung zunehmen, könnten Sie diese aufschieben, bis die Abfrageaktivität nachlässt.

Wenn Sie an die Grenzen einer bestimmten Replikat- und Partitionskonfiguration stoßen, ist das Einrichten von Warnungen für Abfragemengen-Schwellenwerte (QPS) ebenfalls hilfreich.

  1. Wählen Sie unter "Überwachung" die Option "Benachrichtigungen" und dann "Warnungsregel erstellen" aus.

  2. Wählen Sie unter "Bedingung " die Option "Hinzufügen" aus.

  3. Konfigurieren Sie die Signallogik. Wählen Sie für den Signaltyp Metriken und dann das Signal aus.

  4. Nachdem Sie das Signal ausgewählt haben, können Sie ein Diagramm verwenden, um historische Daten für eine fundierte Entscheidung darüber zu visualisieren, wie Sie mit der Einrichtung von Bedingungen fortfahren.

  5. Scrollen Sie als Nächstes nach unten zur Warnungslogik. Für Machbarkeitsnachweise könnten Sie einen künstlich niedrigen Wert für Testzwecke angeben.

  6. Geben Sie als Nächstes eine Aktionsgruppe an, oder erstellen Sie sie. Dies ist die Antwort, die aufgerufen wird, wenn der Schwellenwert erreicht ist. Möglicherweise handelt es sich um eine Pushbenachrichtigung oder eine automatisierte Antwort.

  7. Abschließend geben Sie Alarmdetails an. Benennen Sie die Warnung, weisen Sie einen Schweregrad zu, und geben Sie an, ob die Regel in einem aktivierten oder deaktivierten Zustand erstellt werden soll.

Wenn Sie eine E-Mail-Benachrichtigung angegeben haben, erhalten Sie eine E-Mail von "Microsoft Azure" mit der Betreffzeile "Azure: Aktivierter Schweregrad: 3 <your rule name>".

Nächste Schritte

Wenn Sie dies noch nicht getan haben, überprüfen Sie die Grundlagen der Suchdienstüberwachung, um mehr über die gesamte Palette von Aufsichtsfunktionen zu erfahren.