監視 Azure AI 搜尋服務中的查詢要求

發行項
09/03/2024

本文說明如何使用內建計量和資源記錄來測量查詢效能和磁碟區。它也會說明如何取得應用程式使用者輸入的查詢字串。

Azure 入口網站顯示有關查詢延遲、查詢負載 (QPS) 和節流的基本計量。對於饋送至這些計量的歷程記錄資料，在入口網站中可存取 30 天。若要延長保留期，或報告操作資料和查詢字串，您必須新增診斷設定，以指定保存記錄作業和計量的儲存體選項。我們建議使用 Log Analytics工作區作為記錄作業的目的地。 Kusto 查詢和資料探索會以 Log Analytics 工作區為目標。

最大化資料量值完整性的條件包括：

使用可計費的服務 (在基本或標準層建立的服務)。免費服務是由多個訂閱者共用，這會在負載移位時引進一定數量的變動性。
盡可能使用單一複本和分割區來建立包含且隔離的環境。如果您使用多個複本，查詢計量會跨多個節點平均，這可能會降低結果的精確度。同樣地，多個分割區表示資料已分割，如果索引編製也正在進行中，某些資料分割可能會有不同的資料。調整查詢效能時，單一節點和資料分割可提供更穩定的環境進行測試。

提示

使用額外的用戶端程式碼和 Application Insights，您也可以擷取點選連結資料，以深入了解吸引應用程式使用者興趣的項目。如需詳細資訊，請參閱搜尋流量分析。

查詢磁碟區 (QPS)

磁碟區會測量每秒搜尋查詢 (QPS)，這是一個內建計量，可報告一分鐘視窗內所執行查詢的平均、計數、最小值或最大值。系統內一分鐘間隔的計量 (TimeGrain = "PT1M") 是固定的。

若要深入了解 SearchQueriesPerSecond 計量，請參閱每秒搜尋查詢。

查詢效能

整個服務的查詢效能會測量為搜尋延遲和 節流查詢。

搜尋延遲

搜尋延遲表示查詢需要多久的時間才能完成。若要深入了解 SearchLatency 計量，請參閱搜尋延遲。

請考慮下列搜尋延遲計量的範例：已取樣 86 個查詢，平均持續時間為 23.26 毫秒。最小值 0 表示已卸除一些查詢。執行時間最長的查詢需要 1000 毫秒才能完成。總執行時間為 2 秒。

節流查詢

節流查詢是指已卸除但未處理的查詢。在大部分情況下，節流是執行服務正常的一部分。這不一定表示發生錯誤。若要深入了解 ThrottledSearchQueriesPercentage 計量，請參閱節流搜尋查詢百分比。

在下列螢幕擷取畫面中，第一個數字是計數 (或傳送至記錄的計量數字)。顯示在頂端或停留在計量上方的其他彙總包括平均值、最大值和總計。在此範例中，不會卸除任何要求。

在入口網站中檢視計量

如需快速查看目前的數字，[服務概觀] 頁面上的 [監視] 索引標籤會顯示三個計量 (搜尋延遲、每秒搜尋查詢 (每個搜尋單位)、節流搜尋查詢百分比) 以小時、天和周為單位的固定間隔，以及變更匯總類型的選項。

若要進行更深入的探索，請從 [監視] 功能表開啟計量總管，讓您可以分層、放大及視覺化資料，以探索趨勢或異常狀況。完成建立計量圖表教學課程，以深入了解計量瀏覽器。

在 [監視] 區段底下，選取 [計量] 以開啟計量總管，並將範圍設定為搜尋服務。
在 [計量] 底下，從下拉式清單中選擇一個，並檢閱偏好型別的可用匯總清單。該彙總會定義收集的值將如何在每個時間間隔內取樣。
在右上角設定時間間隔。
選擇視覺效果。預設值為折線圖。
選擇 [新增計量] 並選取不同的彙總，以分層更多彙總。
放大折線圖上感興趣的區域。將滑鼠指標放在區域的開頭，選取並按住滑鼠左鍵，拖曳至區域的另一端，再放開按鈕。圖表將會放大該時間範圍。

傳回使用者輸入的查詢字串

當您啟用資源記錄時，系統會擷取 AzureDiagnostics 資料表中的查詢要求。作為必要條件，您必須已指定記錄作業的目的地 (Log Analytics 工作區或其他儲存體選項)。

在 [監視] 區段底下，選取 [記錄] 以在 Log Analytics 中開啟空白查詢視窗。
執行下列運算式來搜尋 Query.Search 作業，傳回表格式結果集，其中包含作業名稱、查詢字串、查詢索引，以及找到的文件數目。最後兩個陳述式會排除包含空白或未指定搜尋的查詢字串，而樣本索引會減少結果中的雜訊。
```
   AzureDiagnostics
| project OperationName, Query_s, IndexName_s, Documents_d
| where OperationName == "Query.Search"
| where Query_s != "?api-version=2024-07-01&search=*"
| where IndexName_s != "realestate-us-sample-index"
```
選擇性在 Query_s 上設定資料行篩選，以搜尋特定語法或字串。例如，您可以將 [等於] ?api-version=2024-07-01&search=*&%24filter=HotelName作為篩選條件。

雖然這項技術適用於臨機操作調查，但建置報表可讓您將查詢字串合併並呈現在配置中更方便分析。

識別執行時間長的查詢

新增持續時間資料行可取得所有查詢的數量，而不僅僅是選取為計量的查詢。透過排序此資料，可以顯示哪些查詢需要最長的時間才能完成。

在 [監視] 區段底下，選取 [記錄] 以查詢記錄資訊。

執行下列基本查詢以傳回查詢，並以毫秒為單位依持續時間排序。執行時間最長的查詢在頂端。

AzureDiagnostics
| project OperationName, resultSignature_d, DurationMs, Query_s, Documents_d, IndexName_s
| where OperationName == "Query.Search"
| sort by DurationMs

建立計量警示

計量警示會針對傳送通知或觸發您事先定義的矯正措施建立閾值。您可以建立與查詢執行相關的警示，但您也可以針對資源健康情況、搜尋服務組態變更、技能執行和文件處理 (編製索引) 建立警示。

所有閾值都是使用者定義的，因此您應該了解什麼活動層級應該觸發警示。

針對查詢監視，系統通常會為搜尋延遲和節流查詢建立計量警示。如果您知道查詢是何時卸除的，您可以尋找可減少負載或增加容量的解決方式。例如，如果在編製索引期間增加節流查詢，您可以將它延後，直到查詢活動趨緩為止。

如果您超出特定復本分割區設定的限制時，設定查詢磁碟區閾值 (QPS) 的警示也很有用。

在 [監視] 下，選取 [警示]，然後選取 [建立警示規則]。
在 [條件] 底下，選取 [新增]。
設定訊號邏輯。針對訊號型別，選擇 [計量]，並選取訊號。
選取訊號之後，您可以使用圖表將歷程記錄資料視覺化，以取得如何繼續設定條件的明智決策。
接下來，向下捲動至 [警示邏輯]。您可以針對測試目的指定人工性低值，作為概念證明。
接下來，指定或建立動作群組。這是符合閾值時要叫用的回應。這可能是推播通知或自動化回應。
最後，指定 [警示詳細資料]。命名並描述警示、指派嚴重性值，並指定是否要在啟用或停用狀態中建立規則。

如果您指定電子郵件通知，您會收到來自「Microsoft Azure」的電子郵件，主旨行為「Azure 啟動嚴重性：3 <your rule name>」。

下一步

如果您尚未這麼做，請檢閱搜尋服務監視的基本概念，以了解完整的監督功能範圍。

監視 Azure AI 搜尋服務中的作業和活動

共用方式為