共用方式為


使用經常性窗口查詢冷數據

經常性存取視窗可讓您有效率地查詢冷數據,而不需要匯出數據或使用其他工具。 當非經常性數據大小很大且相關數據來自過去任何時間時,請使用經常性視窗。 經常性視窗定義於快取原則中。

Azure Data Explorer 將其資料儲存在可靠的長期記憶體中,並在叢集節點上快取此數據的一部分。 快 取原則 會控管快取的數據。 快取的數據會被視為 經常性存取,而其餘的數據則視為 非經常性存取。

若要查詢冷數據,Azure Data Explorer 處理載入步驟,其需要存取記憶體層且延遲比本機磁碟高很多。 當查詢限制為小型時間範圍時,通常稱為「時間點」查詢時,要擷取的數據量通常很小,而且查詢會快速完成。 例如,鑑識分析在過去指定一天查詢遙測,落在此類別之下。 對查詢持續時間的影響取決於從記憶體提取的數據大小,而且可能相當重要。 如果您要掃描大量的冷數據,查詢效能可能會受益於使用經常性視窗。

本文件說明如何使用經常性視窗來查詢冷數據。

必要條件

在叢集上設定自動調整

變更快取原則之後,叢集會自動快取其磁碟上的相關數據。 您必須調整叢集,以容納新快取定義所需的額外磁碟。 建議您設定叢集以使用 優化自動調整 設定。

  1. 在 Azure 入口網站 中,移至您的 Azure Data Explorer 叢集資源。 在 [ 設定] 底下,選取 [ 相應放大]。

  2. 在 [ 相應放大 ] 視窗中,選取 [優化自動調整]。

  3. 選取最小實例計數和最大實例計數。 叢集會根據負載,自動調整這兩個數字之間的範圍。

  4. 選取 [儲存]。

    優化的自動調整方法。

現在,您可以在使用經常性視窗期間預期最佳效能。

設定熱視窗

經常性視窗是快取原則命令語法的一部分,並使用 命令進行設定.alter policy caching

注意

根據更新的快取原則定義,最多可能需要一小時才能完整更新叢集磁碟快取。

  1. 使用 命令記下初始快取原則 .show policy caching

    .show table MyDatabase.MyTable policy caching 
    
  2. 使用下列語法改變快取原則。 單一資料庫或數據表可能會定義數個作用中的視窗。

    .alter <entity_type> <database_or_table_or_materialized-view_name> policy caching 
          hot = <timespan> 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          ...
    

    其中:

    • from:作用中視窗的開始時間 (datetime)
    • to:作用中視窗的結束時間 (datetime)

    例如,在下列設定下執行的查詢會檢查過去 14 天的數據,以及保留三年的數據。

    .alter table MyTable policy caching 
            hot = 14d,
            hot_window = datetime(2021-01-01) .. datetime(2021-02-01),
            hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
    

執行查詢

在作用中視窗指定的時段內執行您想要的查詢或查詢。

還原設定

  1. 使用在 [設定經常性存取] 視窗中擷取的原始快取設定。
  2. 使用 .alter policy caching 命令將快取原則還原為原始設定。

由於您已針對該叢集設定優化的自動調整,因此叢集會縮減成其原始大小。