使用經常性窗口查詢冷數據
經常性存取視窗可讓您有效率地查詢冷數據,而不需要匯出數據或使用其他工具。 當非經常性數據大小很大且相關數據來自過去任何時間時,請使用經常性視窗。 經常性視窗定義於快取原則中。
Azure Data Explorer 將其資料儲存在可靠的長期記憶體中,並在叢集節點上快取此數據的一部分。 快 取原則 會控管快取的數據。 快取的數據會被視為 經常性存取,而其餘的數據則視為 非經常性存取。
若要查詢冷數據,Azure Data Explorer 處理載入步驟,其需要存取記憶體層且延遲比本機磁碟高很多。 當查詢限制為小型時間範圍時,通常稱為「時間點」查詢時,要擷取的數據量通常很小,而且查詢會快速完成。 例如,鑑識分析在過去指定一天查詢遙測,落在此類別之下。 對查詢持續時間的影響取決於從記憶體提取的數據大小,而且可能相當重要。 如果您要掃描大量的冷數據,查詢效能可能會受益於使用經常性視窗。
本文件說明如何使用經常性視窗來查詢冷數據。
必要條件
- 如果您沒有 Azure 訂用帳戶,請在開始前建立免費 Azure 帳戶。
- 建立 Azure 資料總管叢集與資料庫。
- 使用 Azure Data Explorer 數據擷取概觀中所述的其中一種方法擷取叢集中的數據。
在叢集上設定自動調整
變更快取原則之後,叢集會自動快取其磁碟上的相關數據。 您必須調整叢集,以容納新快取定義所需的額外磁碟。 建議您設定叢集以使用 優化自動調整 設定。
在 Azure 入口網站 中,移至您的 Azure Data Explorer 叢集資源。 在 [ 設定] 底下,選取 [ 相應放大]。
在 [ 相應放大 ] 視窗中,選取 [優化自動調整]。
選取最小實例計數和最大實例計數。 叢集會根據負載,自動調整這兩個數字之間的範圍。
選取 [儲存]。
現在,您可以在使用經常性視窗期間預期最佳效能。
設定熱視窗
經常性視窗是快取原則命令語法的一部分,並使用 命令進行設定.alter policy caching
。
注意
根據更新的快取原則定義,最多可能需要一小時才能完整更新叢集磁碟快取。
使用 命令記下初始快取原則
.show policy caching
。.show table MyDatabase.MyTable policy caching
使用下列語法改變快取原則。 單一資料庫或數據表可能會定義數個作用中的視窗。
.alter <entity_type> <database_or_table_or_materialized-view_name> policy caching hot = <timespan> [, hot_window = datetime(*from*) .. datetime(*to*)] [, hot_window = datetime(*from*) .. datetime(*to*)] ...
其中:
-
from
:作用中視窗的開始時間 (datetime) -
to
:作用中視窗的結束時間 (datetime)
例如,在下列設定下執行的查詢會檢查過去 14 天的數據,以及保留三年的數據。
.alter table MyTable policy caching hot = 14d, hot_window = datetime(2021-01-01) .. datetime(2021-02-01), hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
-
執行查詢
在作用中視窗指定的時段內執行您想要的查詢或查詢。
還原設定
- 使用在 [設定經常性存取] 視窗中擷取的原始快取設定。
- 使用
.alter policy caching
命令將快取原則還原為原始設定。
由於您已針對該叢集設定優化的自動調整,因此叢集會縮減成其原始大小。