Azure 資料總管的運作方式

發行項
05/30/2024

Azure 數據總管提供無與倫比的效能，可用來擷取和查詢遙測、記錄、事件、追蹤和時間序列數據。它具有優化的記憶體格式、索引，並使用進階數據統計數據，以有效率地規劃查詢和 Just-In-Time 編譯的查詢執行。

儲存體與計算

Azure 數據總管會分隔記憶體和計算資源。永續性數據位於 Azure Blob 儲存體，而計算資源可能會儲存暫存數據，或作為永續性記憶體的快取。

此區隔提供下列優點：

獨立向外延展記憶體和計算資源。
跨多個計算叢集的相同數據存取範圍。如需詳細資訊，請參閱數據共用。
SKU 優化。如需詳細資訊，請參閱選取叢集的SKU。

資料存放區

Azure 數據總管會將所有內嵌的數據分割成範圍或 數據分區，這是目標數據表的水準配量。範圍可以像單一記錄一樣小。當數據累積在數據表中時，Azure 數據總管會自動合併範圍，直到它們成長為包含數百萬筆記錄為止。每個範圍都會獨立於其他範圍進行編碼和編製索引。這項功能有助於擷取輸送量的線性縮放比例。

範圍會平均分散到叢集節點，其中會在本機 SSD 和記憶體中快取它們。此散發可增強準備和執行高度分散式和平行查詢的容量。

如需數據記憶體的詳細資訊，請參閱範圍概觀。

注意

Azure 數據總管也會保留重要的元數據，例如數據表架構和原則物件。如需原則清單，請參閱原則概觀。

資料快取

Azure 數據總管具有多階層數據快取系統，以確保最相關的數據會盡可能快取到 CPU。快取系統取決於範圍不變性，且完全搭配壓縮的數據運作。為了改善查詢效能，數據即使在 RAM 中仍會保持壓縮，而且只有在查詢需要時才解壓縮。

如需快取的詳細資訊，請參閱快取原則。

文字索引編製

Azure 數據總管的設計目的是在內嵌數據時有效率地編製自由文字（字串）和類似 JSON 的數據行索引。索引會維持數據粒度層級，以根據索引評估查詢的部分，而不需要掃描數據。

透過合併來持續優化範圍的背景優化可改善壓縮和編製索引，確保有效率的記憶體和低查詢延遲。一旦範圍達到特定大小，就只會合併索引來增強查詢效能，而不會降低效率。

如需範圍和索引合併的詳細資訊，請參閱合併原則。

數據列存放區

Azure 資料總管提供稱為 數據列存放區的中繼記憶體解決方案。數據列存放區允許有效率地取用少量數據，並確保此數據可立即可供查詢。當您在叢集上啟用串流擷取時，數據一開始會內嵌至數據列存放區，然後移至數據行存放區範圍。

如需詳細資訊，請參閱批處理與串流擷取。

數據行壓縮

Azure 數據總管會維護處於壓縮狀態的數據，減少儲存和處理數據所需的記憶體數量。此行為可加快查詢效能，並更有效率地使用系統資源。

Azure 數據總管會避免垂直壓縮，這牽涉到排序數據以改善壓縮，因為它在自由文字或半結構化數據案例中具有高 CPU 成本。相反地，您可以指定具有主要查詢模式之案例的慣用數據排序順序。此取捨會優先處理查詢的快速數據可用性。

如需指定數據排序順序的詳細資訊，請參閱數據列順序原則。

分散式數據查詢

Azure 數據總管使用分散式數據查詢技術，適用於大型非結構化數據集上的快速臨機操作分析。這項技術的主要功能包括：

查詢產生的暫存數據會儲存在匯總 RAM 中
相關的範圍會標示在查詢計劃上，以提供快照集隔離
快速且有效率的查詢會以簡短的預設逾時排定優先順序
跨叢集查詢的原生支援，可將叢集間數據交換降至最低
查詢會即時編譯成高效機器碼，使用來自所有範圍的數據統計數據，並針對數據行編碼細節量身打造

注意

Azure 數據總管的設計目的是使用為 Azure 數據總管建置的 Kusto 查詢語言（KQL）。此外，也支援 T-SQL 。

共用方式為

Azure 資料總管的運作方式

儲存體與計算

資料存放區

資料快取

文字索引編製

數據列存放區

數據行壓縮

分散式數據查詢

意見反應

意見反應

其他資源

共用方式為

Azure 資料總管的運作方式

儲存體 與計算

資料存放區

資料快取

文字索引編製

數據列存放區

數據行壓縮

分散式數據查詢

相關內容

意見反應

意見反應

其他資源

儲存體與計算