Azure 資料總管的運作方式

已完成

在此單元中,我們會探討系統的主要元件,以查看 Azure 資料總管在幕後的運作方式。 然後,您將透過探索常見工作流程來了解如何與服務互動:

  • 資料擷取
  • Kusto 查詢語言
  • 資料視覺效果

這些知識可協助您判斷 Azure 資料總管是否適合您的資料需求。

Image representing architecture of Azure Data Explorer and data connections in and out of the service.

主要元件

Azure 資料總管叢集會執行各項工作來擷取、處理及查詢您的資料。 叢集會根據您的需求自動調整。 Azure 資料總管也會將資料儲存在 Azure 儲存體,並將其中部分資料快取到叢集計算節點上,以達到最佳查詢效能。

Azure 資料總管叢集中的內容為何?

每個 Azure 資料總管叢集最多可保存 10,000 個資料庫,而每個資料庫最多可保存 10,000 個資料表。 每個資料表中的資料會儲存在資料分區中,也稱為 [範圍]。 所有資料都會自動編製索引,並根據擷取時間進行資料分割。 與關聯式資料庫不同的是,沒有主要外部索引鍵條件約束或任何其他條件約束 (例如唯一性)。 此設計表示您可以儲存大量的不同資料。 而且因為這個儲存方式,您可以快速進行查詢。

資料庫的邏輯結構類似於許多其他關聯式資料庫。 Azure 資料總管資料庫可包含:

  • 資料表:由一組資料行組成。 每個資料行具有九種不同資料類型的其中一種。
  • 外部資料表:基礎儲存體在其他位置 (例如 Azure Data Lake) 的資料表。

了解一般工作流程

一般來說,當您與 Azure 資料總管互動時,會經歷以下工作流程:首先,內嵌資料以在系統中取得資料。 然後,分析您的資料。 接下來,以視覺化方式呈現分析的結果。 您隨時都可以與資料管理功能互動。 這項 Azure 資料總管工作可透過與叢集的互動來完成。 您可以在 Web UI 中或使用 SDK 來存取這些資源。

如何將我的資料放入 Azure 資料總管中?

資料擷取是一個程序,用於從一或多個來源將資料記錄載入 Azure 資料總管中的資料表。 進一步的資料操作包括比對結構描述、組織、編製索引、編碼以及壓縮資料。 然後,資料管理員會將資料擷取認可至引擎,以供查詢。

除了原生 Web UI 精靈之外,還有各種可用的擷取工具。 包括受控管線、事件方格、IoT 中樞 和 Azure Data Factory。 您可以使用連接器和外掛程式,例如 Logstash 外掛程式、Kafka 連接器、Power Automate 和 Apache Spark 連接器。 您也可以使用 SDK 或 LightIngest 進行程式設計擷取。

您可以用兩種模式來擷取資料:批次串流。 批次擷取最適合用於高擷取輸送量和快速查詢結果。 串流擷取可讓您以近乎即時的延遲來處理每個資料表的小型資料集。

如何分析我的資料?

Azure 資料總管會使用專屬的 Kusto 查詢語言 (KQL) 來分析資料。 它廣泛使用於 Microsoft(Azure 監視器 - Log Analytics 和 Application Insights、Microsoft Sentinel 和 Microsoft Defender 全面偵測回應)。 KQL 最適用於快速流動、多樣化、巨量資料探索。 查詢會參考資料表、檢視、函式和任何其他表格式運算式。 包含不同資料庫或甚至叢集中的資料表。 您可以使用 Web UI、各種查詢工具,或其中一個 Azure 資料總管 SDK 來執行查詢。

Kusto 查詢語言的運作方式為何?

Kusto 查詢語言是一種具表達性、直覺性和高生產力的查詢語言。 它可讓您從簡單的單一命令列順暢轉換為複雜的資料處理指令碼,並支援查詢結構化、半結構化和非結構化 (文字搜尋) 資料。 此語言中有多種查詢語言運算子和函式 (彙總、篩選、時間序列函式、地理空間函式、聯結、聯集等等)。 KQL 支援跨叢集和跨資料庫查詢,且在剖析方面有豐富的功能 (json、XML 等 )。 此外,此語言原本就支援進階分析。

如何顯示我的查詢結果?

Azure 資料總管 Web UI 是以巨量資料為考量而設計的,旨在讓您執行查詢和建置儀表板。 它支援顯示最多 50 萬筆記錄和數千個資料行。 其具備高度擴充性和豐富的功能,可協助您從資料中快速獲取見解。 您也可以在 Azure 資料總管儀表板中使用不同的視覺效果顯示資料。 您也可以使用目前一些頂尖視覺效果服務的原生連接器來顯示結果,例如 Power BI 與 Grafana。 Azure 資料總管也具有對 Tableau 和 Qlik 等工具的 ODBC 和 JDBC 連接器支援。

如何管理我的資料?

系統管理員想要在其 Azure 資料總管叢集上執行各種維護和原則工作,而 Control 命令可讓他們執行此動作。 使用 Control 命令,他們可以建立新的叢集或資料庫、建立資料連線、執行自動調整,以及調整叢集設定。 它們也可以控制及修改實體、中繼資料物件、管理權限和安全性原則。 此外,這些使用者可以修改具體化檢視 (其他資料表持續更新的篩選檢視)、函式 (預存函式和使用者定義函式),以及更新原則 (觸發下列擷取的函式)。

控制命令可使用 WebUI、Azure 入口網站、各種查詢工具,或 Azure 資料總管 SDK 之一直接在引擎上執行。