來自 Azure 串流分析的 Azure 資料總管輸出
若要分析來自任何資料來源 (例如網站、應用程式、物聯網 (IoT) 裝置) 的大量多元資料,您可以使用 Azure 資料總管作為輸出。 Azure 資料總管是一項快速且可高度調整的資料探索服務,可用於處理記錄和遙測資料。 這有助於處理新式軟體發出的許多資料流,以便您收集、儲存及分析資料。 這份資料會用於診斷、監視、報告、機器學習及其他分析功能。
Azure 資料總管支援多種擷取方法,包括常用服務 (如 Azure 事件中樞) 的連接器,透過 SDK (如 .NET 和 Python) 的程式設計擷取,以及用於探索的引擎直接存取。 Azure 資料總管與分析和模型服務整合,可進行額外的資料分析和視覺效果。
如需 Azure 資料總管的詳細資訊,請參閱什麼是 Azure 資料總管?。
若要深入了解如何使用 Azure 入口網站建立 Azure 資料總管叢集,請參閱快速入門:建立 Azure 資料總管叢集和資料庫。
注意
Azure 串流分析的 Azure 資料總管支援對 Azure Synapse 資料總管的輸出。 若要寫入至 Azure Synapse 資料總管中的叢集,請在設定窗格中指定叢集的 URL,作為 Azure 串流分析作業中的 Azure 資料總管輸出。
輸出設定
下表列出建立 Azure 資料總管輸出所需的屬性名稱及其說明。
屬性名稱 | 描述 |
---|---|
輸出別名 | 此為易記名稱,用於在查詢中將查詢輸出導向這個資料庫。 |
訂用帳戶 | 您要用於叢集的 Azure 訂用帳戶。 |
Cluster | 可識別您叢集的唯一名稱。 網域名稱 <region>.kusto.windows.net 會附加至您提供的叢集名稱。 名稱只能包含小寫字母和數字。 必須包含 4 到 22 個字元。 |
Database | 您傳送輸出所在的資料庫名稱。 資料庫名稱在叢集內必須是唯一而不重複。 |
驗證 | Microsoft Entra ID 的受控識別,可讓您的叢集輕鬆存取其他受到 Microsoft Entra 保護的資源,例如 Azure Key Vault。 身分識別由 Azure 平台負責管理,因此您不需要佈建或輪替任何密碼。 受控識別的設定目前僅支援用於啟用叢集的客戶自控金鑰。 |
Table | 要在其中寫入輸出的資料表名稱。 表格名稱會區分大小寫。 這個資料表的結構描述應該完全符合您作業輸出所產生的欄位數目及其類型。 |
資料分割
您必須啟用資料分割,並以查詢中的 PARTITION BY
子句為基礎。 啟用 [繼承資料分割] 選項時,會遵循完整可平行化查詢的輸入資料分割。
使用 Azure 串流分析和 Azure 資料總管的時機
Azure 串流分析的特性包括:
- 串流處理引擎:連續性串流即時分析
- 以作業為基礎
- 回溯期間為 1 毫秒到 7 天,用於記憶體內部時態分析和串流處理
- 擷取自 Azure 事件中樞和 Azure IoT 中樞,延遲少於一秒
Azure 資料總管的特性包括:
- 分析引擎:隨選互動式即時分析
- 將資料擷取串流至永續性資料存放區,隨附查詢功能
- 擷取的資料來自事件中樞、IoT 中樞、Azure Blob 儲存體、Azure Data Lake Storage、Kafka、Logstash、Spark 和 Azure Data Factory
- 高輸送量工作負載有 10 秒到 5 分鐘的延遲
- 擷取期間透過更新原則進行簡單的資料轉換
您可以結合使用 Azure 串流分析和 Azure 資料總管,大幅擴大即時分析的範圍。 以下是一些案例:
- 串流分析即時識別異常,Azure 資料總管透過互動式探索協助判斷發生的經過和原因。
- 串流分析將傳入的資料流還原序列化以用於資料總管 (例如,使用自訂的還原序列化程式或自訂的二進位格式擷取 Protobuff 格式)。
- 串流分析可以彙總、篩選、擴充和轉換傳入的資料流以用於 Azure 資料總管。
其他案例和限制
- Azure 串流分析 SQL 查詢和 Azure 資料總管資料表之間的資料行名稱與資料類型應該相符。 比較會區分大小寫。
- 在 Azure 資料總管叢集中存在但在 Azure 串流分析中遺失的資料行會被忽略。 在 Azure 串流分析中遺失的資料行會產生錯誤。
- 在 Azure 串流分析查詢中的資料行順序不重要。 Azure 資料總管的資料表結構描述會決定順序。
- Azure 資料總管具有資料擷取的彙總 (批次) 原則,其設計目的是將擷取程序最佳化。 此原則已預設為 5 分鐘、1000 個項目或 1GB 的資料,因此您可能會遇到延遲情況。 若要降低延遲,請遵循在 Azure 資料總管叢集上設定串流擷取一文中的步驟,啟用叢集的串流擷取,再啟用資料表或資料庫的串流擷取。 如需了解彙總選項,請參閱 IngestionBatching 原則。