適用於中小企業的新式數據倉儲

Azure Data Lake
Azure SQL Database
Azure Synapse Analytics
Dynamics 365
Microsoft Power Platform

此範例工作負載示範數種方式可讓小型企業將舊版數據存放區現代化,並探索巨量數據工具和功能,而不需要過度擴充目前的預算和技能集。 這些端對端 Azure 數據倉儲解決方案可輕鬆地與 Azure 機器學習、Microsoft Power Platform、Microsoft Dynamics 和其他 Microsoft 技術等工具整合。

架構

Diagram that shows how SMBs can modernize legacy data stores.

下載此架構的 Visio 檔案

舊版 SMB 數據倉儲可能包含數種類型的數據:

  • 非結構化數據,例如文件和圖形
  • 半結構化數據,例如記錄、CSV、JSON 和 XML 檔案
  • 結構化關係型數據,包括使用預存程式進行 extract-transform-load/extract-load-transform (ETL/ELT) 活動的資料庫

資料流程

下列資料流示範所選資料類型的擷取:

  1. Azure Synapse Analytics 管線會將舊版數據倉儲內嵌至 Azure。

    • 管線會將已移轉或部分重構的舊版資料庫和 SSIS 套件的流程協調到 Azure SQL 資料庫。 此隨即轉移方法最快速實作,並提供從內部部署 SQL 解決方案到最終 Azure 平臺即服務 (PaaS) 的順暢轉換。 您可以在隨即轉移之後,以累加方式將資料庫現代化。

    • 管線也可以將非結構化、半結構化和結構化數據傳遞至 Azure Data Lake 儲存體,以便與其他來源進行集中式儲存和分析。 在撫摸數據時,使用此方法可提供比簡單地重新格式化數據更多的商務優勢。

  2. Microsoft Dynamics 數據源可用來使用 Synapse 無伺服器分析工具,在增強數據集上建置集中式 BI 儀錶板。 您可以將融合、已處理的數據帶回 Dynamics 和 Power BI,以進行進一步分析。

  3. 來自串流來源的實時數據也可以透過 Azure 事件中樞 進入系統。 對於具有即時儀錶板需求的客戶,Azure 串流分析可以立即分析此數據。

  4. 數據也可以輸入集中式 Data Lake,以進一步分析、儲存和報告。

  5. Azure Synapse Analytics 工作區中提供無伺服器分析工具。 這些工具會使用無伺服器 SQL 集區或 Apache Spark 計算功能來處理 Data Lake 儲存體 Gen2 中的數據。 無伺服器集區隨選提供,且不需要任何已布建的資源。

    無伺服器集區很適合:

    • T-SQL 格式的特定數據科學探索。
    • 數據倉儲實體的早期原型設計。
    • 針對可容許效能延遲的案例,定義取用者可以使用的檢視,例如在Power BI中。

Azure Synapse 與整合數據集的潛在取用者緊密整合,例如 Azure 機器學習。 其他取用者可以包括 Power Apps、Azure Logic Apps、Azure Functions 應用程式和 Azure App 服務 Web 應用程式。

元件

  • Azure Synapse Analytics 是一項分析服務,結合了數據整合、企業數據倉儲和巨量數據分析。 在此解決方案中:

  • Azure SQL 資料庫 是專為雲端建置的智慧型、可調整關係資料庫服務。 在此解決方案中,SQL 資料庫 保存企業數據倉儲,並執行使用預存程式的 ETL/ELT 活動。

  • Azure 事件中樞 是實時數據串流平臺和事件擷取服務。 事件中樞可以從任何地方內嵌數據,並順暢地與 Azure 數據服務整合。

  • Azure 串流分析 是串流數據的即時無伺服器分析服務。 串流分析提供快速、彈性的延展性、企業級可靠性和復原,以及內建的機器學習功能。

  • Azure 機器學習 是數據科學模型開發和生命週期管理的工具組。 機器學習 是 Azure 和 Microsoft 服務 的其中一個範例,可取用來自 Data Lake 儲存體 Gen2 的已融合、已處理的數據。

替代項目

  • Azure IoT 中樞 可以取代或補充事件中樞。 您選擇的解決方案取決於串流數據的來源,以及您是否需要與報告裝置進行複製和雙向通訊。

  • 您可以使用 Azure Data Factory 進行數據整合,而不是使用 Azure Synapse 管線。 選擇取決於幾個因素:

    • Azure Synapse 管線可讓解決方案設計更簡單,並允許在單一 Azure Synapse 工作區內共同作業。
    • Azure Synapse 管線不支援 Azure Data Factory 中提供的 SSIS 套件重新裝載。
    • Synapse 監視器中樞 會監視 Azure Synapse 管線,而 Azure 監視器 則可監視 Data Factory。

    如需 Azure Synapse 管線與 Data Factory 之間的功能比較詳細資訊和功能比較,請參閱 Azure Synapse Analytics 與 Azure Data Factory 中的數據整合。

  • 您可以使用 Synapse Analytics 專用 SQL 集區來儲存企業數據,而不是使用 SQL 資料庫。 請檢閱本文中的使用案例和考慮和相關資源,以做出決策。

案例詳細資料

在將內部部署數據倉儲現代化為雲端時,中小企業(SMB)面臨選擇。 他們可以針對未來的擴充性採用巨量數據工具,或保留以 SQL 為基礎的傳統解決方案,以符合成本效益、輕鬆維護及順暢轉換。

不過,混合式方法結合了現有數據資產的輕鬆移轉,並有機會為某些使用案例新增巨量數據工具和程式。 SQL 型數據源可以持續在雲端中執行,並視需要繼續現代化。

此範例工作負載顯示數種方式,讓SMB可以將舊版數據存放區現代化,並探索巨量數據工具和功能,而不需要過度擴充目前的預算和技能集。 這些端對端 Azure 數據倉儲解決方案可輕鬆地與 Azure 整合,Microsoft 服務 和工具,例如 Azure 機器學習、Microsoft Power Platform 和 Microsoft Dynamics。

潛在的使用案例

數個案例可受益於此工作負載:

  • 移轉小於 1 TB 的傳統內部部署關係型數據倉儲,並廣泛使用 SQL Server Integration Services (SSIS) 套件來協調預存程式。

  • 使用批次和即時的 Azure Data Lake 來源,將現有的 Dynamics 或 Power Platform Dataverse 數據網格化。

  • 使用創新技術與集中式 Data Lake 儲存體 Gen2 數據互動。 技術包括無伺服器分析、知識採礦、網域之間的數據融合,以及用戶數據探索。

  • 設定電子商務公司以採用數據倉儲來優化其作業。

不建議使用此解決方案:

考量

這些考慮會實作 Azure Well-Architected Framework 的支柱,這是一組指導原則,可用來改善工作負載的品質。 如需詳細資訊,請參閱 Microsoft Azure Well-Architected Framework

下列考慮適用於此案例。

可用性

SQL 資料庫 是 PaaS 服務,可符合您的高可用性 (HA) 和災害復原 (DR) 需求。 請務必挑選符合您需求的 SKU。 如需指引,請參閱 Azure SQL 資料庫 的高可用性。

Operations

SQL 資料庫 用法SQL Server Management Studio (SSMS) 可開發和維護舊版成品,例如預存程式。

成本最佳化

成本優化是考慮如何減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱 成本優化要素概觀。

請參閱 Azure 定價計算機中 SMB 數據倉儲案例的定價範例。 調整值,以查看您的需求如何影響成本。

  • SQL 資料庫 根據所選計算和服務層級的成本,以及虛擬核心和資料庫交易單位 (DTU) 的數目。 此範例會根據您在 SQL 資料庫 中執行預存程式的假設,顯示具有已布建計算和八個虛擬核心的單一資料庫。

  • Data Lake 儲存體 Gen2 定價取決於您儲存的數據量,以及您使用數據的頻率。 範例定價包含儲存的數據 1 TB,以及進一步的交易假設。 1 TB 是指數據湖的大小,而不是原始的舊版資料庫大小。

  • Azure Synapse 管線會 根據數據管線活動數目、整合運行時間時數、數據流叢集大小,以及執行和作業費用的成本為基礎。 管線成本會隨著其他數據源和已處理的數據量而增加。 此範例假設 Azure 裝載整合運行時間上每小時批處理一個數據源 15 分鐘。

  • Azure Synapse Spark 集 區是以節點大小、實例數目和運行時間為基礎定價。 此範例假設一個小型計算節點,每週五小時到每月 40 小時使用率。

  • Azure Synapse 無伺服器 SQL 集區 是以已處理數據的 TB 為基礎定價。 此範例假設每月處理 50 TB。 此圖是指數據湖的大小,而不是原始的舊版資料庫大小。

  • 事件中樞 會根據已收到的層級、布建的輸送量單位和輸入流量來計費。 此範例假設標準層中的一個輸送量單位超過一百萬個事件一個月。

  • 串流分析 會以布建的串流單位數目為基礎成本。 此範例假設一個月使用一個串流單位。

參與者

本文由 Microsoft 更新及維護。 原始投稿人如下。

主體作者:

  • Galina Polyakova |資深雲端解決方案架構師

下一步