HDInsight 的使用時機

已完成

HDInsight 的最大優點是服務所提供的不同設定範圍。 它可讓您支援各種不同的工作負載。 這些工作負載可以透過批次方式處理資料、處理串流資料,或管理資料倉儲和/或資料科學工作負載。 這項功能讓 HDInsight 成為一個絕佳的選擇,特別是當您的商務程序包含多個工作負載時。

例如,如果您的組織只需要建立資料倉儲,以透過 Power BI 來呈現歷程記錄報表,在 Power BI 使用 Azure SQL 資料倉儲可能會很實用。 同樣地,如果組織使用資料科學解決方案來執行進階分析,而不執行其他作業,則可能適合只使用 Azure Databricks。

不過,如果組織的工作負載涉及歷程記錄報告和進階分析的內嵌資料,而且您有需要分析的串流資料,HDInsight 就會是一個實用的選擇。 所有的資料都可內嵌到單一 Data Lake 位置。 然後您可以使用正確的 HDInsight 設定來管理批次處理、資料倉儲、資料科學作業和串流工作負載。 由於計算與儲存體之間有所區隔,因此可以在相同的資料上順暢地完成。 此外,這也可以降低您的儲存成本,因為作業是在單一 (而非多個) 資料存放區上執行。

HDInsight 的優勢

除了上面所述的案例之外。 以下是讓 HDInsight 適用於巨量資料工作負載的主要差異:

  • 可獨立調整規模的計算與儲存體
  • 根據工作負載或排程自動調整背景工作節點規模
  • 主要節點的彈性和容錯能力
  • 企業安全性
  • SDK

分隔計算與儲存體,以及依據工作負載或排程自動調整叢集規模,可能可以明顯優化成品效益。 HDInsight 的主要節點可以對抗故障。 主要節點是由容錯虛擬機器提供支援,而這些機器有助於達到 99.9% SLA 的高可用性服務目標。 Microsoft Entra 整合具備驗證和授權的企業安全性功能。 這些功能搭配加密和虛擬網路支援,讓您更細緻地控制可存取資料的人員。 HDInsight 受到各種不同的 SDK 支援,可讓您在各種 IDE 中建立及開發多種語言的叢集。