使用 Azure HDInsight 建置開放原始碼軟體 (OSS) 分析解決方案

中級
資料工程師
資料科學家
Azure HDInsight

在此學習路徑中,將會向學習者介紹 HDInsight,以及如何運用此技術來解決一系列的實際挑戰。

必要條件

必須完成下列先決條件

  • 成功登入 Azure 入口網站
  • 了解 Azure 儲存體選項
  • 了解 Azure 計算選項

此學習路徑中的課程模組

您將會在此課程模組結束時,了解 Azure HDInsight 是完全受控的雲端服務,可讓您使用最受歡迎的開放原始碼架構有效率地處理大量資料。

在此課程模組中,您將從效能與成本觀點了解各種設定,確保會以最佳方式使用 HDInsight。

在此課程模組中,您將會了解如何建立 HDInsight 叢集和監視叢集,以及了解常見的佈建問題。

了解 HBase 如何針對依資料行系列組織的無結構描述資料庫中的大量非結構化及半結構化資料,提供隨機存取功能和強大的一致性。

在本課程模組中,您將了解如何使用 Azure HDInsight 搭配 Apache Kafka 和 Apache Spark,在雲端上建立即時串流資料分析管線和應用程式。

在本課程模組結束時,您將能夠對巨量資料集執行特定查詢。 使用 HDInsight Interactive Query 有助於達成亞秒查詢延遲。

Azure HDInsight 可與其他 Azure 服務搭配使用,以提供全方位的多層式安全性解決方案,但需由 Microsoft 與客戶共同負起管理責任。