使用 Azure HDInsight 构建开源软件 (OSS) 分析解决方案

中级
数据工程师
数据科学家
Azure HDInsight

在此学习路径中,学习者将了解 HDInsight,以及如何应用此技术来解决一系列实际难题。

先决条件

应满足以下先决条件

  • 成功登录到 Azure 门户
  • 了解 Azure 存储选项
  • 了解 Azure 计算选项

本学习路径中的模块

介绍完本模块后,你将了解 Azure HDInsight 是一种完全托管的云服务,它能够使用最常用的开源框架有效地处理大量数据。

在本模块中,你将了解确保在性能和成本方面以最佳方式使用 HDInsight 的不同配置。

在此模块中,你将学习如何创建 HDInsight 群集、监视群集并了解常见的预配问题。

了解 HBase 如何针对按列系列组织的无架构数据库中的大量非结构化和半结构化数据提供随机访问和高度一致性。

在本模块中,你将了解如何通过将 Azure HDInsight 与 Apache Kafka 及 Apache Spark 结合,在云上创建实时流数据分析管道和应用程序。

完成本模块后,你可以对大数据集执行即席查询。 使用 HDInsight Interactive Query 有助于实现亚秒级查询延迟。

Azure HDInsight 与其他 Azure 服务一起提供了全面的多层安全解决方案,并由 Microsoft 和客户共担责任。