Документация по Azure HDInsight
Azure HDInsight — это управляемая служба Apache Hadoop, которая позволяет запускать Apache Spark, Apache Hive, Apache Kafka, Apache HBase и многие другие решения в облаке.
Сведения об HDInsight
Общие сведения
Начало работы
Apache Spark
Начало работы
- Что такое Apache Spark?
- Создание кластеров Spark и выполнение Spark в Jupyter
- Загрузка данных и выполнение запросов Spark
Практическое руководство
Apache Hadoop
Начало работы
- Что такое Apache Hadoop?
- Создание кластеров Hadoop и выполнение запросов Hive
- Выполнение примеров MapReduce
Практическое руководство
Интеграция
Практическое руководство
- Spark/Hive — подключение Spark и Hive с помощью Hive Warehouse Connector
- Spark/Kafka — структурированная потоковая передача Apache Spark с помощью Apache Kafka
- Spark/HBase — обращение к Apache HBase с помощью Apache Spark
- Создание кластеров по запросу с помощью ADF
Концепция
Apache Kafka
Начало работы
- Что такое Apache Kafka?
- Создание кластеров Kafka и управление разделами Kafka
- Использование API производителя и объекта-получателя
Практическое руководство
Интерактивный запрос
Начало работы
Практическое руководство
Готовность к работе в масштабах предприятия
Начало работы
Apache HBase
Начало работы
- Что такое Apache HBase?
- Использование HBase в Azure HDInsight
- Обращение к HBase с помощью Apache Phoenix