Новые возможности HDInsight в AKS? (Предварительная версия)
Примечание.
Мы отставим Azure HDInsight в AKS 31 января 2025 г. До 31 января 2025 г. необходимо перенести рабочие нагрузки в Microsoft Fabric или эквивалентный продукт Azure, чтобы избежать резкого прекращения рабочих нагрузок. Оставшиеся кластеры в подписке будут остановлены и удалены из узла.
До даты выхода на пенсию будет доступна только базовая поддержка.
Внимание
Эта функция в настоящее время доступна для предварительного ознакомления. Дополнительные условия использования для предварительных версий Microsoft Azure включают более юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в статье Azure HDInsight в предварительной версии AKS. Для вопросов или предложений функций отправьте запрос на AskHDInsight с подробными сведениями и следуйте за нами для получения дополнительных обновлений в сообществе Azure HDInsight.
В HDInsight в AKS все операции управления кластерами имеют встроенную поддержку управления службами в портал Azure для отдельных кластеров.
В HDInsight в AKS появились две новые концепции:
- Пулы кластеров используются для группировки кластеров и управления ими.
- Кластеры используются для открытый код вычислений, размещенных в пуле кластеров.
Пулы кластеров
HDInsight в AKS выполняется в Служба Azure Kubernetes (AKS). Ресурс верхнего уровня — это пул кластеров и управляет всеми кластерами, работающими в одном кластере AKS. При создании пула кластеров базовый кластер AKS создается одновременно для размещения всех кластеров в пуле. Пулы кластеров — это логическая группа кластеров, которая помогает создавать надежную совместимость между несколькими типами кластеров и позволяет предприятиям иметь кластеры в одной виртуальной сети. Пулы кластеров обеспечивают быстрый и экономичный доступ ко всем типам кластеров, созданным по требованию и в масштабе. Один пул кластеров соответствует одному кластеру в инфраструктуре AKS.
Кластеры
Кластеры являются отдельными открытый код вычислительными рабочими нагрузками, такими как Apache Spark, Apache Flink и Trino, которые можно быстро создавать в течение нескольких минут с предварительно настроенными конфигурациями и несколькими щелчками. Хотя он работает в одном пуле кластеров, каждый кластер может иметь собственные конфигурации, такие как тип кластера, версия, размер виртуальной машины узла, количество узлов. Кластеры выполняются на отдельных вычислительных ресурсах с собственными DNS и конечными точками.
Функции в предварительной версии
В следующей таблице показаны функции HDInsight в AKS, которые в настоящее время находятся в предварительной версии. Предварительные версии функций отсортированы в алфавитном порядке.
Площадь | Функции |
---|---|
Основы | Создание пулов и кластеров с помощью портала, поддержки веб-безопасной оболочки (ssh), возможность выбора количества рабочих узлов во время создания кластера |
Хранилище | Поддержка хранилища ADLS 2-го поколения |
Хранилище мета-данных | Поддержка внешнего хранилища метаданных для Trino, Spark и Flink, интеграция с HDInsight |
Безопасность | Поддержка ARM RBAC, поддержка проверки подлинности на основе MSI, возможность предоставления доступа к кластеру другим пользователям |
Ведение журналов и мониторинг | Агрегирование журналов в Log Analytics Azure для журналов серверов, кластеров и служб с помощью управляемых prometheus и Grafana, метрики сервера поддержки в Azure Monitor, страница "Состояние службы" для мониторинга Работоспособность служб |
Автоматическое масштабирование | Автомасштабирование на основе загрузки и автоматическое масштабирование на основе расписания |
Настройка и настройка кластеров | Поддержка действий скриптов во время создания кластера, поддержка управления библиотеками, параметры конфигурации службы после создания кластера |
Трино | Поддержка каталогов Trino, поддержка Trino CLI, поддержка DBeaver для отправки запросов, добавление или удаление подключаемых модулей и соединителей, поддержка событий запросов ведения журнала, поддержка статистики запросов сканирования для любого соединителя на панели мониторинга Trino, поддержка панели мониторинга Trino для мониторинга запросов, кэширования запросов, интеграции с Power BI, интеграция с Apache Superset, Redash, Поддержка нескольких соединителей |
Flink | Поддержка собственного веб-интерфейса Flink, поддержка Flink с HMS для DStream, отправка заданий в кластер с помощью REST API и портал Azure, запуск программ, упакованных в виде JAR-файлов через Flink CLI, поддержка постоянных точек сохранения, поддержка обновлений параметров конфигурации при выполнении задания, подключение к нескольким службам Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Центры событий Azure, Центр Интернета вещей Azure, Azure Pipelines, Фабрика данных Azure Workflow Orchestration Manager, HDInsight Kafka, Отправка заданий в кластер с помощью Flink CLI и CDC с Flink |
Spark | Jupyter Notebook, поддержка Delta lake 2.0, поддержка Zeppelin, поддержка ATS, поддержка интерфейса сервера журнала Yarn, отправка заданий с помощью SSH, отправка заданий с помощью пакета SDK и Машинное обучение Notebook |
Стратегия возможностей
Функция | Предполагаемая временная шкала выпуска | Состояние |
---|---|---|
Автомасштабирование — на основе нагрузки — Trino | Q1 2024 | Завершено |
Автоматическое масштабирование на основе автоматического масштабирования на основе балансировки нагрузки для Spark | Q2 2024 | Выполняется |
Обновление на месте | Q2 2024 | Завершено |
Поддержка зарезервированного экземпляра | Q2 2024 | Выполняется |
Проверка подлинности на основе MSI для хранилища метаданных (SQL) | Q1 2024 | Выполняется |
Spark 3.4 | Q2 2024 | Выполняется |
Трино 426 | Q1 2024 | Завершено |
Ranger для RBAC | Q2 2024 | Выполняется |
Поддержка режима приложения для Flink | Q1 2024 | Завершено |
Flink 1.17 | Q1 2024 | Завершено |
Поддержка Spark ACID | Q1 2024 | Выполняется |
Настраиваемые номера SKU для Headnode, SSH | Q2 2024 | Выполняется |
Поддержка шлюза Flink SQL | Q1 2024 | Завершено |
Частные кластеры для HDInsight в AKS | Q1 2024 | Завершено |
Поддержка Ranger для Spark SQL | Q4 2024 | Выполняется |
Списки управления доступом ranger на уровне хранилища | Q4 2024 | Выполняется |
Поддержка One Lake в качестве основного контейнера | Q2 2024 | Выполняется |