¿Qué hay de nuevo en HDInsight en AKS? (versión preliminar)
Nota:
Retiraremos Azure HDInsight en AKS el 31 de enero de 2025. Antes del 31 de enero de 2025, deberá migrar las cargas de trabajo a Microsoft Fabric o un producto equivalente de Azure para evitar la terminación repentina de las cargas de trabajo. Los clústeres restantes de la suscripción se detendrán y quitarán del host.
Solo estará disponible el soporte técnico Basic hasta la fecha de retirada.
Importante
Esta funcionalidad actualmente está en su versión preliminar. En Términos de uso complementarios para las versiones preliminares de Microsoft Azure encontrará más términos legales que se aplican a las características de Azure que están en versión beta, en versión preliminar, o que todavía no se han lanzado con disponibilidad general. Para más información sobre esta versión preliminar específica, consulte la Información de Azure HDInsight sobre la versión preliminar de AKS. Para plantear preguntas o sugerencias sobre la característica, envíe una solicitud en AskHDInsight con los detalles y síganos para obtener más actualizaciones sobre Comunidad de Azure HDInsight.
En HDInsight en AKS, todas las operaciones y administración de clústeres tienen compatibilidad nativa con la administración de servicios en Azure Portal para clústeres individuales.
En HDInsight en AKS, se presentan dos nuevos conceptos:
- Los grupos de clústeres se usan para agrupar y administrar clústeres.
- Los clústeres se usan para los procesos de código abierto, se hospedan dentro de un grupo de clústeres.
Grupos de clústeres
HDInsight en AKS se ejecuta en Azure Kubernetes Service (AKS). El recurso de nivel superior es el grupo de clústeres y administra todos los clústeres que se ejecutan en el mismo clúster de AKS. Cuando se crea un grupo de clústeres, se crea al mismo tiempo un clúster de AKS subyacente para hospedar todos los clústeres del grupo. Los grupos de clústeres son una agrupación lógica de clústeres que ayuda a crear una interoperabilidad sólida entre varios tipos de clústeres y permite a las empresas tener los clústeres en la misma red virtual. Los grupos de clústeres proporcionan un acceso rápido y rentable a todos los tipos de clústeres creados bajo demanda y a escala. Un grupo de clústeres corresponde a un clúster en la infraestructura AKS.
Clústeres
Los clústeres son cargas de trabajo de proceso de código abierto individuales, como Apache Spark, Apache Flink y Trino, que se pueden crear rápidamente en pocos minutos con configuraciones preestablecidas y pocos clics. Aunque se ejecuta en el mismo grupo de clústeres, cada clúster puede tener sus propias configuraciones, como el tipo de clúster, la versión, el tamaño de máquina virtual del nodo, el número de nodos. Los clústeres se ejecutan en recursos de proceso separados con su propio DNS y puntos de conexión.
Características actualmente en versión preliminar
En la siguiente lista de tablas se muestran las características de HDInsight en AKS que se encuentran actualmente en versión preliminar. Las características de vista previa se ordenan alfabéticamente.
Área | Características |
---|---|
Aspectos básicos | Crear grupos y clústeres mediante el portal, compatibilidad con shell seguro (ssh) web, posibilidad de elegir el número de nodos de trabajo durante la creación del clúster |
Storage | Compatibilidad con el almacenamiento de ADLS Gen2 |
Metastore | Compatibilidad externa con Metastore para Trino, Spark y Flink, integración con HDInsight |
Seguridad | Compatibilidad con RBAC de ARM, compatibilidad con la autenticación basada en MSI, opción para proporcionar acceso al clúster a otros usuarios |
Registro y supervisión | Agregación de registros en análisis de registros de Azure, para registros de servidor, Métricas de clúster y servicio a través de Prometheus y Grafana administrado, Métricas de servidor de soporte en Azure Monitor, Página de estado del servicio para supervisar el Estado del servicio |
Escalado automático | Escala automática basada en la carga y Escala automática basada en la programación |
Personalización y configuración de clústeres | Compatibilidad con acciones de script durante la creación del clúster, Compatibilidad con la administración de bibliotecas, Ajustes de configuración del servicio tras la creación del clúster |
Trino | Compatibilidad con los catálogos de Trino, Compatibilidad con la CLI de Trino, Compatibilidad de DBeaver con el envío de consultas, Agregar o quitar complementos y conectores, Compatibilidad con eventos de registro de consultas, Compatibilidad con estadísticas de consulta de examen para cualquier conector en el panel de Trino, Compatibilidad con el panel de Trino para supervisar consultas, Almacenamiento en caché de consultas, Integración con Power BI, Integración con Apache Superset, Redash, Compatibilidad con varios conectores |
Flink | Compatibilidad con la interfaz de usuario web nativa de Flink, Compatibilidad de Flink con HMS para DStream, Envío de trabajos al clúster mediante API de REST y Azure Portal, Ejecución de programas empaquetados como archivos JAR a través de la CLI de Flink, Compatibilidad con Puntos de retorno persistentes, Compatibilidad con la actualización de las opciones de configuración cuando el trabajo se está ejecutando, Conexión a varios servicios de Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Administrador de orquestación de flujo de trabajo de Azure Data Factory, HDInsight Kafka, Envío de trabajos al clúster mediante CLI de Flink y CDC con Flink |
Spark | Jupyter Notebook, Compatibilidad con Delta lake 2.0, Compatibilidad con Zeppelin, Compatibilidad con ATS, Compatibilidad con la interfaz de servidor Yarn History, Envío de trabajos mediante SSH, Envío de trabajos mediante SDK y Machine Learning Notebook |
Plan de desarrollo de características
Característica | Escala de tiempo de lanzamiento estimada | Estado |
---|---|---|
Escala automática - Basado en Carga - Trino | T1 2024 | Completado |
Escalado automático basado en la carga aleatoria para Spark | T2 2024 | En curso |
Actualización local | T2 2024 | Completado |
Compatibilidad con instancias reservadas | T2 2024 | En curso |
Autenticación basada en MSI para Metastore (SQL) | T1 2024 | En curso |
Spark 3.4 | T2 2024 | En curso |
Trino 426 | T1 2024 | Completado |
Ranger para RBAC | T2 2024 | En curso |
Compatibilidad con el modo de aplicación para Flink | T1 2024 | Completado |
Flink 1.17 | T1 2024 | Completado |
Compatibilidad con Spark ACID | T1 2024 | En curso |
SKU configurables para Headnode, SSH | T2 2024 | En curso |
Compatibilidad con la puerta de enlace de SQL de Flink | T1 2024 | Completado |
Clústeres privados para HDInsight en AKS | T1 2024 | Completado |
Compatibilidad de Ranger con Spark SQL | T4 2024 | En curso |
ACL de Ranger en la capa de almacenamiento | T4 2024 | En curso |
Compatibilidad con One Lake como contenedor principal | T2 2024 | En curso |