Mayo de 2021

Estas características y las mejoras de la plataforma de Azure Databricks se publicaron en mayo de 2021.

Nota:

Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.

Databricks Machine Learning: una solución nativa de datos y colaborativa para el ciclo de vida completo de ML

27 de mayo de 2021

El nuevo rol Machine Learning, que puede seleccionarse en la barra lateral de la interfaz de usuario de Azure Databricks, proporciona un acceso sencillo a un nuevo entorno especialmente creado para ML, incluido el registro de modelos y cuatro características nuevas en la versión preliminar pública:

  • Una nueva página del panel con recursos prácticos, recientes y vínculos de introducción.
  • Una nueva página de experimentos que centraliza la detección y administración de experimentos.
  • AutoML permite generar automáticamente modelos de ML a partir de datos y acelerar la ruta de acceso a producción.
  • El almacén de características permite catalogar características de ML y hacer que estén disponibles para el entrenamiento y el servicio, lo que aumenta la reutilización. Con una búsqueda de características basada en linaje de datos que aprovecha los orígenes de datos registrados automáticamente, puede hacer que las características estén disponibles para el entrenamiento y el servicio con una implementación de modelos simplificada que no requiere cambios en la aplicación cliente.

Para obtener más información, consulte IA y Machine Learning en Databricks.

Se ha cambiado el nombre de SQL Analytics a Databricks SQL

27 de mayo de 2021

Se ha cambiado el nombre de SQL Analytics a Databricks SQL. Para más información, consulte la nota de la versión Databricks SQL.

Creación y administración de canalizaciones ETL mediante Delta Live Tables (versión preliminar pública)

26 de mayo de 2021

Databricks presenta Delta Live Tables, un servicio en la nube que hace que el desarrollo de extracción, transformación y carga (ETL) sea sencillo, de confianza y escalable. Delta Live Tables:

  • Proporciona una interfaz declarativa intuitiva y familiar para compilar canalizaciones.
  • Permite supervisar canalizaciones de procesamiento de datos, visualizar dependencias y administrar canalizaciones y dependencias en distintos entornos.
  • Habilita el desarrollo controlado por pruebas, el cumplimiento de restricciones de calidad de datos y la aplicación de directivas uniformes de control de errores de datos.
  • Automatiza la implementación de las canalizaciones de procesamiento de datos para que se puedan actualizar, revertir y volver a procesar los datos de forma incremental fácilmente.

Consulta ¿Qué son las Delta Live Tables? para obtener más información.

Las máquinas virtuales de acceso puntual de Azure están en disponibilidad general

24 de mayo de 2021

La capacidad de crear clústeres de Azure Databricks con Azure Spot Virtual Machines está disponible con carácter general. Ahora puede aprovechar las ventajas de las instancias de Azure Spot de menor costo y reducir el costo total de propiedad (TCO) de Azure Databricks. Puede optar por usar instancias de Azure Spot cuando:

Cifrado de las consultas y el historial de consultas de Databricks SQL con su propia clave (versión preliminar pública)

20 de mayo de 2021

Para obtener más información, consulte las notas de la versión de Databricks SQL.

Aumento del límite del número de clústeres multiuso terminados

18 de mayo de 2021: versión 3.46

Ahora puede tener hasta 150 clústeres polivalentes terminados en un área de trabajo de Azure Databricks. Anteriormente, el límite era 120. Para más información, consulte Finalización de un proceso. El límite en el número de clústeres polivalentes finalizados devueltos por la solicitud de Clusters API también es ahora de 150.

Mayor límite para el número de clústeres anclados

18 de mayo de 2021: versión 3.46

Ahora se pueden tener hasta 70 clústeres anclados en un área de trabajo de Azure Databricks. Anteriormente el límite era 50. Para más información, consulte Anclaje de un proceso

Administración de dónde se almacenan los resultados del cuaderno (versión preliminar pública)

18 de mayo de 2021: versión 3.46

Ahora se puede optar por almacenar todos los resultados del cuaderno en la instancia raíz de Azure Storage independientemente del tamaño o el tipo de ejecución. De manera predeterminada, algunos resultados de cuadernos interactivos se almacenan en Azure Databricks. Una nueva configuración permite almacenar estos datos en la instancia raíz de Azure Storage en su propia cuenta. Para obtener más información, consulta Configurar la ubicación de almacenamiento de resultados del cuaderno.

Esta característica no afecta a los cuadernos que se ejecutan como trabajos, cuyos resultados siempre se almacenan en la instancia raíz de Azure Storage.

Cifrado de datos de cuadernos y secretos en el plano de control con su propia clave (versión preliminar pública)

10 de mayo de 2021

Un área de trabajo de Azure Databricks consta de un plano de control que se hospeda en una suscripción administrada por Azure Databricks y de un plano de proceso que se implementa en la suscripción de Azure. El plano de control almacena los datos de los servicios administrados, que incluyen comandos de cuaderno, secretos y otros datos de configuración del área de trabajo. De forma predeterminada, estos datos se cifran con una clave administrada por Azure Databricks, pero ahora puedes agregar una clave desde la instancia de Azure Key Vault para cifrar estos datos. Consulte Habilitación de claves administradas por el cliente para servicios administrados.

Finaliza el soporte técnico para la serie 7.4 de Databricks Runtime

3 de mayo de 2021

El soporte para Databricks Runtime 7.4, Databricks Runtime 7.4 para Machine Learning y Databricks Runtime 7.4 para Genomics finalizó el 3 de mayo. Consulte Ciclo de vida del soporte técnico de Databricks Runtime.

Los usuarios de repositorios ahora se pueden integrar con Azure DevOps mediante tokens de acceso personal

Del 3 al 10 de mayo de 2021: versión 3.45

Además de los tokens de acceso a Microsoft Entra ID, ahora puede usar un token de acceso personal para autenticarse con Azure DevOps. Para obtener más información, consulte Configuración de carpetas de Git (Repositorios) de Databricks.