Enero de 2020

Estas características y mejoras de la plataforma de Azure Databricks se publicaron en enero de 2020.

Nota:

Las versiones se publican por fases. Es posible que su cuenta de Azure Databricks no se actualice hasta una semana después de la fecha de lanzamiento inicial.

Este mes se ha visto el lanzamiento de las versiones 3.9 y 3.11 de la plataforma Azure Databricks. No hubo ningún lanzamiento de las versiones 3.10 ni 3.8. La versión 3.7 solo era una versión de estabilidad y de corrección de errores.

Próximamente: las etiquetas del área de trabajo, grupo y clúster se propagarán a los detalles de uso de DBU y a las máquinas virtuales de Azure para mejorar los informes de administración de costos

El 10 de febrero, se publicará la propagación de etiquetas en los detalles de uso de Azure Databricks y máquinas virtuales de Azure. La nueva característica de propagación de etiquetas combina las etiquetas de área de trabajo de Azure Databricks (es decir, las etiquetas de grupo de recursos), etiquetas de grupo y etiquetas de clúster, y las propaga a los detalles de uso de la DBU de Databricks y a las máquinas virtuales de Azure como etiquetas de recursos. Podrá ver la información de etiquetas combinadas en el portal de Azure Cost Management y en las exportaciones de detalles de uso, lo que le proporcionar mayor visibilidad sobre el uso de Azure Databricks (costo total de propiedad) y la atribución precisa a unidades de negocio y equipos.

Azure Databricks y Azure Lighthouse ya pueden residir en la misma suscripción

29 de enero de 2020

Todas las áreas de trabajo de Azure Databricks existentes se han migrado del uso de bloqueos administrados a asignaciones de denegación. Todas las áreas de trabajo nuevas creadas tendrán asignaciones de denegación. Esto no cambia ningún comportamiento existente y el nivel de seguridad sigue siendo el mismo. Aunque puede incorporar suscripciones que usan Azure Databricks, los usuarios del inquilino de administración no pueden iniciar áreas de trabajo de Azure Databricks en una suscripción delegada en este momento.

Disponibilidad general de Databricks Runtime 6.3 para Genomics

22 de enero de 2020

Databricks Runtime 6.3 para Genomics se basa en Databricks Runtime 6.3. Incluye muchas mejoras y actualizaciones de Databricks Runtime 6.2 para Genomics.

Las características clave son las siguientes:

  • Compatibilidad con tablas Delta como entrada para la canalización de genotipo conjunta
  • Análisis automático de anotaciones al leer archivos VCF
  • Divisor mejorado de variantes multialélicas
  • Funciones más rápidas de regresión lineal y logística

Para más información, consulte las notas completas de la versión de Databricks Runtime 6.3 para Genomics (sin soporte técnico).

Disponibilidad general de Databricks Runtime 6.3 para ML

22 de enero de 2020

Databricks Runtime 6.3 ML GA ofrece muchas actualizaciones de bibliotecas, entre las que se incluyen:

  • PyTorch: de 1.3.0 a 1.3.1
  • torchvision: de 0.4.1 a 0.4.2
  • MLflow: de 1.4.0 a 1.5.0
  • Hyperopt: de 0.2.1 a 0.2.2

Para obtener más información, consulte las notas completas de la versión de Databricks Runtime 6.3 for ML (sin soporte técnico).

Disponibilidad general de Databricks Runtime 6.3

22 de enero de 2020

Databricks Runtime 6.3 GA ofrece nuevas características, mejoras y muchas correcciones de errores.

Esta versión introduce una simultaneidad mejorada. Las características clave son las siguientes:

  • Simultaneidad mejorada para todas las operaciones de Delta Lake
  • Compatibilidad mejorada con la compactación de archivos
  • Rendimiento mejorado para la combinación de solo inserción

Para más información, consulte las notas completas de la versión de Databricks Runtime 6.3 (sin soporte técnico).

Almacenamiento en caché de disco habilitado de manera predeterminada

Del 7 al 14 de enero de 2020 (versión 3.9)

El almacenamiento en caché de disco ahora está habilitado de manera predeterminada en las instancias de la serie Lsv2 para todas las versiones de Databricks Runtime compatibles. ConsulteUso del almacenamiento en caché de disco.

El paso de escalado automático estándar del clúster ahora es configurable

Del 7 al 14 de enero de 2020 (versión 3.9)

De forma predeterminada, el primer paso del escalado automático estándar agrega 8 nodos. Ahora puede establecer el valor del paso en la configuración de Spark del clúster. Consulte Configuración de clústeres.

SCIM API admite la paginación en los métodos Get Users y Get Groups (versión preliminar pública)

Del 7 al 14 de enero de 2020 (versión 3.9)

La API de SCIM ahora admite la paginación en los métodos Get Users y Get Groups. Al especificar los parámetros de consulta startIndex y count, SCIM devolverá un subconjunto de usuarios o grupos. El parámetro startIndex es el índice basado en 1 del primer resultado. El parámetro count es el número máximo de usuarios o grupos que se devolverán. De esta forma se garantiza la escalabilidad del cliente de SCIM y simplifica a los administradores de Azure Databricks las llamadas a SCIM. Consulte SCIM API 2.0.

El ancho de los carriles del explorador de archivos ha aumentado a 240 px

Del 7 al 14 de enero de 2020 (versión 3.9)

La anchura mayor reduce la necesidad de pasar el mouse sobre los objetos para ver el nombre de archivo completo.

Finaliza la compatibilidad con Databricks Runtime 3.5 LTS

2 de enero de 2020

La compatibilidad con Databricks Runtime 3.5 LTS (soporte técnico a largo plazo) finalizó el 2 de enero. Consulte Ciclo de vida del soporte técnico de Databricks.