Julio de 2020

Artículo
05/03/2024

Estas características y mejoras de la plataforma de Azure Databricks se publicaron en julio de 2020.

Nota:

Las versiones se publican por fases. Es posible que su cuenta de Azure Databricks no se actualice hasta una semana después de la fecha de lanzamiento inicial.

Terminal web (versión preliminar pública)

Del 29 de julio al 4 de agosto de 2020: versión 3.25

El terminal web proporciona una manera cómoda e muy interactiva para que los usuarios con el permiso CAN ATTACH TO en un clúster ejecuten comandos de shell, incluidos editores como Vim o Emacs. Entre los usos de ejemplo del terminal web se incluyen la supervisión del uso de recursos y la instalación de paquetes de Linux.

Para obtener más detalles, consulte Ejecución de comandos de shell en el terminal web de Azure Databricks.

Un nuevo marco de scripts de inicialización global que es más seguro (versión preliminar pública)

Del 29 de julio al 4 de agosto de 2020: versión 3.25

El nuevo marco de script de inicialización global aporta mejoras significativas sobre los scripts de inicialización globales heredados:

Los scripts init son más seguros y requieren permisos de administrador para las operaciones de creación, visualización y eliminación.
Los errores de inicio relacionados con scripts quedan registrados.
Puede establecer el orden de ejecución de varios scripts init.
Los scripts init pueden hacer referencia a variables de entorno relacionadas con el clúster.
Los scripts de inicialización se pueden crear y administrar mediante la página de configuración de administración o la nueva API de REST de scripts de inicialización globales.

Databricks recomienda migrar los scripts init globales heredados existentes al nuevo marco para aprovechar estas mejoras.

Para obtener más información, consulte Uso de scripts de inicialización globales.

Las listas de acceso de IP ahora son de disponibilidad general

Del 29 de julio al 4 de agosto de 2020: versión 3.25

La API de lista de acceso de IP ya está disponible con carácter general.

La versión de GA incluye un cambio, que es el cambio de nombre de los valores list_type:

WHITELIST a ALLOW
BLACKLIST a BLOCK

Use la API de lista de acceso de IP para configurar las áreas de trabajo de Azure Databricks, para que los usuarios se conecten al servicio solo a través de redes corporativas existentes con un perímetro seguro. Los administradores de Azure Databricks pueden usar la API de lista de acceso de IP para definir un conjunto de direcciones IP aprobadas, incluidas las listas de permitidas y bloqueadas. Todo el acceso entrante a la aplicación web y a las API de REST requiere que el usuario se conecte desde una dirección IP autorizada, lo que garantiza que no se puede acceder a las áreas de trabajo desde una red pública, como una cafetería o un aeropuerto, a menos que los usuarios usen VPN.

Esta característica requiere el plan Premium.

Para más información, consulte Configurar listas de acceso de IP para áreas de trabajo.

Nuevo cuadro de diálogo de carga de archivos

Del 29 de julio al 4 de agosto de 2020: versión 3.25

Ahora puede cargar archivos de datos tabulares pequeños (como CSV) y acceder a ellos desde un cuaderno, seleccionando Añadir datos en el menú Archivo del cuaderno. El código generado muestra cómo cargar los datos en Pandas o DataFrames. Los administradores pueden deshabilitar esta característica en la Pestaña avanzada Consola de administración.

Para obtener más información, consulte Examen de archivos en DBFS.

Mejoras en el filtro y la clasificación de SCIM API

Del 29 de julio al 4 de agosto de 2020: versión 3.25

La API de SCIM ahora incluye estas mejoras de filtrado y ordenación:

Los usuarios administradores pueden filtrar usuarios por el atributo active.
Todos los usuarios pueden ordenar los resultados mediante sortBy y los sortOrderparámetros de consulta. El valor predeterminado es ordenar por identificador.

Se han agregado regiones a Azure Government

25 de julio de 2020

Recientemente, Azure Databricks empezó a estar disponible en las regiones US Gov Arizona y US Gov Virginia, para entidades de la Administración pública de EE.UU. y sus asociados.

Disponibilidad general de Databricks Runtime 7.1

21 de julio de 2020

Databricks Runtime 7.1 ofrece muchas características y mejoras adicionales a Databricks Runtime 7.0, entre las que se incluyen:

Conector de Google BigQuery
Comandos de tipo %pip para administrar bibliotecas de Python instaladas en una sesión de cuaderno
Koalas instalado
Muchas mejoras de Delta Lake, entre las que se incluyen:
- Establecimiento de metadatos de confirmación definidos por el usuario
- Obtención de la versión de la última confirmación escrita por el actual SparkSession
- Conversión de tablas Parquet, creadas por Structured Streaming mediante el registro de transacciones _spark_metadata
- MERGE INTO mejoras de rendimiento

Para obtener más información, consulte las notas completas de la versión de Databricks Runtime 7.1 (sin soporte técnico).

Disponibilidad general de Databricks Runtime 7.1 ML

21 de julio de 2020

Databricks Runtime 7.1 para Machine Learning se basa en Databricks Runtime 7.1, y aporta las siguientes características nuevas y cambios en la biblioteca:

comandos "pip" y "conda magic", habilitados de manera predeterminada
spark-tensorflow-distributor: 0.1.0
pillow 7.0.0 -> 7.1.0
pytorch 1.5.0 -> 1.5.1
torchvision 0.6.0 -> 0.6.1
horovod 0.19.1 -> 0.19.5
mlflow 1.8.0 -> 1.9.1

Para más información, consulte las notas completas de la versión de Databricks Runtime 7.1 for ML (sin soporte técnico).

Disponibilidad general de Databricks Runtime 7.1 para Genomics

21 de julio de 2020

Databricks Runtime 7.1 para Genomics se basa en Databricks Runtime 7.1, y ofrece las siguientes características nuevas:

Transformación LOCO
Función de cambio de forma en la salida de GloWGR
Alineaciones no alineadas de salidas de RNASeq