Junio de 2021

Estas características y mejoras de la plataforma Azure Databricks se publicaron en junio de 2021.

Nota:

Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.

Corrección: Repos para Git está habilitado de forma predeterminada en áreas de trabajo nuevas y existentes en algunas regiones

30 de junio de 2021

En una nota de versión del 2 de junio de 2021, Databricks anunció que Repos para Git está habilitado de forma predeterminada en las nuevas áreas de trabajo de algunas regiones, pero omitió los siguientes detalles importantes: Repos para Git también está habilitado en las áreas de trabajo existentes si el control de versiones de Git de cuaderno ya está habilitado. Se ha actualizado la nota de versión original.

Cambio a los permisos del almacén de características

Del 28 de junio al 6 de julio de 2021: versión 3.49

Los usuarios con permiso CAN_VIEW_METADATA en una tabla de características ahora pueden publicarla en tiendas en línea.

Acceso mejorado a los resultados de la tabla de ejecuciones de MLflow

Del 28 de junio al 6 de julio de 2021: versión 3.49

Los cambios en la tabla de ejecuciones de MLflow proporcionan un acceso más rápido a los resultados.

  • Las columnas Métricas ahora aparecen antes que las columnas Parámetros, lo que facilita la identificación de la mejor ejecución.
  • La columna Hora de inicio muestra ahora la antigüedad de la ejecución, no la hora de inicio. Esto reduce el ancho de la columna y permite que más información sea visible sin desplazamiento horizontal. Para mostrar la hora de inicio, mantenga el puntero sobre el valor de la columna.

Colocar cursor sobre la hora de inicio

Mejor visibilidad de los costos de Delta Live Tables

Del 28 de junio al 6 de julio de 2021: versión 3.49

Al crear una nueva canalización o ver la interfaz de usuario de Pipeline Details (Detalles de la canalización), ahora verá la DBU por hora del clúster predeterminado de Delta Live Tables.

Restricciones de calidad de datos mejoradas para Delta Live Tables

Del 28 de junio al 6 de julio de 2021: versión 3.49

Ahora puede usar las API expect_all_or_fail, expect_all_or_drop y expect_all de Python para definir varias restricciones de calidad de datos en conjuntos de datos de Delta Live Tables. Estas API son útiles al aplicar una biblioteca de expectativas comunes a uno o varios conjuntos de datos de una canalización. Para obtener más información, consulte Administración de la calidad de los datos con Delta Live Tables.

Cambios en la API para actualizar y reemplazar listas de direcciones IP

Del 28 de junio al 6 de julio de 2021: versión 3.49

Una nueva operación PATCH para /ip-access-lists/<list-id> en la API REST 2.0 de Databricks permite actualizar mediante programación los valores individuales de una lista de direcciones IP existente. Para más información, consulte Actualización de una lista de acceso IP.

La operación PUT existente para /ip-access-lists/<list-id> en la API REST de Databricks 2.0 permite reemplazar mediante programación el contenido de una lista de direcciones IP existentes mientras se mantiene el identificador interno original de la lista. Para más información, consulte Reemplazo de una lista de acceso IP.

Controlador ODBC de Databricks 2.6.17

22 de junio de 2021

Se ha publicado la versión 2.6.17 del controlador ODBC de Databricks (descargar). Esta versión agrega compatibilidad con Cloud Fetch, que es un mecanismo para capturar datos en paralelo mediante almacenamiento en la nube para llevar los datos más rápidamente a las herramientas de BI. Esta versión también reduce la latencia al eliminar los recorridos de ida y vuelta innecesarios entre el cliente y Databricks Runtime. Consulte Cómo se logra la conectividad de alto ancho de banda con herramientas de BI.

Fin del soporte técnico de la serie 7.5 de Databricks Runtime

16 de junio de 2021

La compatibilidad con Databricks Runtime 7.5, Databricks Runtime 7.5 para Machine Learning y Databricks Runtime 7.5 para Genomics finalizó el 16 de junio. Consulte Ciclo de vida del soporte técnico de Databricks Runtime.

Optimización del rendimiento y control de costos mediante el uso de grupos diferentes para el nodo del controlador y los nodos de trabajo

Del 14 al 21 de junio de 2021: versión 3.48

Ahora puede optimizar el clúster asociando el nodo de controlador y los nodos de trabajo a un grupo diferente. Por ejemplo, puede usar un grupo optimizado para proceso para el nodo de controlador y un grupo optimizado para almacenamiento para los nodos de trabajo. Esto también ayuda a controlar los costos al asignarse etiquetas diferentes a cada grupo de instancias. Si opta por hacer esto, puede usar el mismo grupo para nodos de controlador y de trabajo.

Para obtener más información, vea Referencia de configuración del grupo.

Permisos de nivel de registro para el registro de modelos

Del 14 al 21 de junio de 2021: versión 3.48

Ahora puede establecer permisos de modelo predeterminados para todos los modelos en el Registro de modelos de un área de trabajo. Los permisos establecidos en este nivel se aplican a todos los modelos nuevos y existentes registrados en el Registro de modelos en ese área de trabajo. Para más información, consulte ACL de modelo de MLFlow.

El directorio principal de un usuario ya no está protegido cuando se elimina un usuario mediante la API SCIM

Del 14 al 21 de junio de 2021: versión 3.48

Cuando se elimina un usuario mediante SCIM API, el directorio principal del usuario ya no está protegido y un administrador del área de trabajo puede eliminarlo. Este comportamiento coincide con lo que sucede cuando se elimina un usuario mediante la consola de administración.

Databricks Runtime 8.3 y 8.3 ML están disponibles con carácter general; 8.3 Photon está disponible en versión preliminar pública

8 de junio de 2021

Databricks Runtime 8.3 y 8.3 ML ahora están disponibles con carácter general. 8.3 Photon está disponible en versión preliminar pública.

Para obtener información, consulte las notas completas de la versión en Databricks Runtime 8.3 (sin soporte técnico) y Databricks Runtime 8.3 para ML (sin soporte técnico).

Control de acceso a tablas de Python y SQL (GA)

8 de junio de 2021

El control de acceso a tablas permite conceder y revocar el acceso a los datos mediante programación con el modelo de control de acceso basado en vista de Azure Databricks. El control de acceso a tablas está disponible en dos versiones: solo SQL y Python y SQL. Anteriormente únicamente el control de acceso a tablas de solo SQL estaba disponible con carácter general. Ahora también lo está el control de acceso a tablas de Python y SQL. Consulte Habilitación del control de acceso de la tabla de metastore de Hive en un clúster (heredado).

La interfaz de usuario y la API de trabajos ahora muestran el propietario de una ejecución de trabajo

Del 2 al 7 de junio de 2021: versión 3.47

La interfaz de usuario y la API de trabajos ahora incluyen el usuario con el que se ejecutará un trabajo, lo que facilita comprender, depurar y auditar los permisos de trabajo. Se trata de un valor de solo lectura establecido en el creador del trabajo si el control de acceso a trabajos está deshabilitado o en el permiso is_owner del trabajo si el control de acceso a trabajos está habilitado. Para más información sobre cómo administrar permisos de trabajo, consulte Control del acceso a un trabajo.

Protección de las propiedades de configuración confidenciales de Spark y las variables de entorno mediante secretos (versión preliminar pública)

7 de junio de 2021

Puede proteger las propiedades de configuración confidenciales de Spark y las variables de entorno mediante secretos. Los secretos recuperados se eliminan de la salida del cuaderno y de los registros del controlador y del ejecutor de Spark. Consulte Secretos.

Si actualmente usa contraseñas de texto no cifrado en una configuración de Spark, Databricks recomienda rotar las contraseñas y usar rutas de acceso a secretos en la configuración de Spark.

Repos para Git está habilitado de forma predeterminada en áreas de trabajo nuevas y existentes en algunas regiones

2 de junio de 2021

Esta nota de versión se actualizó el 30 de junio de 2021.

Para las áreas de trabajo nuevas y existentes que tengan habilitado el control de versiones de Git de cuaderno, Repos para Git ahora está habilitado de forma predeterminada en algunas regiones. La habilitación predeterminada de Repos se implementará en más regiones en los próximos meses. Para aprender a habilitar o deshabilitar Repos usted mismo, y para verificar la configuración de su área de trabajo, consulte Integración de Git con las carpetas de Git de Databricks.

Rediseño de la interfaz de usuario de configuración del área de trabajo

Del 2 al 7 de junio de 2021: versión 3.47

La nueva pestaña Workspace Settings (Configuración del área de trabajo) de la consola de administración reemplaza las pestañas Workspace Storage (Almacenamiento del área de trabajo), Access Control Lists (Listas de control de acceso) y Advanced (Opciones avanzadas) para agilizar la configuración del área de trabajo.

Actualizaciones de tokens y expirados y consultas de base de datos

Del 2 al 7 de junio de 2021: versión 3.47

Las consultas de base de datos ListTokens o ListAllTokens ya no devuelven tokens expirados. Se devuelven tokens indefinidos (aquellos con expiryTime establecido en -1).

Ahora es necesaria confirmación al conceder o revocar permisos de administrador

Del 2 al 7 de junio de 2021: versión 3.47

Ahora aparece un cuadro de diálogo de confirmación cuando un usuario administrador concede o revoca privilegios de administrador en la interfaz de usuario web.

Cambios en los métodos abreviados de teclado en la interfaz de usuario web

Del 2 al 7 de junio de 2021: versión 3.47

En un cuaderno, la manera de abrir la lista de métodos abreviados de teclado ha cambiado. Para abrir la lista, haga clic en el icono Icono de teclado.