Agosto de 2020

Artículo
03/14/2024

Estas características y las mejoras de la plataforma Azure Databricks se publicaron en agosto de 2020.

Nota:

Las versiones se publican por fases. Es posible que su cuenta de Azure Databricks no se actualice hasta una semana después de la fecha de lanzamiento inicial.

Importante

La versión 3.26 se ha publicado únicamente para los clientes de las regiones Centro de Canadá y Centro de la India. Todas las demás regiones tendrán las características de la versión 3.26 cuando se lance la versión 3.27.

Token Management API es GA y los administradores pueden utilizar la consola de administración para conceder y revocar el acceso a los tokens a los usuarios

26 de agosto - 1 de septiembre de 2020: versión 3.27

La administración de tokens ya está disponible con carácter general. Los administradores de Azure Databricks pueden usar la API Token Management y la consola de administración para administrar los tokens de acceso personal de los usuarios de Azure Databricks. Como administrador, puede hacer lo siguiente:

Supervisar y revocar los tokens de acceso personal de los usuarios.
Controlar la vigencia de los tokens futuros en el área de trabajo.
Controlar qué usuarios pueden crear y usar tokens con la API Permissions 2.0 o en la consola de administración.

En la transición de la versión preliminar pública a la versión en disponibilidad general, el parámetro created_by de la API Token Management se cambió a created_by_id y se agregó el nuevo parámetro created_by_username.

Para obtener más información, vea Supervisar y administrar tokens de acceso personal.

Aumento de los límites en el tamaño de los mensajes para aplicaciones de Shiny

26 de agosto - 1 de septiembre de 2020: versión 3.27

Se ha aumentado el tamaño máximo de aplicación para las aplicaciones de Shiny de 10 MB a 20 MB. Si el tamaño total de la aplicación supera este límite, consulte las recomendaciones que se proporcionan en las preguntas más frecuentes sobre Shiny.

Instrucciones mejoradas para configurar un clúster en modo local

26 de agosto - 1 de septiembre de 2020: versión 3.27

En la interfaz de usuario del clúster:

Si crea un clúster con 0 nodos de trabajo, aparece un mensaje de información sobre herramientas que recomienda usar el modo local y muestra la configuración asociada (spark.master local[*]).
Ya no se puede establecer spark.master local[*] para un clúster, a menos que el clúster tenga 0 nodos de trabajo.

Visualización de la versión del cuaderno asociada a una ejecución

26 de agosto - 1 de septiembre de 2020: versión 3.27

En la barra lateral Experiments (Experimentos), ahora se puede mostrar la versión de un cuaderno asociado a una ejecución. Para obtener más información, consulte Visualización del experimento de cuaderno.

Databricks Runtime 7.2 GA

20 de agosto de 2020

Databricks Runtime 7.2 ofrece muchas características y mejoras adicionales a Databricks Runtime 7.1, entre las que se incluyen:

Auto Loader está disponible con carácter general: Auto Loader es un método eficaz para ingerir de forma incremental una gran cantidad de archivos en Delta Lake. Ahora está disponible con carácter general y agrega las siguientes características:
- Opción de modo de enumeración de directorios: Auto Loader agrega un nuevo modo de enumeración de directorios, además del modo de notificación de archivos actual, para determinar cuándo hay nuevos archivos.
- API de administración de recursos en la nube: ahora puede usar la API Scala para administrar los recursos en la nube que haya creado Auto Loader. Puede usar esta API para enumerar los servicios de notificación y desglosar servicios de notificación específicos.
- Opción de limitación de la frecuencia: ahora puede usar la opción cloudFiles.maxBytesPerTrigger para limitar la cantidad de datos procesados en cada microlote.
- Validación de opciones: Auto Loader ahora valida las opciones que proporcione.validation producirá un error. Para omitir la validación de opciones, establezca cloudFiles.validateOptions en false.
Copia eficaz de una tabla de Delta con el comando clone.
Mejoras:
- El conector Snowflake se ha actualizado a la versión 2.8.1, que incluye compatibilidad con Spark 3.0.
- Mejoras en las credenciales transferidas.
- Mejoras de TensorBoard.
- Bibliotecas de Python y R actualizadas.

Para más información, consulte las notas completas de la versión de Databricks Runtime 7.2 (sin soporte técnico).

Runtime 7.2 ML GA

20 de agosto de 2020

Databricks Runtime 7.2 for Machine Learning se basa en Databricks Runtime 7.2 e incorpora bibliotecas del sistema y de Python nuevas y mejoradas. Para más información, consulte las notas completas de la versión de Databricks Runtime 7.2 (sin soporte técnico).

Databricks Runtime 7.2 para Genomics GA

20 de agosto de 2020

Databricks Runtime 7.2 for Genomics se basa en Databricks Runtime 7.2 y acelera considerablemente la conversión de matrices ndarray de literales numpy 1D y 2D de tipo float en matrices de Java. En la documentación del estudio de asociación del genoma de Glow, se explica el uso.

Permissions API (versión preliminar pública)

18 de agosto de 2020

Databricks se complace en anunciar la versión preliminar pública de la API Permissions, que permite administrar permisos para:

Tokens
Clústeres
Grupos
Trabajos
Cuaderno
Carpetas (directorios)
Modelos registrados de MLflow

Para obtener más información, consulte API Permissions.

Databricks Connect 7.1 (GA)

12 de agosto de 2020

Databricks Connect ahora admite Databricks Runtime 7.1.

En Databricks Runtime 7.1, Databricks recomienda usar siempre la versión más reciente de Databricks Connect.

Orden de instalación repetible de las bibliotecas de clústeres

12-25 de agosto de 2020: versión 3.26

En un clúster que ejecute Databricks Runtime 7.2 o posterior, Azure Databricks ahora procesa todas las bibliotecas del clúster en el orden en el que se instalaron.

Creación de un modelo desde la página de modelos registrados de MLflow (versión preliminar pública)

12-25 de agosto de 2020: versión 3.26

Ahora puede crear un nuevo modelo desde la página de modelos registrados de MLflow. Para obtener más información, consulte Creación de un modelo inscrito y asignación de un modelo registrado al mismo.

Databricks Container Services admite imágenes de GPU

12-25 de agosto de 2020: versión 3.26

Ahora puede usar Databricks Container Services en clústeres con GPU para crear entornos de aprendizaje profundo portables con bibliotecas personalizadas.

Para más información, vea Databricks Container Services en el proceso de GPU.

Agosto de 2020

Token Management API es GA y los administradores pueden utilizar la consola de administración para conceder y revocar el acceso a los tokens a los usuarios

Aumento de los límites en el tamaño de los mensajes para aplicaciones de Shiny

Instrucciones mejoradas para configurar un clúster en modo local

Visualización de la versión del cuaderno asociada a una ejecución

Databricks Runtime 7.2 GA

Runtime 7.2 ML GA

Databricks Runtime 7.2 para Genomics GA

Permissions API (versión preliminar pública)

Databricks Connect 7.1 (GA)

Orden de instalación repetible de las bibliotecas de clústeres

Creación de un modelo desde la página de modelos registrados de MLflow (versión preliminar pública)

Databricks Container Services admite imágenes de GPU

Recursos adicionales