Agosto de 2021

Estas características y las mejoras de la plataforma Azure Databricks se publicaron en agosto de 2021.

Nota:

Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.

GA de Databricks Repos

31 de agosto de 2021

Databricks Repos ahora está disponible con carácter general. Con Repos puede crear repositorios Git o clonar otros ya existentes en Azure Databricks, trabajar con cuadernos en estos repositorios, seguir los procedimientos recomendados de colaboración y desarrollo basados en Git e integrar sus flujos de trabajo de CI/CD con API de Repos. Databricks Repos se integra con GitHub, Bitbucket, GitLab y Azure DevOps. Para más detalles, consulte Integración de Git con carpetas Git de Databricks y API de Repos.

Mayor tiempo de espera para trabajos de cuadernos de larga ejecución

23-30 de agosto de 2021: versión 3.53

Ahora puede ejecutar trabajos de flujo de trabajo de cuaderno que tarden hasta 30 días en completarse. Anteriormente, solo se admitían trabajos de flujo de trabajo de cuaderno que tardaran un máximo de 48 horas en completarse. Consulte Ejecución de un cuaderno de Databricks desde otro cuaderno para más información.

Mejoras de escalabilidad y estabilidad del servicio de trabajos

23-30 de agosto de 2021: versión 3.53

Los siguientes cambios aumentan la estabilidad y escalabilidad del servicio Trabajos:

  • A cada ejecución y trabajo nuevos se les asigna un identificador único, numérico y no secuencial de mayor longitud. Los clientes que usan la API de trabajos y dependen de una longitud de identificador fija o de identificadores secuenciales o de aumento monótono deben modificarse para aceptar identificadores que sean más largos, no secuenciales y desordenados. El tipo de identificador de int64 no sufre cambios; además, se mantiene la compatibilidad con los clientes que usan números de punto flotante IEEE 754 de 64 bits, como los clientes de JavaScript.
  • El valor del campo number_in_job, que se incluye en la respuesta a algunas solicitudes de la API de trabajos, ahora se establece en el mismo valor que run_id.

Nota:

Esta característica se ha retrasado hasta febrero de 2022.

Los derechos de usuario concedidos por la pertenencia a grupos se muestran en la consola de administración

23-30 de agosto de 2021: versión 3.53

Los derechos de usuario concedidos por la pertenencia a grupos ahora se muestran con relación a cada usuario en la pestaña "Usuarios" de la consola de administración.

Administración de permisos de experimentos de MLflow (versión preliminar pública)

23-30 de agosto de 2021: versión 3.53

Ahora puede administrar los permisos de un experimento de MLflow desde la página del experimento. Para más detalles, consulte Cambio de los permisos del experimento.

Creación de trabajos mejorada a partir de cuadernos

23-30 de agosto de 2021: versión 3.53

Ahora puede editar y clonar trabajos asociados a un cuaderno. Para obtener más información, consulte Creación y administración de trabajos de cuaderno programados.

Máquinas virtuales de la serie Ddsv4 (versión preliminar pública)

23-30 de agosto de 2021: versión 3.53

Azure Databricks ahora es compatible con máquinas virtuales de la serie Ddsv4. Para obtener más información sobre estas máquinas virtuales, consulte Series Ddv4 y Ddsv4.

Compatibilidad mejorada para contraer encabezados de cuaderno

23-30 de agosto de 2021: versión 3.53

Ahora puede contraer o expandir todos los encabezados contraíbles en un cuaderno. Anteriormente, solo podía contraer o expandir un solo encabezado a la vez. Para obtener más información, consulte Encabezados contraíbles.

Databricks Runtime 9.0 y 9.0 ML están disponibles con carácter general; 9.0 Photon está disponible en versión preliminar pública

17 de agosto de 2021

Databricks Runtime 9.0 y 9.0 ML ahora están disponibles con carácter general. 9.0 Photon está disponible en versión preliminar pública.

Para obtener información, consulte las notas completas de la versión en Databricks Runtime 9.0 (sin soporte técnico) y Databricks Runtime 9.0 para ML (sin soporte técnico).

Databricks Runtime 9.0 (versión beta)

10 de agosto de 2021

Databricks Runtime 9.0 y Databricks Runtime 9.0 ML ahora están disponibles en versión beta.

Para obtener información, consulte las notas completas de la versión en Databricks Runtime 9.0 (sin soporte técnico) y Databricks Runtime 9.0 para ML (sin soporte técnico).

Administración de repositorios mediante programación con la CLI de Databricks (versión preliminar pública)

9-16 de agosto de 2021: versión 3.52

Ahora puede administrar repositorios de Git remotos mediante la interfaz de la línea de comandos (CLI) de Databricks. Consulte la CLI de Repos (heredada).

Administración de repositorios mediante programación con la API REST de Databricks (versión preliminar pública)

9-16 de agosto de 2021: versión 3.52

Ahora puede administrar repositorios de Git remotos mediante la API de REST de Databricks. Consulta API de Repos.

Fin del soporte técnico de la serie 7.6 de Databricks Runtime

8 de agosto de 2021

El soporte para Databricks Runtime 7.6, Databricks Runtime 7.6 para Machine Learning y Databricks Runtime 7.6 para Genomics finalizó el 8 de agosto. Consulte Ciclo de vida del soporte técnico de Databricks Runtime.

Los eventos de auditoría se registran al interactuar con Databricks Repos

9-13 de agosto de 2021: versión 3.52

Cuando está habilitado el registro de auditoría, ahora se registra un evento de auditoría al crear, actualizar o eliminar un repositorio de Databricks, al enumerar todos los repositorios de Databricks asociados a un área de trabajo y al sincronizar los cambios entre un repositorio de Databricks y otro remoto. Para más información, consulte Eventos de carpeta de Git.

Flujo de trabajo de administración y creación de trabajos mejorado

9-13 de agosto de 2021: versión 3.52

Ahora puede ver y administrar los trabajos asociados a un cuaderno. En concreto, puede iniciar la ejecución de un trabajo, ver la ejecución en curso o más reciente, pausar o reanudar la programación del trabajo y eliminarlo.

Se ha revisado la interfaz de usuario de creación de trabajos de cuaderno y se han agregado nuevas opciones de configuración. Para obtener más información, consulte Creación y administración de trabajos de cuaderno programados.

Los entornos de ejecución de Photon ya están disponibles (versión preliminar pública)

9-13 de agosto de 2021: versión 3.52

Photon es el nuevo motor vectorizado nativo de Azure Databricks, directamente compatible con API de Apache Spark. Para aprovisionar clústeres con Photon, debe usar una imagen de Photon.

Instrucciones simplificadas para establecer las credenciales de Git (versión preliminar pública)

9-13 de agosto de 2021: versión 3.52

Se han simplificado las instrucciones de la pestaña "Integración de Git" de la página "Configuración de usuario".

Importación de varios cuadernos en formato

9-13 de agosto de 2021: versión 3.52

Ahora puede importar varios cuadernos en formato .html en un archivo .zip. Anteriormente, solo podía importar un único cuaderno en formato .html a la vez.

El archivo .zip puede contener carpetas y cuadernos en formato .html o en formato de archivo de origen (Python, Scala, SQL o R). Un archivo .zip no puede incluir ambos formatos.

Mejoras en la facilidad de uso de Delta Live Tables

9-13 de agosto de 2021: versión 3.52

Esta versión incluye las siguientes mejoras del entorno de ejecución y la interfaz de usuario de Delta Live Tables:

  • Al crear una canalización, ahora puede especificar una base de datos de destino para publicar las tablas y metadatos de Delta Live Tables. Para obtener más información sobre la publicación de conjuntos de datos, consulte Publicación de datos de las canalizaciones de Delta Live Tables en el metastore de Hive.
  • Los cuadernos ahora admiten el resaltado de la sintaxis de palabras clave en definiciones de conjunto de datos de SQL. Puede usar este resaltado para garantizar la corrección de las instrucciones SQL de Delta Live Tables. Consulte la referencia del lenguaje SQL para obtener más información sobre la sintaxis SQL de Delta Live Tables.
  • El entorno de ejecución de Delta Live Tables ahora emite el gráfico de canalización antes de ejecutarla, por lo que le permite ver el gráfico en la interfaz de usuario en una fase anterior.
  • Todas las bibliotecas de Python configuradas en sus cuadernos ahora se instalan antes de ejecutar cualquier código de Python, lo que garantiza que las bibliotecas estén accesibles globalmente para cualquier cuaderno de Python de la canalización. Consulte [[_]](../../../delta-live-tables/external-dependencies.md).