Noviembre de 2020

Estas características y mejoras de la plataforma Azure Databricks se publicaron en noviembre de 2020.

Nota:

Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.

Finaliza el soporte técnico de Databricks Runtime 6.6

26 de noviembre de 2020

El soporte para Databricks Runtime 6.6, Databricks Runtime 6.6 para Machine Learning y Databricks Runtime 6.6 para Genomics finalizó el 26 de noviembre. Consulte Ciclo de vida del soporte técnico de Databricks Runtime.

Registro de modelos de MLflow, GA

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

El registro de modelos de MLflow ahora está disponible de forma general. Se han realizado varias mejoras desde que se publicó Model Registry para la versión preliminar pública:

  • Registro de auditoría para acciones en objetos del registro de modelos. Las acciones del registro de modelos ahora se capturan en los registros de auditoría. Consulte la entrada modelRegistry en la referencia del registro de auditoría para las acciones y parámetros registrados.
  • Comentarios de las versiones del modelo. Ahora puede agregar comentarios a las versiones del modelo, lo que le permite usar el Registro de modelos en las discusiones del equipo para administrar la canalización de producción de modelos.
  • Etiquetas en modelos y versiones de modelos. Puede crear etiquetas para modelos y versiones de modelos y buscarlas mediante la API.
  • Mejoras en la dirección URL de la página de modelos registrados. La dirección URL de esta página ahora conserva su historial, por lo que puede navegar con los botones atrás y adelante del explorador a medida que realiza consultas y ve los modelos desde esta página. También puede compartir la dirección URL con compañeros que verán la misma vista.

Filtrado de las ejecuciones de experimentos en función de si un modelo registrado está asociado

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

Al ver las ejecuciones de un experimento, ahora puede filtrar las ejecuciones en función de si crearon o no una versión del modelo. Para obtener más información, consulte la Filtro de ejecuciones.

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

La galería de Integraciones de asociados se ha movido del menú Cuenta a la pestaña Agregar datos. Para obtener más información, consulte Partners de tecnología.

Las directivas de clúster ahora usan lista de permitidos y lista de bloqueados como nombres de tipo de directiva.

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

Las directivas de clúster ahora usan "allowlist" y "blocklist" como tipos de directiva, reemplazando "whitelist" y "blacklist". Consulte Referencia de directiva de proceso. Tenga en cuenta que esto se anunció originalmente como una característica de la versión 3.31, que era incorrecta.

Reintentos automáticos cuando se produce un error en la creación de un clúster de trabajo

Importante

Esta actualización se revirtó después de la versión 3.33.

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

Azure Databricks ahora recupera automáticamente la creación de clústeres de trabajos cuando se producen errores recuperables específicos. Las ejecuciones de trabajos permanecen en RunLifeCycleState: PENDIENTE hasta que el clúster se inicia correctamente. Cada intento tiene un nombre y un cluster_id diferente. Cuando la creación del clúster se realiza correctamente, la ejecución realiza la transición a RunLifeCycleState: EN EJECUCIÓN.

Del 18 de noviembre al 1 de diciembre de 2020: versión 3.33

Ahora puede ver una tabla de contenido de los cuadernos y usarla para navegar rápidamente por un cuaderno. La tabla de contenido del cuaderno se crea automáticamente en función de los encabezados de Markdown. Para obtener más información, consulte Tabla de contenido del cuaderno.

Databricks SQL (versión preliminar pública)

18 de noviembre de 2020

Databricks tiene el placer de presentar Databricks SQL, un entorno intuitivo para ejecutar consultas ad-hoc y crear paneles de los datos almacenados en el lago de datos. Databricks SQL permite que una organización utilice una arquitectura DE TIPO lakehouse multinube que proporciona el rendimiento del almacenamiento de datos con el ahorro que supone usar un lago de datos, al tiempo que proporciona una magnífica experiencia al usuario de SQL Analytics. Databricks SQL:

  • Se integra con las herramientas de inteligencia empresarial que usa actualmente, como Tableau y Microsoft Power BI, para realizar consultas en los datos más completos y recientes de su lago de datos.
  • Complementa las herramientas de inteligencia empresarial existentes con una interfaz nativa de SQL que permite tanto a los analistas de datos como a los científicos de datos realizar consultas en los datos del lago de datos directamente en Azure Databricks.
  • Permite compartir información de consulta mediante visualizaciones enriquecidas y paneles de arrastrar y colocar con generación automática de alertas cuando se realizan cambios importantes en los datos.
  • Usa Creación de almacenes de SQL para aportar confiabilidad, calidad, escala, seguridad y rendimiento a su lago de datos, por lo que es posible ejecutar cargas de trabajo de análisis tradicionales con los datos más recientes y completos.

Consulte ¿Qué es el almacenamiento de datos en Azure Databricks? para obtener más información.

Los clústeres de nodo único admiten ya Databricks Container Services

4-10 de noviembre de 2020: versión 3.32

Ahora puede usar los servicios de contenedor de Databricks en clústeres de nodo único. Para obtener más información, consulte Proceso de nodo único o varios nodos y Personalizar contenedores con Databricks Container Service.

Databricks Runtime 7.4 GA

3 de noviembre de 2020

Databricks Runtime 7.4, Databricks Runtime 7.4 ML y Databricks Runtime 7.4 para Genomics ya están disponibles con carácter general.

Para más información, consulte las notas completas de la versión en Databricks Runtime 7.4 (sin soporte técnico) y Databricks Runtime 7.4 para ML (sin soporte técnico).

Actualización del controlador JDBC de Databricks

3 de noviembre de 2020

Se ha publicado una nueva versión del controlador JDBC de Databricks. La nueva versión contiene una serie de correcciones de errores; cabe mencionar que el controlador ahora devuelve el número correcto de filas modificadas de las operaciones DML cuando se proporciona mediante Databricks Runtime.

Databricks Connect 7.3 (versión beta)

3 de noviembre de 2020

Databricks Connect 7.3 ya está disponible en su versión beta.

Databricks Connect 7.3 le permite usar tokens de Microsoft Entra ID para autenticarse en Azure Databricks y admite el acceso directo de credenciales de Microsoft Entra ID. Esto le permite autenticarse automáticamente en Azure Data Lake Storage Gen1 y Azure Data Lake Storage Gen2 desde Databricks Connect mediante la misma identidad de Microsoft Entra ID que se usa para autenticarse en Azure Databricks.

Para obtener más información, consulte Databricks Connect y las notas de la versión de Databricks Connect.