Febrero de 2022

Estas características y mejoras de la plataforma Azure Databricks se publicaron en febrero de 2022.

Nota:

Las versiones se lanzan en fases. Es posible que su cuenta de Azure Databricks no se actualice hasta después de una semana o más de la fecha de lanzamiento inicial.

Programación más sencilla para sus canalizaciones de Delta Live Tables (Versión preliminar pública)

Del 28 de febrero al 2 de marzo de 2022

Ahora puede crear un trabajo de Azure Databricks programado para las canalizaciones desencadenadas directamente desde la interfaz de usuario de Delta Live Tables. Anteriormente, necesitaba crear el trabajo y la programación para ejecutar el trabajo desde la interfaz de usuario de trabajos.

Examine fácilmente el historial de las actualizaciones de canalización de Delta Live Tables (Versión preliminar pública)

Del 28 de febrero al 2 de marzo de 2022

Ahora puede ver un historial de actualizaciones de canalización, incluido el estado de actualización, los detalles y los eventos, con la lista desplegable Historial de actualizaciones en la interfaz de usuario de Delta Live Tables.

Garantice la idempotencia del trabajo para la API Jobs. Ejecute ahora la solicitud

22-28 de febrero de 2022: versión 3.66

Ahora puede usar el parámetro opcional idempotency_token con la operación Ejecutar ahora de la API de trabajos para asegurarse de que se inicia exactamente una ejecución de un trabajo. Anteriormente, es posible que el envío de varias solicitudes Run now para el mismo trabajo haya iniciado más de una ejecución.

Para más información sobre la idempotency del trabajo, consulte Cómo garantizar la idempotency de los trabajos.

Mejoras de escalabilidad y estabilidad del servicio de trabajos

22-28 de febrero de 2022: versión 3.66

Los siguientes cambios aumentan la estabilidad y escalabilidad del servicio Trabajos:

  • A cada ejecución nueva se le asigna un identificador único, numérico y no secuencial de mayor longitud. Los clientes que usan la API de trabajos y dependen de una longitud de identificador fija o de identificadores secuenciales o de aumento monótono deben modificarse para aceptar identificadores que sean más largos, no secuenciales y desordenados. El tipo de identificador de int64 no sufre cambios; además, se mantiene la compatibilidad con los clientes que usan números de punto flotante IEEE 754 de 64 bits, como los clientes de JavaScript.
  • El valor del campo number_in_job, que se incluye en la respuesta a algunas solicitudes de la API de trabajos, ahora se establece en el mismo valor que run_id.

Comparación de ejecuciones de MLflow de diferentes experimentos

22-28 de febrero de 2022: versión 3.66

Ahora puede mostrar y comparar ejecuciones de varios experimentos. Consulte Comparación de ejecuciones de varios experimentos.

Mejoras en la presentación de ejecuciones de comparación de MLflow

22-28 de febrero de 2022: versión 3.66

Se ha mejorado la pantalla de ejecuciones de comparación. Las visualizaciones ahora aparecen en la parte superior de la página. Ahora puede desplazarse o contraer las tablas que muestran información de ejecución, parámetros y métricas. Ahora también puede simplificar la presentación ocultando parámetros y métricas que no varían entre ejecuciones.

Para obtener información sobre la página de comparación de ejecuciones, consulta Comparación de ejecuciones. Para obtener instrucciones sobre cómo comparar ejecuciones, consulte Comparación de ejecuciones.

Visibilidad mejorada de los propietarios de ejecución de trabajos en la interfaz de usuario de clústeres

22-28 de febrero de 2022: versión 3.66

La pestaña Clústeres de trabajos de la interfaz de usuario Proceso se ha actualizado para mostrar la ejecución del trabajo como usuario en lugar del propietario del trabajo. Esta actualización se basa en los cambios del modelo de permisos de trabajos y proporciona una visibilidad mejorada del propietario de una ejecución de trabajo. Consulte Visualización del proceso.

Anulación de columnas de conjunto de datos en AutoML

22-28 de febrero de 2022: versión 3.66

En Databricks Runtime 10.3 ML y versiones posteriores, para problemas de clasificación y regresión, ahora puede especificar columnas en el conjunto de datos que AutoML no debe usar para el entrenamiento. Consulte Parámetros de clasificación y regresión.

La página Experimentos es de disponibilidad general

22-28 de febrero de 2022: versión 3.66

La página de experimentos ahora está disponible con carácter general.

Compatibilidad con tablas temporales en la interfaz de Python de Delta Live Tables

22-28 de febrero de 2022: versión 3.66

Ahora puede usar la propiedad temporary al declarar tablas con la interfaz de Python de Delta Live Tables. La definición de una tabla temporal indica a Delta Live Tables que no conserve los metadatos de la tabla y evita la publicación de la tabla cuando se establece la configuración de target. Consulte la especificación de Python para obtener información sobre cómo definir tablas de Python.

Mejoras de la interfaz de usuario para Delta Live Tables (versión preliminar pública)

22-28 de febrero de 2022: versión 3.66

Esta versión incluye las siguientes mejoras en la interfaz de usuario de Delta Live Tables:

  • Ahora puede editar la configuración de canalización en el cuadro de diálogo Configuración de la interfaz de usuario de Delta Live Tables, lo que proporciona una interfaz más fácil de usar. Anteriormente, se limitaba a cambiar la configuración mediante la edición de la especificación JSON. Para seleccionar la interfaz de usuario o la vista JSON para editar la configuración de canalización, haga clic en el botón Interfaz de usuario o JSON del cuadro de diálogo Configuración.
  • El registro de eventos de la página Detalles de canalización ahora resalta los registros de errores, lo que facilita la identificación y la dirección de los errores en las canalizaciones.
  • Se ha mejorado la presentación del progreso de las canalizaciones en ejecución. Ahora, al ver el gráfico de la canalización, los nodos del estado RUNNING tienen un borde entrante animado y un borde superior animado.

Fin del soporte técnico de la serie 9.0 de Databricks Runtime

17 de febrero de 2022

La compatibilidad con Databricks Runtime 9.0 y Databricks Runtime 9.0 for Machine Learning finalizó el 17 de febrero. Consulte Ciclo de vida del soporte técnico de Databricks Runtime.

Actualizaciones de la página de aterrizaje de Ingeniería y Ciencia de datos

10 de febrero de 2022

Hemos actualizado la apariencia de la página de aterrizaje de Ingeniería y de ciencia de datos. Algunos vínculos han cambiado, pero no hay otros cambios importantes en la funcionalidad.

Databricks Repos ahora admite AWS CodeCommit para la integración de Git

7-14 de febrero de 2022: versión 3.65

Ahora puede usar repositorios de AWS CodeCommit con Databricks Repos.

Visualización mejorada para las canalizaciones de Delta Live Tables (versión preliminar pública)

7-14 de febrero de 2022: versión 3.65

La visualización del DAG de canalización se ha rediseñado para mejorar la facilidad de uso y la navegación. Las mejoras incluyen un cambio para mostrar gráficos de izquierda a derecha en lugar de arriba a abajo, lo que proporciona una vista más intuitiva de la ejecución de la canalización.

Analizador de Markdown actualizado

7-14 de febrero de 2022: versión 3.65

Se ha actualizado el analizador de Markdown de los cuadernos de Azure Databricks. Se han corregido algunos de los problemas observados en la actualización anterior. En concreto, ya no es necesario colocar un espacio entre los hashtags y el texto de un encabezado, y los vínculos con espacios ahora se representan correctamente.

Delta Live Tables ahora admite el procesamiento de captura de datos modificados (versión preliminar pública)

7-14 de febrero de 2022: versión 3.65

Ahora puede implementar el procesamiento de captura de datos modificados (CDC) en las canalizaciones de Delta Live Tables. El procesamiento CDC se admite con las interfaces de SQL y Python. Vea Captura simplificada de datos modificados con APPLY CHANGES API en Delta Live Tables.

Las metastores adicionales ya están disponibles en varias regiones

8 de febrero de 2022

Las siguientes metastores ahora están disponibles en las siguientes regiones:

brazilsouth:

  • consolidated-brazilsouth-prod-metastore.mysql.database.azure.com

centralus:

  • consolidated-centralus-prod-metastore-addl-2.mysql.database.azure.com
  • consolidated-centralus-prod-metastore-addl-3.mysql.database.azure.com

eastus:

  • consolidated-eastus-prod-metastore-addl-2.mysql.database.azure.com
  • consolidated-eastus-prod-metastore-addl-3.mysql.database.azure.com
  • consolidated-eastus-prod-metastore-addl-4.mysql.database.azure.com

eastus2

  • consolidated-eastus2-prod-metastore-addl-2.mysql.database.azure.com
  • consolidated-eastus2-prod-metastore-addl-3.mysql.database.azure.com

francecentral

  • consolidated-francecentral-prod-metastore.mysql.database.azure.com

northeurope

  • consolidated-northeurope-prod-metastore-addl-2.mysql.database.azure.com
  • consolidated-northeurope-prod-metastore-addl-3.mysql.database.azure.com

southeastasia

  • consolidated-southeastasia-prod-metastore-addl-1.mysql.database.azure.com

switzerlandnorth

  • consolidated-switzerlandnorth-prod-metastore-0.mysql.database.azure.com

switzerlandwest

  • consolidated-switzerlandwest-prod-metastore-0.mysql.database.azure.com

uksouth

  • consolidated-uksouth-prod-metastore-addl-1.mysql.database.azure.com

westeurope

  • consolidated-westeurope-prod-metastore-addl-2.mysql.database.azure.com
  • consolidated-westeurope-prod-metastore-addl-3.mysql.database.azure.com

Siempre debe incluir todos los nombres de host pertinentes para cada región que use en las rutas definidas por el usuario (UDR). Vea Configuración de rutas definidas por el usuario para Azure Databricks.

Selección de los marcos de algoritmos que se usarán con AutoML

7-14 de febrero de 2022: versión 3.65

En Databricks Runtime 10.3 ML y superior, puede especificar marcos de algoritmos, como scikit-learn, que AutoML no debe tener en cuenta en el desarrollo de modelos. De manera predeterminada, AutoML tiene en cuenta los modelos de scikit-learn, XGBoost y LightGBM para problemas de clasificación y regresión, y de Prophet y Auto-ARIMA para problemas de previsión. Consulte Parámetros de clasificación y regresión.

Los modelos de MLflow hospedados en Databricks ahora pueden buscar características en los almacenes en línea

3 de febrero de 2022

Los modelos empaquetados con metadatos del Almacén de características pueden buscar automáticamente los valores de características de las tiendas en línea en el momento del servicio.

Databricks Runtime 10.3 y 10.3 ML están disponibles con carácter general; 10.3 Photon está disponible en versión preliminar pública

2 de febrero de 2022

Databricks Runtime 10.3 y Databricks Runtime 10.3 ML están disponibles ahora con carácter general. Databricks Runtime 10.3 Photon está disponible en versión preliminar pública.