Novedades de Azure Synapse Analytics Archive

En este artículo se describen las actualizaciones del mes anterior en Azure Synapse Analytics. Para obtener la versión más reciente del mes actual, consulte Actualizaciones más recientes de Azure Synapse Analytics. Cada actualización incluye vínculos al blog de Azure Synapse Analytics y un artículo que proporciona más información.

Características disponibles con carácter general

En la tabla siguiente se enumera un historial anterior de las características de Azure Synapse Analytics que han pasado de la versión preliminar a la disponibilidad general (GA).

Month (Mes) Característica Más información
Julio de 2022 Apache Spark™ 3.2 para Synapse Analytics Apache Spark™ 3.2 para Synapse Analytics ya está disponible con carácter general. Revise las notas oficiales de la versión y las directrices de migración entre Spark 3.1 y 3.2 para evaluar los posibles cambios en las aplicaciones. Para más información, consulte Compatibilidad con la versión de Apache Spark y Azure Synapse Runtime para Apache Spark 3.2. Aspectos destacados de lo que se ha mejorado en Spark 3.2 en la actualización de julio de Azure Synapse Analytics 2022.
Julio de 2022 Característica de caché inteligente de Apache Spark en Azure Synapse La caché inteligente para Spark almacena automáticamente cada lectura dentro del espacio de almacenamiento en caché asignado. Para ello, detecta los cambios en los archivos subyacentes y actualiza los archivos para proporcionar los datos más recientes. Para obtener más información, consulte cómo habilitar o deshabilitar la memoria caché para un grupo de Apache Spark.
Junio de 2022 Herramienta Map Data La herramienta Map Data es un proceso guiado para ayudarle a crear asignaciones ETL y flujos de datos de asignación desde sus datos de origen a Synapse sin escribir código. Para obtener más información sobre la herramienta Map Data, lea Map Data en Azure Synapse Analytics.
Junio de 2022 Funciones definidas por el usuario Las funciones definidas por el usuario (UDF) ahora están disponibles con carácter general. Para obtener más información, lea Funciones definidas por el usuario en flujos de datos de asignación.
Mayo de 2022 Conector del explorador de datos de Azure Synapse para Power Automate, Logic Apps y Power Apps El conector de Azure Data Explorer para Power Automate le permite organizar y programar flujos, y enviar notificaciones y alertas, como parte de una tarea programada o desencadenada. Para más información, consulte Conector de Azure Data Explorer para Microsoft Power Automate y Ejemplos de uso del conector de Azure Data Explorer para Power Automate.
Abril de 2022 Restauración entre suscripciones para Azure Synapse SQL Con la actualización 3.8 del módulo Az.Sql de PowerShell, se puede usar el cmdlet Restore-AzSqlDatabase para la restauración entre suscripciones de grupo de SQL dedicados. Para más información, consulte Blog: Restauración de un grupo de SQL dedicado (anteriormente SQL DW) a otra suscripción. Esta característica ahora está disponible con carácter general para grupos de SQL dedicados (anteriormente SQL DW) y grupos de SQL dedicados en un área de trabajo de Synapse. ¿Cuál es la diferencia?
Abril de 2022 Diseñador de bases de datos El diseñador de bases de datos permite a los usuarios crear visualmente bases de datos dentro de Synapse Studio sin escribir una sola línea de código. Para obtener más información, vea Anuncio de la disponibilidad general del Diseñador de bases de datos. Obtenga más información sobre las bases de datos de lago y aprenda a modificar una base de datos de lago existente mediante el diseñador de bases de datos.
Abril de 2022 Plantillas de base de datos Se introdujeron nuevas plantillas de base de datos específicas del sector en el Blog de disponibilidad general de plantillas de base de datos de Synapse. Obtenga más información sobre plantillas de base de datos y la experiencia de exploración mejorada.
Abril de 2022 Rol RBAC de Operador de supervisión de Synapse El rol RBAC de Operador de supervisión de Synapse (control de acceso basado en roles) permite a un rol de usuario supervisar la ejecución de las aplicaciones de canalizaciones de Synapse y Spark sin tener la capacidad de ejecutar o cancelar la ejecución de estas aplicaciones. Para más información, consulte Roles de RBAC de Synapse.
Marzo de 2022 Flowlets Los flowlets ayudan a diseñar partes de la nueva lógica de flujo de datos, o para extraer partes de un flujo de datos existente y guardarlas como artefacto independiente dentro del área de trabajo de Synapse. A continuación, puede reutilizar estos Flowlets dentro de otros flujos de datos. Para más información, revise la entrada de blog del anuncio de Flowlets de GA y lea Flowlets en el flujo de datos de asignación.
Marzo de 2022 Conectores de fuente de cambios Las transformaciones en el origen del flujo de datos de la fuente de captura de datos modificados (CDC) para Azure Cosmos DB, Azure Blob Storage, ADLS Gen1, ADLS Gen2 y Common Data Model (CDM) ya están disponibles con carácter general. Simplemente marcando una casilla, puede indicar a ADF que administre automáticamente un punto de control y solo lea las filas más recientes que se actualizaron o insertaron desde la última ejecución de canalización. Para más información, revise la entrada de blog de la versión preliminar de los conectores de fuente de cambios y lea Copiar y transformar datos en Azure Data Lake Storage Gen2 mediante Azure Data Factory o Azure Synapse Analytics.
Marzo de 2022 Cifrado de nivel de columna para grupos de SQL dedicados El cifrado de nivel de columna ahora está disponible con carácter general para su uso en servidores lógicos de Azure SQL nuevos y existentes con grupos de SQL dedicados de Azure Synapse y grupos de SQL dedicados de áreas de trabajo de Azure Synapse. SQL Server Data Tools (SSDT) para el cifrado de nivel de columna para los grupos de SQL dedicados está disponible a partir de la compilación 17.2 Preview 2 de Visual Studio 2022.
Marzo de 2022 Conector Common Data Model (CDM) en Spark de Synapse El lector/escritor con formato (CDM) permite que un programa de Spark lea y escriba entidades CDM en una carpeta CDM a través de dataframes de Spark. Para obtener más información, consulte cómo el conector CDM admite la lectura, escritura de datos, ejemplos y problemas conocidos.
Noviembre de 2021 PREDICT La sintaxis PREDICT de T-SQL ahora está disponible con carácter general para grupos de SQL dedicados. Comenzar con el Asistente para puntuación del modelo de Machine Learning para grupos de SQL dedicados.
Octubre de 2021 Roles RBAC de Synapse Los roles de control de acceso basado en rol (RBAC) de Synapse ahora están disponibles con carácter general. Obtenga más información sobre los roles RBAC de Synapse y el control de acceso basado en rol (RBAC) de Azure Synapse mediante PowerShell.

Comunidad

Esta sección es un archivo de las oportunidades de la comunidad de Azure Synapse Analytics y el programa Azure Synapse Influencer de Microsoft.

Month (Mes) Característica Más información
Mayo de 2022 Programa Azure Synapse Influencer Regístrese para obtener nuestro programa gratuito de Azure Synapse Influencer y póngase en contacto con una comunidad de usuarios de Synapse que estén dedicados a ayudar a otros usuarios a lograr nuevos desafíos con el análisis en la nube. Regístrese ahora en la siguiente sesión de Pregunte a los expertos de Synapse Influencer. Es gratuito asistir y todo el mundo es bienvenido a participar y unirse a la charla sobre temas relacionados con Synapse. Puede ver los eventos Pregunte a los expertos grabados anteriormente en el canal de YouTube de Azure Synapse.
Marzo de 2022 Series de vídeos de YouTube de Azure Synapse Analytics y Microsoft MVP Una actividad conjunta con el equipo de producto de Azure Synapse y la comunidad de Microsoft MVP, se ha lanzado una nueva serie de vídeos de MVP de YouTube sobre las características de Azure Synapse. Vea más en el canal de YouTube de Azure Synapse Analytics.

Uso de Apache Spark para Azure Synapse Analytics

Esta sección es un archivo de las características y funcionalidades de Apache Spark para Azure Synapse Analytics.

Month (Mes) Característica Más información
Mayo de 2022 El conector de grupo de SQL dedicado de Azure Synapse para Apache Spark ya está disponible en Python Anteriormente, el conector del grupo de SQL dedicado de Azure Synapse para Apache Spark estaba disponible solo mediante Scala. Ahora, el conector del grupo de SQL dedicado para Apache Spark se puede usar con Python en Spark 3.
Mayo de 2022 Administración de la configuración de Apache Spark de Azure Synapse Con la nueva característica de configuración de Apache Spark, puede crear un artefacto de configuración de Spark independiente que posea sugerencias automáticas y reglas de validación integradas. Los artefactos de configuración de Spark le permiten compartir la configuración de Spark tanto dentro las áreas de trabajo de Azure Synapse como entre ellas. También le permite asociar fácilmente la configuración de Spark con un grupo de Spark, una aplicación Notebook y una definición de trabajo de Spark para reutilizarla y minimizar la necesidad de copiarla en varios lugares.
Abril de 2022 Apache Spark 3.2 para Synapse Analytics Apache Spark 3.2 para Synapse Analytics con disponibilidad en versión preliminar. Revise las notas oficiales de la versión Spark 3.2 y las directrices de migración entre Spark 3.2 y 3.1 para evaluar los posibles cambios en las aplicaciones. Para más información, consulte Compatibilidad con la versión de Apache Spark y Azure Synapse Runtime para Apache Spark 3.2.
Abril de 2022 Parametrización para la definición de trabajo de Spark Ahora puede asignar parámetros dinámicamente en función de variables, metadatos o especificar parámetros específicos de canalización para la actividad de definición de trabajo de Spark. Para más información, consulte Transformación de datos mediante la definición de trabajo de Apache Spark.
Abril de 2022 Instantánea del cuaderno de Apache Spark Puede acceder a la instantánea del cuaderno cuando se produce un error de ejecución del cuaderno de canalización o si hay un trabajo de cuaderno de larga duración. Para más información, consulte Transformación de datos mediante la ejecución de un cuaderno de Synapse e Introducción a las utilidades de Microsoft Spark.
Marzo de 2022 Conector Common Data Model (CDM) en Spark de Synapse El lector/escritor con formato (CDM) permite que un programa de Spark lea y escriba entidades CDM en una carpeta CDM a través de dataframes de Spark. Para obtener más información, consulte cómo el conector CDM admite la lectura, escritura de datos, ejemplos y problemas conocidos.
Marzo de 2022 Optimización del rendimiento para el conector del grupo de SQL dedicado de Synapse Spark Hay nuevas mejoras en el conector de grupo de SQL dedicado de Azure Synapse para Apache Spark que reducen el movimiento de datos y aprovechan COPY INTO. Las pruebas de rendimiento indican al menos una mejora 5 veces mayor respecto a la versión anterior. No se requiere ninguna acción del usuario para aprovechar estas mejoras. Para más información, consulte Blog: Conector del grupo de SQL dedicado (DW) de Synapse Spark: Mejoras de rendimiento.
Marzo de 2022 Compatibilidad con todas las opciones SaveMode de trama de datos de Spark El conector de grupo de SQL dedicado de Azure Synapse para Apache Spark ahora admite las cuatro opciones SaveMode de trama de datos de Spark: Append, Overwrite, ErrorIfExists, Ignore. Para más información sobre Spark SaveMode, lea la documentación oficial de Apache Spark.
Marzo de 2022 Característica de caché inteligente de Apache Spark en Azure Synapse Analytics La caché inteligente para Spark almacena automáticamente cada lectura dentro del espacio de almacenamiento en caché asignado. Para ello, detecta los cambios en los archivos subyacentes y actualiza los archivos para proporcionar los datos más recientes. Para obtener más información sobre esta característica en vista previa, consulte cómo habilitar o deshabilitar la memoria caché para un grupo de Apache Spark, o bien lea esta entrada de blog.

Integración de datos

Esta sección es un archivo de las características y funcionalidades de la integración de datos de Azure Synapse Analytics. Aprenda a Cargar datos en Azure Synapse Analytics mediante una canalización de Azure Data Factory (ADF) o Synapse.

Month (Mes) Característica Más información
Junio de 2022 Versión preliminar del conector CDC de SAP Ahora hay disponible un nuevo conector de datos para la captura de datos modificados (CDC) de SAP en versión preliminar. Para obtener más información, consulte Anuncio de la versión preliminar pública de la solución CDC de SAP en Azure Data Factory y Azure Synapse Analytics y la solución CDC de SAP en Azure Data Factory.
Junio de 2022 Opción de combinación aproximada en la transformación de combinación Se ha añadido el uso de coincidencias aproximadas con un control deslizante de puntuación de umbral de similitud a la transformación de unión en el flujos de datos de asignación.
Junio de 2022 Disponibilidad general de la herramienta Map Data Nos complace anunciar que la herramienta Datos de mapa ya está disponible con carácter general. La herramienta Map Data es un proceso guiado para ayudarle a crear asignaciones ETL y flujos de datos de asignación desde sus datos de origen a Synapse sin escribir código.
Junio de 2022 Repetición de la ejecución de una canalización con nuevos parámetros Ahora puede cambiar los parámetros de canalización al volver a ejecutar una canalización desde la página Supervisión sin tener que volver al editor de canalizaciones. Para obtener más información, consulte Ejecutar de nuevo canalizaciones y actividades.
Junio de 2022 Disponibilidad general de Funciones definidas por el usuario Las funciones definidas por el usuario (UDF) en los flujos de datos de asignación ahora están disponibles con carácter general (GA).
Mayo de 2022 Exportación de la supervisión de canalización como CSV La capacidad de exportar la supervisión de canalizaciones a CSV y otras mejoras de supervisión se han introducido en ADF.
Mayo de 2022 Carga automática de datos de origen incremental desde PostgreSQL y MySQL La carga automática de datos de origen incrementales de PostgreSQL y MySQL a Synapse SQL y Azure Database ahora está disponible de forma nativa en ADF.
Mayo de 2022 Control de errores de transformaciones de aserción Ahora, se ha agregado un proceso de control de errores a los receptores, que entra en acción tras los procesos de transformaciones de aserción en flujo de datos de asignación. Ahora, puede elegir si las filas con errores se van a generar en el receptor seleccionado o, por el contrario, en un archivo independiente.
Mayo de 2022 Edición de proyección de flujos de datos de asignación En flujos de datos de asignación, ahora puede actualizar los nombres y tipos de columna de proyección de origen.
Abril de 2022 Conector de Dataverse para flujos de datos de Synapse Dataverse ahora es un conector de origen y receptor para flujos de datos de Synapse. Puede copiar y transformar datos en Dynamics 365 (Microsoft Dataverse) o Dynamics CRM mediante Azure Data Factory o Azure Synapse Analytics.
Abril de 2022 Tiempo de espera de respuesta de actividad web de canalizaciones de Synapse configurable Con la propiedad de tiempo de espera de respuesta httpRequestTimeout, puede definir el tiempo de espera de la solicitud HTTP hasta 10 minutos. Las actividades web funcionan excepcionalmente bien con las API que siguen el patrón asincrónico de solicitud-respuesta, un enfoque sugerido para crear API o servicios web escalables.
Marzo de 2022 Conector SFTP para flujos de datos de Synapse Se admite un conector sftp nativo en flujos de datos de Synapse para leer y escribir datos desde sFTP mediante la interfaz visual de flujos de datos de poco código en Synapse. Para obtener más información, consulte Copia y transformación de datos en el servidor SFTP mediante Azure Data Factory o Azure Synapse Analytics.
Marzo de 2022 Mejoras de los flujos de datos en la vista previa de datos Revise las características agregadas a la vista previa de datos y las mejoras de depuración en Los flujos de datos de asignación.
Marzo de 2022 Actividad de script de canalización Ahora puede transformar datos mediante la actividad Script para invocar comandos SQL para realizar DDL y DML.
Diciembre de 2021 Particiones personalizadas para el vínculo de Synapse para Azure Cosmos DB Mejore los tiempos de ejecución de consultas para las consultas de Spark mediante la creación de particiones personalizadas basadas en campos que se usan con frecuencia en las consultas. Para más información, consulte Creación de particiones personalizadas en Azure Synapse Vínculo para Azure Cosmos DB (versión preliminar).

Plantillas de base de datos y diseñador de base de datos

Esta sección es un archivo de las características y funcionalidades de las plantillas de base de datos y el diseñador de bases de datos.

Month (Mes) Característica Más información
Abril de 2022 Diseñador de bases de datos El diseñador de bases de datos permite a los usuarios crear visualmente bases de datos dentro de Synapse Studio sin escribir una sola línea de código. Para obtener más información, vea Anuncio de la disponibilidad general del Diseñador de bases de datos. Obtenga más información sobre las bases de datos de lago y aprenda a modificar una base de datos de lago existente mediante el diseñador de bases de datos.
Abril de 2022 Plantillas de base de datos Se introdujeron nuevas plantillas de base de datos específicas del sector en el Blog de disponibilidad general de plantillas de base de datos de Synapse. Obtenga más información sobre plantillas de base de datos y la experiencia de exploración mejorada.
Abril de 2022 Clonar la base de datos de Lake En Synapse Studio, puede clonar una base de datos mediante el menú de acciones disponible en la base de datos de lago. Para más información, lea Procedimiento: Clonación de una base de datos de lago.
Abril de 2022 Uso de caracteres comodín para especificar jerarquías de carpetas personalizadas Las bases de datos de lago se encuentran sobre los datos que están en el lago y estos datos pueden residir en carpetas anidadas que no encajan en patrones de partición limpios. Ahora puede usar caracteres comodín para especificar jerarquías de carpetas personalizadas. Para obtener más información, consulte Procedimiento: Modificación de un lago de datos.
Enero de 2022 Nuevas plantillas de base de datos Obtenga más información sobre las nuevas plantillas de Automotive, Genomics, Manufacturing, y Pharmaceuticals específicas del sector y empiece a trabajar con plantillas de base de datos en la galería de Synapse Studio.

Experiencia del desarrollador

Esta sección es un archivo de las mejoras de calidad de vida y características para los desarrolladores en Azure Synapse Analytics.

Month (Mes) Característica Más información
Mayo de 2022 Se ha actualizado el informe del analizador de Azure Synapse Obtenga información sobre las nuevas características de la versión 2.0 del informe del analizador de Synapse.
Abril de 2022 Informe del analizador de Azure Synapse El informe del analizador de Azure Synapse le ayuda a identificar problemas comunes que pueden estar presentes en la base de datos que pueden provocar problemas de rendimiento.
Abril de 2022 Referencia a un cuaderno no publicado Ahora, al usar cuadernos %run, puede habilitar la "referencia de cuaderno no publicada", que le permitirá hacer referencia a cuadernos no publicados. Cuando se habilita, la ejecución del cuaderno capturará el contenido actual en la memoria caché web del cuaderno, lo que significa que otros cuadernos pueden hacer referencia a los cambios en el editor de cuadernos de inmediato sin tener que publicarse (modo activo) ni confirmarse (modo Git).
Marzo de 2022 Celdas de código con excepción para mostrar la salida estándar Ahora en los cuadernos de Synapse, se muestran mensajes de salida y excepción estándar cuando se produce un error en una instrucción de código para los lenguajes de Python y Scala. Para obtener ejemplos, consulte Cuadernos de Synapse: Celdas de código con excepción para mostrar la salida estándar.
Marzo de 2022 La salida parcial está disponible para ejecutar celdas de código de cuaderno Ahora, en los cuadernos de Synapse, puede ver cualquier cosa que escriba (con comandos println, por ejemplo) a medida que se ejecute la celda, en lugar de esperar hasta que finalice. Para obtener ejemplos, consulte Cuadernos de Synapse: La salida parcial está disponible para ejecutar celdas de código de cuaderno .
Marzo de 2022 Control dinámico de la configuración de la sesión de Spark con parámetros de canalización Ahora en los cuadernos de Synapse, puede usar parámetros de canalización para configurar la sesión con el cuaderno %%configure magic. Para obtener ejemplos, consulte Cuadernos de Synapse: Control dinámico de la configuración de la sesión de Spark con parámetros de canalización.
Marzo de 2022 Reutilización y administración de sesiones de cuadernos Ahora en los cuadernos de Synapse es fácil reutilizar una sesión activa cómodamente sin tener que iniciar una nueva, y ver y administrar las sesiones activas en la lista Sesiones activas. Para ver las sesiones, seleccione los tres puntos del cuaderno y seleccione Administrar sesiones. Para obtener ejemplos, consulte Cuadernos de Synapse: Reutilización y administración de sesiones de cuadernos.
Marzo de 2022 Compatibilidad con el registro de Python En los cuadernos de Synapse ahora todo lo que se escribe a través del módulo de registro de Python queda capturado, además de los registros de controladores. Para obtener ejemplos, consulte Cuadernos de Synapse: Compatibilidad con el registro de Python.

Machine Learning

Esta sección es un archivo de las características y mejoras de los modelos de aprendizaje automático en Azure Synapse Analytics.

Month (Mes) Característica Más información
Junio de 2022 Entrenamiento de red neuronal profunda distribuida (versión preliminar) Además, el entorno de ejecución de Azure Synapse incluye bibliotecas auxiliares, como Petastorm y Horovod, que se usan normalmente para el entrenamiento distribuido. Esta característica está disponible actualmente en versión preliminar. El runtime de Azure Synapse Analytics para Apache Spark 3.1 y 3.2 ahora también incluye soporte para las bibliotecas de aprendizaje profundo más comunes como TensorFlow y PyTorch. Para más información sobre cómo aprovechar estas bibliotecas en los grupos acelerados por GPU de Azure Synapse Analytics, lea los tutoriales de aprendizaje profundo.
Noviembre de 2021 PREDICT La sintaxis PREDICT de T-SQL ahora está disponible con carácter general para grupos de SQL dedicados. Comenzar con el Asistente para puntuación del modelo de Machine Learning para grupos de SQL dedicados.

Ejemplos e instrucciones

Esta sección es un archivo de las instrucciones y los recursos de proyecto de ejemplo para Azure Synapse Analytics.

Month (Mes) Característica Más información
Junio de 2022 Análisis de Azure Orbital con Synapse Analytics Ahora ofrecemos una solución de ejemplo de análisis de Azure Orbital que muestra una implementación completa de extracción, carga, transformación y análisis de datos en el espacio mediante bibliotecas geoespaciales y modelos de inteligencia artificial con Azure Synapse Analytics. La solución de ejemplo también muestra cómo integrar modelos geoespaciales específicos de Azure Cognitive Services, modelos de inteligencia artificial de asociados y modelos bring-your-own-data.
Junio de 2022 Guías de migración para Oracle Ya está disponible una nueva guía de migración de Microsoft para Oracle a Azure Synapse Analytics. Diseño y rendimiento de las migraciones de Oracle.
Junio de 2022 Success by Design para Azure Synapse El cuaderno de estrategias de prueba de concepto de Azure Synapse proporciona una guía para definir, diseñar, ejecutar y evaluar una prueba de concepto para cargas de trabajo de SQL o Spark.
Junio de 2022 Guías de migración para Teradata Ya está disponible una nueva guía de migración de Microsoft para Teradata a Azure Synapse Analytics. Diseño y rendimiento para las migraciones de Teradata.
Junio de 2022 Guías de migración para IBM Netezza Ya está disponible una nueva guía de migración de Microsoft para IBM Netezza a Azure Synapse Analytics. Diseño y rendimiento de las migraciones de IBM Netezza.

Seguridad

Esta sección es un archivo de las características de seguridad y la configuración en Azure Synapse Analytics.

Month (Mes) Característica Más información
Abril de 2022 Rol RBAC de Operador de supervisión de Synapse El rol (RBAC) de Operador de supervisión de Synapse control de acceso basado en roles permite a un rol de usuario supervisar la ejecución de las aplicaciones de canalizaciones de Synapse y Spark sin tener la capacidad de ejecutar o cancelar la ejecución de estas aplicaciones. Para más información, consulte Roles de RBAC de Synapse.
Marzo de 2022 Aplicación de una versión mínima de TLS Ahora puede generar o reducir la versión mínima de TLS para grupos de SQL dedicados en áreas de trabajo de Synapse. Para más información, consulte Configuración de conectividad de Azure SQL. La API de SQL administrada del área de trabajo se puede usar para modificar la configuración mínima de TLS.
Marzo de 2022 Azure Synapse Analytics ahora solo admite la autenticación de Azure Active Directory (Azure AD) Ahora puede usar la autenticación de Azure Active Directory para administrar de forma centralizada el acceso a todos los recursos de Azure Synapse, incluidos los grupos de SQL. La autenticación local se puede deshabilitar cuando se crea un área de trabajo desde Azure Portal, o después de la creación.
Diciembre de 2021 Identidades administradas asignadas por el usuario Ahora puede usar identidades administradas asignadas por el usuario con servicios vinculados para la autenticación en canalizaciones y flujos de datos de Synapse. Para obtener más información, consulte Credenciales en Azure Data Factory y Azure Synapse.
Diciembre de 2021 Exploración de carpetas de ADLS Gen2 en un área de trabajo Azure Synapse Analytics Ahora puede examinar y proteger un contenedor o una carpeta de Azure Data Lake Storage Gen2 (ADLS Gen2) en el área de trabajo de Azure Synapse Analytics si se conecta al contenedor o a la carpeta específica de Synapse Studio.
Diciembre de 2021 TLS 2.1 aplicado para nuevas áreas de trabajo de Synapse A partir de diciembre de 2021, se ha implementado un requisito para TLS 1.2 solo para nuevas áreas de trabajo de Synapse.

Explorador de datos de Azure Synapse

Azure Data Explorer (ADX) es un servicio de exploración de datos altamente escalable y rápido para datos de telemetría y registro. Ofrece la ingesta desde Event Hubs, IoT Hub y blobs escritos en contenedores de blobs y trabajos de Azure Stream Analytics. Esta sección es un archivo de las características y funcionalidades del Explorador de datos de Azure Synapse y el Lenguaje de consulta Kusto (KQL). Para más información, consulte ¿Cuál es la diferencia entre Azure Data Explorer y Azure Synapse Data Explorer? (versión preliminar)

Month (Mes) Característica Más información
Junio de 2022 Página principal nueva de Web Explorer La nueva página principal de Azure Synapse Web Explorer facilita aún más la introducción a Synapse Web Explorer.
Junio de 2022 Galería de ejemplo de Web Explorer La galería de ejemplos de Web Explorer proporciona ejemplos de un extremo a otro sobre cómo los clientes aprovechan Synapse Data Explorer casos de uso populares, como los datos de registros, los datos de métricas, los datos de IoT y los ejemplos de macrodatos básicos.
Junio de 2022 Paneles de Web Explorer exploran en profundidad las funcionalidades Ahora puede usar obtención de detalles como parámetros en los paneles de Synapse Web Explorer.
Junio de 2022 Configuración de zona horaria para Web Explorer La configuración de zona horaria de Web Explorer ahora se aplica tanto a los resultados de la consulta como al panel. Al cambiar la zona horaria, los paneles se actualizarán automáticamente para presentar los datos con la zona horaria seleccionada.
Mayo de 2022 Consulta dinámica de Synapse Data Explorer en Excel La nueva experiencia web de Data Explorer, denominada "Abrir en Excel", le permitirá proporcionar acceso a los resultados dinámicos de una consulta mediante la compartición de un libro de Excel conectado con compañeros y miembros del equipo. Para obtener los resultados de la consulta más actualizados, es posible abrir una consulta dinámica en un libro de Excel y actualizarla directamente desde Excel. Para crear un libro de Excel conectado a Synapse Data Explorer, empiece por ejecutar una consulta en la experiencia web.
Mayo de 2022 Uso de identidades administradas para tablas de SQL Server externas La nueva característica de compatibilidad con identidades administradas, hace que el proceso de definición de tablas de Synapse Data Explorer sea más sencillo y seguro. Ahora, puede usar identidades administradas en lugar de escribir las credenciales. Para obtener más información sobre las tablas externas, consulte Crear y modificar tablas externas de SQL Server.
Mayo de 2022 Conector de Azure Synapse Data Explorer para Microsoft Power Automate, Logic Apps y Power Apps Los nuevos conectores de Azure Data Explorer para Power Automate están disponibles con carácter general (GA). Para más información, consulte Conector de Azure Data Explorer para Microsoft Power Automate, la aplicación lógica de Microsoft y Azure Data Explorer y la capacidad de crear una aplicación de Power Apps para consultar datos en Azure Data Explorer.
Mayo de 2022 Enrutamiento de eventos dinámicos desde el centro de eventos a varias bases de datos Ahora se admite el enrutamiento de datos de eventos de Azure Event Hubs, Azure IoT Hub o Azure Event Grid a varias bases de datos hospedadas en un único clúster de ADX. Para más información sobre el enrutamiento dinámico, consulte Ingesta desde Event Hub.
Mayo de 2022 Configuración de una base de datos mediante un script insertado de KQL como parte de la plantilla de implementación de ARM de JSON La ejecución de un script de Lenguaje de consulta Kusto (KQL) para configurar la base de datos ahora se puede realizar mediante un script insertado proporcionado como parámetro para una plantilla de JSON ARM.

Azure Synapse Link es un sistema automatizado para replicar datos de SQL Server o Azure SQL Database, Azure Cosmos DB o Dataverse en Azure Synapse Analytics. Esta sección es un archivo de noticias sobre la característica Azure Synapse Link.

Month (Mes) Característica Más información
Mayo de 2022 Versión preliminar de Azure Synapse Link para SQL Azure Synapse Link para SQL está en versión preliminar para SQL Server 2022 y Azure SQL Database. La característica Azure Synapse Link proporciona procesos de replicación de datos casi en tiempo real desde los almacenes operativos basados en SQL en Azure Synapse Analytics. Proporción de informes de BI basados en datos operativos, con un impacto mínimo en el almacén operativo. Se ha anunciado la versión preliminar de Azure Synapse Link para SQL. Para más información, consulte Entrada: Azure Synapse Link para SQL Deep Dive.

SQL de Synapse

Esta sección es un archivo de las mejoras y características de los grupos de SQL en Azure Synapse Analytics.

Month (Mes) Característica Más información
Junio de 2022 Aumento del límite de tamaño del conjunto de resultados El tamaño máximo de los conjuntos de resultados de consulta en grupos de SQL sin servidor se ha aumentado de 200 GB a 400 GB.
Mayo de 2022 Cálculo automático de la longitud de columna de caracteres para grupos de SQL sin servidor Ya no es necesario definir longitudes de columna de caracteres para los grupos de SQL sin servidor en el lago de datos. Puede obtener un rendimiento óptimo de las consultas sin tener que definir el esquema, ya que el grupo de SQL sin servidor usará las longitudes de columna media calculadas automáticamente y la estimación de cardinalidad.
Abril de 2022 La restauración entre suscripciones para Azure Synapse SQL ahora está disponible con carácter general Con la actualización 3.8 del módulo Az.Sql de PowerShell, se puede usar el cmdlet Restore-AzSqlDatabase para la restauración entre suscripciones de grupo de SQL dedicados. Para más información, consulte Restauración de un grupo de SQL dedicado a otra suscripción. Esta característica ahora está disponible con carácter general para grupos de SQL dedicados (anteriormente SQL DW) y grupos de SQL dedicados en un área de trabajo de Synapse. ¿Cuál es la diferencia?
Abril de 2022 Recuperación del grupo de SQL desde un servidor o un área de trabajo eliminados Con los cmdlets de restauración de PowerShell en los módulos Az.Sql y Az.Synapse, ahora puede restaurar desde un servidor o un área de trabajo eliminados sin abrir una incidencia de soporte técnico. Para más información, consulte Restauración de un grupo de SQL dedicado desde un área de trabajo de Azure Synapse eliminada o Restauración de grupos de SQL dedicados independientes (anteriormente SQL DW) desde un servidor eliminado, en función del escenario.
Marzo de 2022 Cifrado de nivel de columna para grupos de SQL dedicados El cifrado de nivel de columna ahora está disponible con carácter general para su uso en servidores lógicos de Azure SQL nuevos y existentes con grupos de SQL dedicados de Azure Synapse y grupos de SQL dedicados de áreas de trabajo de Azure Synapse. SQL Server Data Tools (SSDT) para el cifrado de nivel de columna para los grupos de SQL dedicados está disponible a partir de la compilación 17.2 Preview 2 de Visual Studio 2022.
Marzo de 2022 Ejecución en paralelo para CETAS Mejor rendimiento para CREATE TABLE AS SELECT (CETAS) y las instrucciones SELECT posteriores ahora son posibles mediante el uso de planes de ejecución en paralelo. Para obtener ejemplos, consulte Mejor rendimiento para CETAS y los SELECT posteriores.

Actualizaciones mensuales anteriores en Azure Synapse Analytics

A continuación se muestra el formato anterior de las actualizaciones mensuales de noticias para Synapse Analytics.

Actualización de junio de 2022

General

  • Análisis de Azure Orbital con Synapse Analytics: ahora ofrecemos una solución de ejemplo de análisis de Azure Orbital que muestra una implementación completa de extracción, carga, transformación y análisis de datos en el espacio mediante bibliotecas geoespaciales y modelos de inteligencia artificial con Azure Synapse Analytics. La solución de ejemplo también muestra cómo integrar modelos geoespaciales específicos de Azure Cognitive Services, modelos de inteligencia artificial de asociados y modelos bring-your-own-data.

  • Azure Synapse éxito por diseño: el éxito del proyecto no es un accidente y requiere una planeación y ejecución cuidadosas. Los cuadernos de estrategias Success by Design de Synapse Analytics ya están disponibles. El cuaderno de estrategias de prueba de concepto de Azure Synapse proporciona una guía para definir, diseñar, ejecutar y evaluar una prueba de concepto para cargas de trabajo de SQL o Spark. Estas guías contienen procedimientos recomendados de las implementaciones de soluciones más complejas y complejas que incorporan Azure Synapse. Para obtener más información sobre la Azure Synapse cuaderno de estrategias de prueba de concepto, lea Exito por diseño.

SQL

Aumento del límite de tamaño del conjunto de resultados: sabemos que recurre a Azure Synapse Analytics para trabajar con grandes cantidades de datos. Teniendo esto en cuenta, el tamaño máximo de los conjuntos de resultados de consulta en grupos de SQL sin servidor se ha aumentado de 200 GB a 400 GB. Este límite se comparte entre consultas simultáneas. Para más información sobre este aumento del límite de tamaño y otras restricciones, lea Autoayuda para el grupo de SQL sin servidor.

Synapse Data Explorer

  • Nueva página principal de Web Explorer: la nueva página principal de Synapse Web Explorer facilita aún más la introducción a Synapse Web Explorer. La página principal de Web Explorer ahora incluye las secciones siguientes:

    • Introducción: galería de ejemplo que ofrece consultas y paneles de ejemplo para casos de uso populares de Synapse Data Explorer.
    • Recomendado: módulos de aprendizaje populares diseñados para ayudarle a dominar Synapse Web Explorer y KQL.
    • Documentación: documentación básica y avanzada de Synapse Web Explorer.
  • Galería de ejemplos de Web Explorer: una excelente manera de obtener información sobre un producto es ver cómo lo usan otros usuarios. La galería de ejemplos de Web Explorer proporciona ejemplos de un extremo a otro sobre cómo los clientes aprovechan Synapse Data Explorer casos de uso populares, como los datos de registros, los datos de métricas, los datos de IoT y los ejemplos de macrodatos básicos. Cada ejemplo incluye el conjunto de datos, las consultas bien documentadas y un panel de ejemplo. Para más información sobre la galería de ejemplos, lea Azure Data Explorer en 60 minutos con la nueva galería de ejemplos.

  • Capacidades de exploración de los paneles de Web Explorer : ahora puede agregar capacidades de exploración a sus paneles de Web Explorer de Synapse. Las nuevas funcionalidades de obtención de detalles le permiten saltar y avanzar fácilmente entre las páginas del panel. Esto se hace posible mediante un filtro contextual para conectar los paneles. La definición de estos detalles contextuales se realiza mediante la edición de las interacciones visuales del mosaico seleccionado en el panel. Para obtener más información sobre las funcionalidades de obtención de detalles, lea Uso de obtención de detalles como parámetros del panel.

  • Configuración de zona horaria para Web Explorer: la posibilidad de mostrar datos en diferentes zonas horarias es muy eficaz. Ahora puede decidir ver los datos en la hora UTC, la zona horaria local o la zona horaria del dispositivo o máquina supervisados. La configuración de zona horaria de Web Explorer ahora se aplica tanto a los resultados de la consulta como al panel. Al cambiar la zona horaria, los paneles se actualizarán automáticamente para presentar los datos con la zona horaria seleccionada. Para obtener más información sobre la configuración de zona horaria, lea Cambio de fecha y hora a zona horaria específica.

Integración de datos

  • Opción de combinación aproximada en la transformación de combinación: se agregó la opción de coincidencia aproximada con una puntuación de similitud combinada a la transformación de combinación en el flujo de datos de asignación. Puede crear combinaciones internas y externas en valores de datos similares en lugar de coincidencias exactas. Anteriormente, habría tenido que usar una coincidencia exacta. El valor de escala deslizante va del 60 % al 100 %, lo que facilita el ajuste del umbral de similitud de la coincidencia. Para más información sobre las combinaciones aproximadas, lea Combinación en el flujo de datos de asignación.

  • Datos de mapa [disponible con carácter general]: nos complace anunciar que la herramienta Datos de mapa ya está disponible con carácter general. La herramienta Map Data es un proceso guiado para ayudarle a crear asignaciones ETL y flujos de datos de asignación desde sus datos de origen a Synapse sin escribir código. Para obtener más información sobre los datos de mapa, lea Datos de mapa en Azure Synapse Analytics.

  • Volver a ejecutar la canalización con nuevos parámetros: ahora puede cambiar los parámetros de canalización al volver a ejecutar una canalización desde la página Supervisión sin tener que volver al editor de canalizaciones. Después de ejecutar una canalización con nuevos parámetros, puede supervisar fácilmente la nueva ejecución en las antiguas sin tener que alternar entre páginas. Para más información sobre cómo volver a ejecutar canalizaciones con nuevos parámetros, lea Volver a ejecutar canalizaciones y actividades.

  • Funciones definidas por el usuario [disponibles con carácter general]: nos complace anunciar que las funciones definidas por el usuario (UDF) ahora están disponibles con carácter general. Con las funciones definidas por el usuario, puede crear expresiones personalizadas que pueden reutilizarse en varios flujos de datos de asignación. Ya no tiene que usar la misma manipulación de cadenas, cálculos matemáticos u otra lógica compleja varias veces. Las funciones definidas por el usuario se agruparán en bibliotecas para ayudar a los desarrolladores a agrupar conjuntos de funciones comunes. Para más información sobre las funciones definidas por el usuario, lea Funciones definidas por el usuario en flujos de datos de asignación.

Machine Learning

Entrenamiento distribuido de redes neuronales profundas con Horovod y Petastorm [Versión preliminar pública]: para simplificar el proceso de creación y administración de grupos acelerados por la GPU, Azure Synapse se encarga de preinstalar las bibliotecas de bajo nivel y de configurar todos los complejos requisitos de red entre los nodos de ejecución. Esta integración permite a los usuarios empezar a trabajar con grupos acelerados por GPU en tan solo unos minutos.

Ahora, Azure Synapse Analytics brinda compatibilidad integrada con la infraestructura de aprendizaje profundo. El runtime de Azure Synapse Analytics para Apache Spark 3.1 y 3.2 ahora incluye soporte para las bibliotecas de aprendizaje profundo más comunes como TensorFlow y PyTorch. Además, el entorno de ejecución de Azure Synapse incluye bibliotecas auxiliares, como Petastorm y Horovod, que se usan normalmente para el entrenamiento distribuido. Esta característica está actualmente en versión preliminar pública.

Para más información sobre cómo aprovechar estas bibliotecas en los grupos acelerados por GPU de Azure Synapse Analytics, lea los tutoriales de aprendizaje profundo.

Actualización de mayo de 2022

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

General

Conéctese con el nuevo programa de "influencers" de Azure SynapseÚnase a una comunidad de "influencers" de Azure Synapse que se están ayudando entre sí para sacarle un mayor partido al análisis en la nube. El programa de "influencers" de Azure Synapse reconoce a los usuarios y defensores de Azure Synapse Analytics que apoyan activamente a la comunidad compartiendo contenido, anuncios y noticias relacionadas con Synapse a través de las redes sociales.

SQL

  • Guía de migración de almacenamiento de datos a grupos dedicados de SQL en Azure Synapse Analytics: hemos oído que, debido a las ventajas que ofrece la migración a la nube, a menudo suelen buscar pasos, procesos o instrucciones para realizar migraciones rápidas y sencillas desde entornos de almacenamiento de datos existentes. Acabamos de publicar un conjunto de guías de migración de almacenamiento de datos para facilitar la transición a grupos de SQL dedicados en Azure Synapse Analytics.

  • Cálculo automático de la longitud de las columna de caracteres: ya no es necesario definir las longitudes de las columnas de caracteres. El uso de grupos de SQL sin servidor le permitirá consultar archivos en el lago de datos sin necesidad de conocer el esquema por adelantado. Hasta ahora, el procedimiento recomendado consistía en especificar las longitudes de las columnas de caracteres para obtener un rendimiento óptimo. Este problema ya no existe. Gracias a esta nueva característica, sus consultas podrán obtener un rendimiento óptimo sin tener que definir el esquema. El grupo de SQL sin servidor calculará la longitud media de columna de cada columna de caracteres inferida o definida con una longitud superior a 100 bytes. Aunque el esquema no cambiará, el grupo de SQL sin servidor hará un uso interno de las longitudes medias de columna que se calculen. Además, este también calculará automáticamente una estimación de cardinalidad que se usará en caso de que no haya una estadística creada anteriormente.

Apache Spark para Synapse

  • El conector de grupos dedicados de SQL para Apache Spark de Azure Synapse ya está disponible en Python: anteriormente, el conector de grupos dedicados de SQL para Apache Spark de Azure Synapse solo estaba disponible en Scala. Ahora, este también se puede usar con Python en Spark 3. La única diferencia entre las implementaciones de Scala y Python es el identificador de devolución de llamada opcional de Scala, que permite recibir métricas posteriores a la escritura.

    Ahora, Python en Spark 3 admite las siguientes capacidades:

    • Lectura mediante autenticación de Azure Active Directory (AD) o autenticación básica
    • Escritura en una tabla interna mediante Autenticación de Azure AD o autenticación básica
    • Escritura en una tabla externa mediante Autenticación de Azure AD o autenticación básica

    Para más información sobre el conector de Python, consulte Conector de grupos dedicados de SQL para Apache Spark de Azure Synapse.

  • Administración de la configuración de Apache Spark en Azure Synapse: la administración de la configuración de Apache Spark siempre supone una tarea complicada, debido a que Spark posee cientos de propiedades. También es difícil conocer el valor óptimo para cada configuración de Spark. Con la nueva característica de administración de configuración de Spark, puede crear un artefacto de configuración de Spark independiente que posea sugerencias automáticas y reglas de validación integradas. Los artefactos de configuración de Spark le permiten compartir la configuración de Spark tanto dentro las áreas de trabajo de Azure Synapse como entre ellas. También le permite asociar fácilmente la configuración de Spark con un grupo de Spark, una aplicación Notebook y una definición de trabajo de Spark para reutilizarla y minimizar la necesidad de copiarla en varios lugares. Para más información sobre la nueva característica de administración de configuración de Spark, consulte Administración de la configuración de Apache Spark.

Synapse Data Explorer

  • Consulta activa de Synapse Data Explorer en Excel: la nueva experiencia web de Data Explorer, denominada "Abrir en Excel", le permitirá proporcionar acceso a los resultados dinámicos de una consulta mediante la compartición de un libro de Excel conectado con compañeros y miembros del equipo.  Para obtener los resultados de la consulta más actualizados, es posible abrir una consulta dinámica en un libro de Excel y actualizarla directamente desde Excel. Para obtener más información sobre las consultas dinámicas de Excel, consulte Abrir una consulta dinámica en Excel.

  • Uso de identidades administradas en tablas externas de SQL Server: una de las principales ventajas de Azure Synapse es su capacidad para reunir la integración de datos, el almacenamiento de datos empresariales y el análisis de macrodatos. La nueva característica de compatibilidad con identidades administradas, hace que el proceso de definición de tablas de Synapse Data Explorer sea más sencillo y seguro. Ahora, puede usar identidades administradas en lugar de escribir las credenciales.

    Una tabla externa de SQL es una entidad de esquema que hace referencia a los datos que se almacenan fuera de una base de datos de Synapse Data Explorer. Mediante el comando "Crear y modificar tablas externas de SQL Server", podrá agregar tablas externas de SQL fácilmente al esquema de base de datos de Synapse Data Explorer.

    Para obtener más información sobre las identidades administradas, consulte Introducción a las identidades administradas.

    Para obtener más información sobre las tablas externas, consulte Crear y modificar tablas externas de SQL Server.

  • Ya está disponible el nuevo módulo de KQL Learn (el segundo de un total de tres). - La eficacia del lenguaje de consulta Kusto (KQL) reside en su simplicidad a la hora de consultar datos estructurados, semiestructurados y no estructurados al mismo tiempo. Estamos publicando módulos de Learn que le ayuden aprender a usar KQL de una forma más fácil. Anteriormente, publicamos el módulo Escritura de la primera consulta con el lenguaje de consulta Kusto. Este mes hemos lanzado uno nuevo: Obtenga información de sus datos mediante el lenguaje de consulta Kusto.

    KQL es el lenguaje de consulta que se usa para consultar los macrodatos procedentes del servicio Synapse Data Explorer. Asimismo, la comunidad de usuarios de KQL va en rápido aumento y se nutre de cientos de miles de desarrolladores, ingenieros de datos, analistas de datos y estudiantes.

    Eche un vistazo al módulo de KQL Learn más reciente y compruebe por sí mismo lo fácil que es convertirse en un maestro de KQL.

    Para obtener más información sobre KQL, consulte Introducción al lenguaje de consulta Kusto (KQL).

  • Conector de Azure Synapse Data Explorer para Microsoft Power Automate, Logic Apps y Power Apps [disponible con carácter general]: el conector de Azure Data Explorer para Power Automate le permite organizar y programar flujos, así como enviar notificaciones y alertas, como parte de una tarea programada o desencadenada. Para más información, consulte Conector de Azure Data Explorer para Microsoft Power Automate y Ejemplos de uso del conector de Azure Data Explorer para Power Automate.

  • Enrutamiento de eventos dinámicos desde Event Hub a varias bases de datos: el enrutamiento de eventos desde Event Hubs, IoT Hub o Event Grid es una actividad que muy común entre los usuarios de Azure Data Explorer (ADX). Anteriormente, solo era posible enrutar los eventos a una base de datos única por cada conexión definida. Si desea enrutar los eventos a varias bases de datos, antes tenía que crear varias conexiones de clúster de ADX.

    Para simplificar esta experiencia, ahora se admite el enrutamiento de datos de eventos a varias bases de datos hospedadas en un único clúster de ADX. Para más información sobre el enrutamiento dinámico, consulte Ingesta desde Event Hub.

  • Configuración de una base de datos mediante un script alineado de KQL como parte de una plantilla JSON de implementación de ARM: anteriormente, Azure Data Explorer admitía la ejecución de un script escrito en el lenguaje de consulta Kusto (KQL) para configurar la base de datos durante la implementación de plantillas de Azure Resource Manager (ARM). Ahora, este proceso es posible mediante un script alineado que se proporciona insertado como parámetro para una plantilla de ARM en un archivo JSON. Para obtener más información sobre el uso de un script alineado de KQL, lea Configuración de una base de datos mediante un script de lenguaje de consulta Kusto.

Integración de datos

  • Exportación de la supervisión de canalización a un archivo .csv: después de recibir muchas solicitudes de la comunidad sobre la capacidad de exportar la supervisión de canalización a archivos .csv, esta se ha agregado como característica. Solo tiene que filtrar la pantalla Ejecuciones de canalización para que muestre los datos que quiere exportar y, después, seleccionar Exportar a CSV*. Para más información sobre el proceso de exportación de la supervisión de canalizaciones y otras mejoras de supervisión, consulte Mejoras de supervisión de Azure Data Factory.

  • Carga incremental de datos fácil para Synapse y Azure Database for PostgreSQL y MySQL: en una solución de integración de datos, suelen darse escenarios en los que se cargan los datos de manera incremental tras una carga de datos completa inicial. Ahora, el proceso de carga incremental de los datos de origen de forma automática ya está disponible de forma nativa para Synapse SQL y Azure Database for PostgreSQL y MySQL. Los usuarios pueden "habilitar la extracción incremental" para que la canalización solo lea las filas insertadas o actualizadas. Para más información sobre la carga de datos incrementales, lea Copia incremental de datos de un almacén de datos de origen a un almacén de datos de destino.

  • Funciones definidas por el usuario para flujos de datos de asignación [versión preliminar pública]: ha llegado hasta nuestra atención que los usuarios pueden tener que repetir la misma manipulación de cadenas, cálculos matemáticos u otras lógicas complejas varias veces. Ahora, con la nueva característica de funciones definidas por el usuario, es posible crear expresiones personalizadas que se puedan reutilizar en varios flujos de datos de asignación. Las funciones definidas por el usuario se agruparán en bibliotecas para ayudar a los desarrolladores a agrupar conjuntos de funciones comunes. Una vez que haya creado una biblioteca de flujo de datos, podrá agregar las funciones definidas por el usuario. Incluso puede agregar varios argumentos para que la función sea más reutilizable. Para más información sobre las funciones definidas por el usuario, lea Funciones definidas por el usuario en flujos de datos de asignación.

  • Control de errores de aserción: ahora, se ha agregado un proceso de control de errores a los receptores, que entra en acción tras los procesos de transformaciones de aserción. El uso de las transformaciones de aserción le permite crear reglas personalizadas para garantizar la calidad de los datos y realizar procesos de validación de datos. Ahora, puede elegir si las filas con errores se van a generar en el receptor seleccionado o, por el contrario, en un archivo independiente. Para más información sobre el control de errores, consulte Transformación de datos de aserción en el flujo de datos de asignación.

  • Edición de proyección de flujos de datos de asignación: se han aplicado nuevas actualizaciones a la UI que le permitirán editar la proyección de origen en los flujos de datos de asignación. Ahora, puede actualizar los nombres y tipos de columna de proyección de origen. Para más información sobre la edición de proyección de origen, consulte Transformación del origen en el flujo de datos de asignación.

Azure Synapse Link para SQL: en el evento Microsoft Build 2022, anunciamos la disponibilidad de Azure Synapse Link para SQL, tanto para la plataforma SQL Server 2022 como para Azure SQL Database. Las conclusiones de calidad controladas por datos son fundamentales para que las empresas sigan siendo competitivas. Por tanto, la velocidad con la que se alcanzan esas conclusiones puede marcar la diferencia. La naturaleza costosa y lenta de las canalizaciones ETL y ELT tradicionales ya no es suficiente para este fin. Con esta versión, podrá aprovechar los procesos de replicación de datos casi en tiempo real desde los almacenes operativos basados en SQL a Azure Synapse Analytics. Estos procesos facilitan la ejecución casi en tiempo real de informes de BI basados en datos operativos, con un impacto mínimo en el almacén operativo. Para más información, vea Anuncio de la versión preliminar pública de Azure Synapse Link para SQL y vea nuestro vídeo de YouTube.

Actualización de abril de 2022

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

SQL

  • La restauración entre suscripciones para Azure Synapse SQL ahora está disponible con carácter general. Anteriormente, se seguían muchos pasos no documentados para restaurar un grupo de SQL dedicado a otra suscripción. Ahora, con la actualización 3.8 del módulo Az.Sql de PowerShell, se puede usar el cmdlet Restore-AzSqlDatabase para la restauración entre suscripciones. Para más información, consulte Restore a dedicated SQL pool (formerly SQL DW) to a different subscription (Restauración de un grupo de SQL dedicado (anteriormente SQL DW) a otra suscripción).

  • Ahora es posible recuperar un grupo de SQL de un servidor o área de trabajo eliminado. Con los cmdlets restauración de PowerShell en los módulos Az.Sql y Az.Synapse, ahora puede restaurar desde un servidor o un área de trabajo eliminados sin abrir una incidencia de soporte técnico. Para más información, consulte Grupos de SQL del área de trabajo de Synapse o Grupos de SQL independientes (anteriormente SQL DW), en función del escenario.

Plantillas de base de datos y diseñador de base de datos de Synapse

  • En función de los comentarios populares de los clientes, hemos hecho mejoras significativas en nuestra experiencia de exploración al crear una base de datos de lago mediante una plantilla del sector. Para más información, lea Inicio rápido: creación de una nueva base de datos de lago mediante plantillas de base de datos.

  • Hemos agregado la opción para clonar una base de datos de lago. Esto desbloquea otras oportunidades para administrar nuevas versiones de bases de datos o admitir esquemas que evolucionan en pasos discretos. Puede clonar rápidamente una base de datos mediante el menú de acciones disponible en la base de datos de lago. Para más información, lea Procedimiento: Clonación de una base de datos de lago.

  • Ahora puede usar caracteres comodín para especificar jerarquías de carpetas personalizadas. Las bases de datos de lago se encuentran sobre los datos que están en el lago y estos datos pueden residir en carpetas anidadas que no encajan en patrones de partición limpios. Anteriormente, para la consulta de bases de datos de lago era necesario que los datos existieran en una estructura de directorio simple que se podía navegar mediante el icono de carpeta sin la capacidad de especificar manualmente la estructura de los directorios o usar caracteres comodín. Para obtener más información, consulte Procedimiento: Modificación de un lago de datos.

Apache Spark para Synapse

Seguridad

  • El rol RBAC del operador de supervisión de Synapse ahora está disponible con carácter general. Debido a la disponibilidad general de Synapse, los clientes han solicitado un rol RBAC específico (control de acceso basado en roles) que permite a un rol de usuario supervisar la ejecución de las aplicaciones de canalizaciones de Synapse y Spark sin tener la capacidad de ejecutar o cancelar la ejecución de estas aplicaciones. Ahora, los clientes pueden asignar el rol de operador de supervisión de Synapse a estos roles de supervisión. Esto permite a las organizaciones mantener la compatibilidad y tener flexibilidad en la delegación de tareas a usuarios o equipos. Para más información, consulte Roles RBAC de Synapse.

Integración de datos

  • Microsoft ha agregado Dataverse como conector de origen y receptor a los flujos de datos de Synapse para que ahora pueda crear trabajos de ETL de transformación de datos de poco código en Synapse directamente con acceso al entorno de Dataverse. Para más información sobre cómo usar este nuevo conector, consulte Propiedades del flujo de datos de asignación.

  • Nos dijo que un tiempo de espera de 1 minuto para la actividad web no bastaba, especialmente en los casos de las API sincrónicas. Ahora, con la propiedad de tiempo de espera de respuesta "httpRequestTimeout", puede definir el tiempo de espera de la solicitud HTTP hasta 10 minutos. Para más información, consulte Mejoras en el tiempo de espera de respuesta de la actividad web.

Experiencia del desarrollador

  • Anteriormente, si quería hacer referencia a un cuaderno en otro cuaderno, solo podía hacer referencia al contenido publicado o confirmado. Ahora, al usar %run notebooks, puede habilitar la "referencia de cuaderno no publicada", lo que le permitirá hacer referencia a cuadernos no publicados. Cuando se habilita, la ejecución del cuaderno capturará el contenido actual en la memoria caché web del cuaderno, lo que significa que otros cuadernos pueden hacer referencia a los cambios en el editor de cuadernos de inmediato sin tener que publicarse (modo activo) ni confirmarse (modo Git). Para más información, consulte Referencia a un cuaderno no publicado.

Actualización de marzo de 2022

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

Experiencia para el desarrollador

  • Las celdas de código de los cuadernos de Synapse que dan como resultado una excepción ahora mostrarán la salida estándar junto con el mensaje de la excepción. Esta característica es compatible con los lenguajes Python y Scala. Para obtener más información, consulte la salida de ejemplo cuando se produce un error en una instrucción de código.

  • Los cuadernos de Synapse ahora admiten salidas parciales al ejecutar celdas de código. Para obtener más información, vea los ejemplos de esta entrada de blog.

  • Ahora puede controlar dinámicamente la configuración de sesión de Spark para la actividad del cuaderno con parámetros de canalización. Para obtener más información, consulte la característica de explorador de variables de los cuadernos de Synapse.

  • Ahora puede reutilizar y administrar sesiones de cuaderno sin tener que iniciar una nueva. Puede conectar fácilmente un cuaderno seleccionado a una sesión activa en la lista iniciada desde otro cuaderno. Puede desasociar una sesión de un cuaderno, detener la sesión y supervisarla. Para obtener más información, consulte cómo administrar las sesiones de cuaderno activas.

  • Los cuadernos de Synapse ahora capturan todo lo que se escribe a través del módulo de registro de Python, además de los registros de controladores. Para obtener más información, consulte Compatibilidad con los registros de Python.

SQL

  • El cifrado de nivel de columna para grupos de SQL dedicados en Azure Synapse ya está disponible con carácter general. Con el cifrado de nivel de columna, puede usar diferentes claves de protección para cada columna y que cada clave tenga sus propios permisos de acceso. Los datos de columnas con cifrado de columna se cifran en el disco y permanecen cifrados en memoria hasta que se usa la función DECRYPTBYKEY para descifrarlos. Para obtener más información, consulte cómo cifrar una columna de datos.

  • Los grupos de SQL sin servidor ahora ofrecen un mejor rendimiento para CETAS (CREATE EXTERNAL TABLE AS SELECT) y las consultas SELECT posteriores. Entre las mejoras de rendimiento, se incluyen un plan de ejecución en paralelo que da lugar a una ejecución de CETAS más rápida y a la salida de varios archivos. Para obtener más información, lea el artículo CETAS con Synapse SQL y esta entrada de blog.

Apache Spark para Synapse

  • El conector Common Data Model (CDM) de Synapse Spark ya está disponible con carácter general. El lector/escritor con formato (CDM) permite que un programa de Spark lea y escriba entidades CDM en una carpeta CDM a través de dataframes de Spark. Para obtener más información, consulte cómo el conector CDM admite la lectura, escritura de datos, ejemplos y problemas conocidos.

  • El conector de grupo de SQL dedicado (DW) de Synapse Spark ahora ofrece un rendimiento mejorado. La nueva arquitectura elimina el movimiento de datos redundante y usa COPY-INTO en lugar de PolyBase. Puede autenticarse a través de la autenticación básica de SQL o con el método de autenticación basado en Azure Active Directory (Azure AD). Ahora es unas cinco veces mejor que la versión anterior. Para obtener más información, consulte Conector del grupo de SQL dedicado de Azure Synapse para Apache Spark.

  • El conector del grupo de SQL dedicado (DW) de Synapse Spark ahora admite todas las opciones saveMode de trama de datos de Spark. Admite los modos Append, Overwrite, ErrorIfExists e Ignore. Append y Overwrite son fundamentales para administrar la ingesta de datos a gran escala. Para obtener más información, consulte Compatibilidad con SaveMode de escritura de dataframes.

  • Acelere la velocidad de ejecución de Spark con la nueva característica de caché inteligente. Esta característica actualmente está en su versión preliminar pública. La caché inteligente almacena automáticamente cada lectura dentro del espacio de almacenamiento en caché asignado. Para ello, detecta los cambios en los archivos subyacentes y actualiza los archivos para proporcionar los datos más recientes. Para obtener más información, consulte cómo habilitar o deshabilitar la memoria caché para un grupo de Apache Spark, o bien lea esta entrada de blog.

Seguridad

Integración de datos

Actualización de febrero de 2022

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

SQL

Integración de datos

Actualización de enero de 2022

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

Apache Spark para Synapse

Ahora puede usar cuatro nuevas plantillas de base de datos en Azure Synapse. Obtenga más información sobre las plantillas Automotive, Genomics, Manufacturing y Pharmaceuticals en la entrada de blog o en el artículo sobre plantillas de base de datos. Estas plantillas se encuentran actualmente en versión preliminar pública y están disponibles en la galería de Synapse Studio.

Machine Learning

Mejoras en la biblioteca de Machine Learning v0.9.5 para Synapse (anteriormente denominada MMLSpark). Esta versión simplifica la creación de canalizaciones de aprendizaje automático escalables de forma masiva con Apache Spark. Para más información, lea la entrada de blog sobre las nuevas funcionalidades de esta versión o consulte las notas de la versión completa.

Seguridad

  • Introducción a la seguridad de Azure Synapse Analytics: unas notas del producto que abarcan las cinco capas de seguridad. Las capas de seguridad incluyen autenticación, control de acceso, protección de datos, seguridad de red y protección contra amenazas. Conozca cada característica de seguridad detalladamente para implementar una línea de base de seguridad estándar del sector y proteger los datos en la nube.

  • Ahora se requiere TLS 1.2 para las áreas de trabajo de Synapse recién creadas. Para más información, consulte cómo TLS 1.2 proporciona seguridad mejorada mediante este artículo o la entrada de blog. Se producirá un error en los intentos de inicio de sesión en el área de trabajo de Synapse recién creada mediante conexiones que usan una versión de TLS anterior a la 1.2.

Integración de datos

SQL de Synapse

Actualización de diciembre de 2021

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

Apache Spark para Synapse

  • Aceleración de cargas de trabajo de Spark con la aceleración de la GPU de NVIDIA GPU blogartículo
  • Montaje de almacenamiento remoto en un grupo de Synapse Spark blogartículo
  • Lectura y escritura nativas de datos en ADLS con Pandas blogartículo
  • Asignación dinámica de ejecutores para Spark blogartículo

Machine Learning

  • Biblioteca de Machine Learning de Synapse blogartículo
  • Introducción a los modelos inteligentes pregenerados de última generación blogartículo
  • Creación de sistemas de inteligencia artificial responsables con la biblioteca de Machine Learning de Synapse blogartículo
  • PREDICT ya está en versión GA para grupos de SQL dedicados de Synapse blogartículo
  • Puntuación simple y escalable con PREDICT y MLFlow para Apache Spark para Synapse blogartículo
  • Soluciones de IA para el comercio minorista blogartículo

Seguridad

  • Las identidades administradas asignadas por el usuario ahora se admiten en Pipelines para Synapse en versión preliminar blogartículo
  • Exploración de carpetas de ADLS Gen2 en un área de trabajo de Azure Synapse Analytics en versión preliminar blogartículo

Integración de datos

  • Actividad de error en canalización blogartículo
  • El flujo de datos de asignación obtiene nuevos conectores nativos blogartículo
  • Más formatos de exportación de cuadernos: HTML, Python y LaTeX blog
  • Tres nuevos tipos de gráficos en la vista de cuaderno: diagrama de caja, histograma y tabla dinámica blog
  • Reconexión a la sesión perdida del cuaderno blog

Integrate

  • Azure Synapse Link para Dataverse blogartículo
  • Particiones personalizadas para Azure Synapse Link para Azure Cosmos DB en versión preliminar blogartículo
  • Herramienta Mapa de datos (versión preliminar pública), una experiencia de extracción, transformación y carga de datos (ETL) guiada sin código blogartículo
  • Reutilización rápida del clúster de Spark blogartículo
  • Transformación de llamada externa blogartículo
  • Flowlets (versión preliminar pública) blogartículo

Actualización de noviembre de 2021

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

Synapse Data Explorer

  • Synapse Data Explorer ya está disponible en versión preliminar blogartículo

Trabajo con bases de datos y lagos de datos

  • Presentación de bases de datos de Data Lake (anteriormente conocidas como bases de datos de Spark) blogartículo
  • El diseñador de bases de datos de Data Lake ya está disponible en versión preliminar blogartículo
  • Plantillas de base de datos y diseñador de base de datos blogartículo

SQL

  • La compatibilidad de Delta Lake con SQL sin servidor está disponible con carácter general blogartículo
  • Consulta de varias rutas de acceso de archivo mediante OPENROWSET en SQL sin servidor blogartículo
  • Las consultas de SQL sin servidor ahora pueden devolver hasta 200 GB de resultados blogartículo
  • Control de filas no válidas con OPENROWSET en SQL sin servidor blogartículo

Apache Spark para Synapse

  • Aceleración de cargas de trabajo de Spark con la aceleración de la GPU de NVIDIA GPU blogartículo
  • Montaje de almacenamiento remoto en un grupo de Synapse Spark blogartículo
  • Lectura y escritura nativas de datos en ADLS con Pandas blogartículo
  • Asignación dinámica de ejecutores para Spark blogartículo

Machine Learning

  • Biblioteca de Machine Learning de Synapse blogartículo
  • Introducción a los modelos inteligentes pregenerados de última generación blogartículo
  • Creación de sistemas de inteligencia artificial responsables con la biblioteca de Machine Learning de Synapse blogartículo
  • PREDICT ya está en versión GA para grupos de SQL dedicados de Synapse blogartículo
  • Puntuación simple y escalable con PREDICT y MLFlow para Apache Spark para Synapse blogartículo
  • Soluciones de IA para el comercio minorista blogartículo

Seguridad

  • Las identidades administradas asignadas por el usuario ahora se admiten en Pipelines para Synapse en versión preliminar blogartículo
  • Exploración de carpetas de ADLS Gen2 en un área de trabajo de Azure Synapse Analytics en versión preliminar blogartículo

Integración de datos

  • Actividad de error en canalización blogartículo
  • El flujo de datos de asignación obtiene nuevos conectores nativos blogartículo
  • Azure Synapse Link para Dataverse blogartículo
  • Particiones personalizadas para Azure Synapse Link para Azure Cosmos DB en versión preliminar blogartículo

Actualización de octubre de 2021

Las siguientes actualizaciones son nuevas para Azure Synapse Analytics este mes.

General

  • Administración de costos con los planes de compra anticipada de Azure Synapse blogartículo
  • Traslado de un área de trabajo de Azure Synapse entre las regiones de Azure blogartículo

Apache Spark para Synapse

  • Optimizaciones de rendimiento de Spark blog

Seguridad

  • Todos los roles RBAC de Synapse ahora están disponibles con carácter general para su uso en producción blogartículo
  • Aplicación de las entidades administradas asignadas por el usuario para el cifrado doble blogartículo
  • Los administradores de Synapse ahora tienen acceso con privilegios elevados a los grupos de SQL dedicados blogartículo

Gobernanza

  • Las áreas de trabajo de Synapse ahora pueden insertar automáticamente datos de linaje en Microsoft Purview blogartículo

Integrate

  • Uso de Stringify en flujos de datos para transformar fácilmente tipos de datos complejos en cadenas blogartículo
  • Control del período de vida (TTL) de la sesión de Spark en los flujos de datos blogartículo

CI/CD y Git

  • Implementación de áreas de trabajo de Synapse mediante Acciones de GitHub blogartículo
  • Más control al crear ramas de Git en Synapse Studio blogartículo

Experiencia para el desarrollador

  • Edición mejorada en Markdown de los cuadernos de Synapse, versión preliminar blogartículo
  • Los dataframes de Pandas se representan automáticamente como tablas HTML con el formato correcto blogartículo
  • Use los widgets de IPython en los cuadernos de Synapse blogartículo
  • El contexto en tiempo de ejecución de Mssparkutils ya está disponible para Python y Scala blogartículo

Pasos siguientes

Introducción a Azure Synapse Analytics