Uso de Azure Synapse Analytics con el análisis a escala de la nube

Azure Synapse Analytics es el servicio de análisis integrado aprovisionado que acelera la obtención de información de los almacenes de datos y los sistemas de macrodatos. Azure Synapse Analytics reúne lo siguiente:

  • Las mejores tecnologías de SQL usadas en el almacenamiento de datos empresariales.
  • Tecnologías de Spark usadas para los macrodatos.
  • Canalizaciones para las aplicaciones de datos (alineadas con el origen) y la extracción, transformación y carga de datos (ETL) o la extracción, carga y transformación de datos (ELT).

Azure Synapse Studio es una herramienta de Azure Synapse que proporciona una experiencia unificada de administración, supervisión, codificación y seguridad. Synapse Studio está profundamente integrado con otros servicios de Azure, como Power BI, Azure Cosmos DB y Azure Machine Learning.

Nota:

Esta sección pretende describir las configuraciones prescritas que son específicas para el análisis a escala de nube. Es un complemento para la documentación oficial de Azure Synapse Analytics.

Información general

Durante la configuración inicial de una zona de aterrizaje de datos, puede implementar un área de trabajo de Azure Synapse Analytics única para que la usen todos los analistas y científicos de datos. Puede crear más áreas de trabajo para integraciones de datos o productos de datos específicos.

Es posible que necesite más áreas de trabajo de Azure Synapse Analytics si el producto de datos necesita proporcionar acceso a los datos estandarizados con seguridad de nivel de fila y columna. Puede proporcionar a estas áreas de trabajo grupos de Azure Synapse. Los equipos de productos de datos pueden requerir su propia área de trabajo para crear productos de datos y un área de trabajo independiente destinada únicamente a los equipos de productos con acceso de desarrollo con ámbito.

Configuración de Azure Synapse Analytics

El primer paso en la implementación de Azure Synapse Analytics es configurar un área de trabajo de Azure Synapse que esté conectada a una cuenta de Azure Purview.

Redes de Azure Synapse Analytics

Una zona de aterrizaje de datos crea áreas de trabajo con una red virtual administrada de Azure Synapse Analytics. La comunicación con Azure Synapse se produce a través de los tres puntos de conexión que expone: grupo de SQL, SQL a petición y el punto de conexión de desarrollo.

En el nivel de red, el análisis a escala de nube usa puntos de conexión privados administrados por Synapse. Estos puntos de conexión garantizan que todo el tráfico entre la red virtual de la zona de aterrizaje de datos y las áreas de trabajo de Azure Synapse se mueve completamente a través de la red troncal de Microsoft.

Control de acceso a datos de Azure Synapse

Use listas de control de acceso con el tránsito de Microsoft Entra en Azure Synapse Analytics para administrar el acceso a los archivos del lago de datos.

Para los datos en los que necesite restringir las columnas y filas devueltas, se recomienda la seguridad de nivel de fila y de columna para restringir el acceso a los datos en las tablas de un grupo dedicado o sin servidor de Azure Synapse SQL. La seguridad de nivel de fila y la seguridad de nivel de columna se implementan en el nivel de base de datos y además de los roles de base de datos.

Por ejemplo, la seguridad de nivel de fila garantiza que los usuarios de una aplicación de datos (alineada con el origen) o un producto de datos específicos solo vean sus propios datos. incluso si la tabla contiene datos de toda la empresa.

Puede combinar la seguridad de nivel de fila con la seguridad de nivel de columna para restringir el acceso a columnas con datos confidenciales. De este modo, tanto la seguridad de nivel de fila como la seguridad de nivel de columna aplican la lógica de restricción de acceso en el nivel de base de datos y no en el nivel de aplicación. El permiso se evalúa cada vez que se intenta acceder a los datos desde cualquier nivel.

Nota:

El grupo de SQL sin servidor de Azure Synapse admite la seguridad de nivel de columna para las vistas y no para las tablas externas. En el caso de las tablas externas, se puede crear una vista lógica sobre la tabla externa y que aplicar seguridad de nivel de columna. En el caso de la seguridad de nivel de fila, las vistas personalizadas se pueden usar como solución alternativa.

Para más información, consulte control de acceso a datos de Azure Synapse Analytics.

Control de acceso a datos de Azure Synapse en Azure Data Lake

Al implementar un área de trabajo de Azure Synapse Analytics, necesita una cuenta de Azure Data Lake Storage de la suscripción o usar manualmente la dirección URL de la cuenta de almacenamiento. La cuenta de almacenamiento especificada se establece como principal para que el área de trabajo de Azure Synapse implementada almacene sus datos. Azure Synapse almacena datos en un contenedor que incluye tablas Apache Spark y registros de aplicación de Spark en una carpeta denominada /synapse/{workspaceName} . También tiene un contenedor para administrar las bibliotecas que elija instalar.

Sugerencia

Se recomienda usar un contenedor dedicado en la cuenta de la capa de desarrollo o de las tres cuentas de lago de datos. Este contenedor se usa como almacenamiento principal para almacenar los metadatos de Spark.

Consulte Control de acceso a datos de Azure Synapse Analytics para obtener recomendaciones sobre cómo configurar el acceso a datos.

Pasos siguientes