Compartir a través de


Tarea de Azure Synapse Analytics

Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory

La tarea de Azure Synapse Analytics permite que un paquete SSIS copie datos tabulares a un grupo de SQL dedicado de Azure Synapse Analytics desde el sistema de archivos o Azure Blob Storage. La tarea usa PolyBase para mejorar el rendimiento, tal como se describe en el artículo Azure Synapse Analytics Loading Patterns and Strategies (Patrones y estrategias de carga de Azure Synapse Analytics). El formato de archivo de origen de datos que se admite actualmente es texto delimitado en codificación UTF8. Al copiar desde el sistema de archivos, los datos primero se cargarán a Azure Blob Storage para su almacenamiento provisional y, luego, en el grupo de SQL dedicado. Por lo tanto, se necesita una cuenta de Azure Blob Storage.

Nota

No se admite el administrador de conexiones de Azure Storage con el tipo de servicio de Data Lake Gen2.

A fin de usar Azure Data Lake Gen2 para el origen o el almacenamiento provisional, puede conectarse mediante el administrador de conexiones de Azure Storage con el tipo de Azure Blob Storage.

La tarea de Azure Synapse Analytics es un componente del Feature Pack de SQL Server Integration Services (SSIS) para Azure.

Para agregar una tarea de Azure Synapse Analytics, arrástrela desde el cuadro de herramientas de SSIS y suéltela en el lienzo de diseño. Luego, haga doble clic o clic con el botón derecho y seleccione Editar para que se muestre el cuadro de diálogo del editor de tareas.

En la página General , configure las propiedades siguientes.

SourceType especifica el tipo de almacén de datos de origen. Seleccione uno de estos tipos:

  • FileSystem: los datos de origen residen en el sistema de archivos local.
  • BlobStorage: los datos de origen residen en Azure Blob Storage.

Estas son las propiedades de cada tipo de origen.

FileSystem

Campo Descripción
LocalDirectory Especifica el directorio local que contiene los archivos de datos que se van a cargar.
Recursively Especifica si los subdirectorios se deben buscar de forma recursiva.
FileName Especifica un filtro de nombre para seleccionar archivos con un determinado patrón de nombre. MiHoja*.xsl* incluirá archivos como MiHoja001.xsl y MiHojaABC.xslx.
RowDelimiter Especifica los caracteres que marcan el final de cada fila.
ColumnDelimiter Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa).
IsFirstRowHeader Especifica si la primera fila de cada archivo de datos contiene nombres de columna en lugar de datos reales.
AzureStorageConnection Especifica un administrador de conexiones de Azure Storage.
BlobContainer Especifica el nombre del contenedor de blobs en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase. Si no existe ningún contenedor, se creará uno.
BlobDirectory Especifica el directorio de blobs (estructura jerárquica virtual) en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase.
RetainFiles Especifica si se deben conservar los archivos cargados en Azure Storage.
CompressionType Especifica el formato de compresión que se usará al cargar archivos en Azure Storage. El origen local no se verá afectado.
CompressionLevel Especifica el nivel de compresión que se usará para el formato de compresión.
SqlPoolConnection Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics.
TableName Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>.
TableDistribution Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName.
HashColumnName Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution.

BlobStorage

Campo Descripción
AzureStorageConnection Especifica un administrador de conexiones de Azure Storage.
BlobContainer Especifica el nombre del contenedor de blob en el que residen los datos de origen.
BlobDirectory Especifica el directorio de blobs (estructura jerárquica virtual) en el que residen los datos de origen.
RowDelimiter Especifica los caracteres que marcan el final de cada fila.
ColumnDelimiter Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa).
CompressionType Especifica el formato de compresión que se usa para los datos de origen.
SqlPoolConnection Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics.
TableName Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>.
TableDistribution Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName.
HashColumnName Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution.

Se mostrará otra página Asignaciones en función de si quiere copiar los datos en una tabla nueva o en una existente. En el primer caso, configure las columnas de origen que se van a asignar y los nombres correspondientes en la tabla de destino que se creará. En el segundo caso, configure las relaciones de asignación entre las columnas de origen y las de destino.

En la página Columnas , configure las propiedades de tipos de datos para cada columna de origen.

En la página T-SQL se muestra la instrucción T-SQL que se usa para cargar datos de Azure Blob Storage al grupo de SQL dedicado. La instrucción T-SQL se genera automáticamente a partir de configuraciones de otras páginas y se ejecuta como parte de la tarea. Puede editar manualmente la instrucción T-SQL generada para adaptarla a sus necesidades concretas haciendo clic en el botón Editar . Puede revertirla para volver a la que se genera automáticamente más tarde haciendo clic en el botón Restablecer .