Tarea de Azure Synapse Analytics
Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory
La tarea de Azure Synapse Analytics permite que un paquete SSIS copie datos tabulares a un grupo de SQL dedicado de Azure Synapse Analytics desde el sistema de archivos o Azure Blob Storage. La tarea usa PolyBase para mejorar el rendimiento, tal como se describe en el artículo Azure Synapse Analytics Loading Patterns and Strategies (Patrones y estrategias de carga de Azure Synapse Analytics). El formato de archivo de origen de datos que se admite actualmente es texto delimitado en codificación UTF8. Al copiar desde el sistema de archivos, los datos primero se cargarán a Azure Blob Storage para su almacenamiento provisional y, luego, en el grupo de SQL dedicado. Por lo tanto, se necesita una cuenta de Azure Blob Storage.
Nota
No se admite el administrador de conexiones de Azure Storage con el tipo de servicio de Data Lake Gen2.
A fin de usar Azure Data Lake Gen2 para el origen o el almacenamiento provisional, puede conectarse mediante el administrador de conexiones de Azure Storage con el tipo de Azure Blob Storage.
La tarea de Azure Synapse Analytics es un componente del Feature Pack de SQL Server Integration Services (SSIS) para Azure.
Para agregar una tarea de Azure Synapse Analytics, arrástrela desde el cuadro de herramientas de SSIS y suéltela en el lienzo de diseño. Luego, haga doble clic o clic con el botón derecho y seleccione Editar para que se muestre el cuadro de diálogo del editor de tareas.
En la página General , configure las propiedades siguientes.
SourceType especifica el tipo de almacén de datos de origen. Seleccione uno de estos tipos:
- FileSystem: los datos de origen residen en el sistema de archivos local.
- BlobStorage: los datos de origen residen en Azure Blob Storage.
Estas son las propiedades de cada tipo de origen.
FileSystem
Campo | Descripción |
---|---|
LocalDirectory | Especifica el directorio local que contiene los archivos de datos que se van a cargar. |
Recursively | Especifica si los subdirectorios se deben buscar de forma recursiva. |
FileName | Especifica un filtro de nombre para seleccionar archivos con un determinado patrón de nombre. MiHoja*.xsl* incluirá archivos como MiHoja001.xsl y MiHojaABC.xslx. |
RowDelimiter | Especifica los caracteres que marcan el final de cada fila. |
ColumnDelimiter | Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa). |
IsFirstRowHeader | Especifica si la primera fila de cada archivo de datos contiene nombres de columna en lugar de datos reales. |
AzureStorageConnection | Especifica un administrador de conexiones de Azure Storage. |
BlobContainer | Especifica el nombre del contenedor de blobs en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase. Si no existe ningún contenedor, se creará uno. |
BlobDirectory | Especifica el directorio de blobs (estructura jerárquica virtual) en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase. |
RetainFiles | Especifica si se deben conservar los archivos cargados en Azure Storage. |
CompressionType | Especifica el formato de compresión que se usará al cargar archivos en Azure Storage. El origen local no se verá afectado. |
CompressionLevel | Especifica el nivel de compresión que se usará para el formato de compresión. |
SqlPoolConnection | Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics. |
TableName | Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>. |
TableDistribution | Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName. |
HashColumnName | Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution. |
BlobStorage
Campo | Descripción |
---|---|
AzureStorageConnection | Especifica un administrador de conexiones de Azure Storage. |
BlobContainer | Especifica el nombre del contenedor de blob en el que residen los datos de origen. |
BlobDirectory | Especifica el directorio de blobs (estructura jerárquica virtual) en el que residen los datos de origen. |
RowDelimiter | Especifica los caracteres que marcan el final de cada fila. |
ColumnDelimiter | Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa). |
CompressionType | Especifica el formato de compresión que se usa para los datos de origen. |
SqlPoolConnection | Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics. |
TableName | Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>. |
TableDistribution | Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName. |
HashColumnName | Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution. |
Se mostrará otra página Asignaciones en función de si quiere copiar los datos en una tabla nueva o en una existente. En el primer caso, configure las columnas de origen que se van a asignar y los nombres correspondientes en la tabla de destino que se creará. En el segundo caso, configure las relaciones de asignación entre las columnas de origen y las de destino.
En la página Columnas , configure las propiedades de tipos de datos para cada columna de origen.
En la página T-SQL se muestra la instrucción T-SQL que se usa para cargar datos de Azure Blob Storage al grupo de SQL dedicado. La instrucción T-SQL se genera automáticamente a partir de configuraciones de otras páginas y se ejecuta como parte de la tarea. Puede editar manualmente la instrucción T-SQL generada para adaptarla a sus necesidades concretas haciendo clic en el botón Editar . Puede revertirla para volver a la que se genera automáticamente más tarde haciendo clic en el botón Restablecer .