Configuración de Azure Blob Storage en la actividad de copia
En este artículo se describe cómo usar la actividad de copia en la canalización de datos para copiar datos de y hacia Azure Blob Storage.
Importante
Microsoft Fabric está actualmente en versión preliminar. Esta información está relacionada con un producto en versión preliminar que puede modificarse considerablemente antes de su lanzamiento. Microsoft no ofrece ninguna garantía, expresa o implícita, con respecto a la información que se ofrece aquí. Consulte Azure Data Factory documentación del servicio en Azure.
Formato admitido
Azure Blob Storage admite los siguientes formatos de archivo. Consulte los artículos para conocer la configuración basada en el formato.
- Formato Avro
- Formato binario
- Formato de texto delimitado
- Formato Excel
- Formato JSON
- Formato ORC
- Formato Parquet
- Formato XML
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instrucciones de configuración general para configurar la pestaña Configuración general.
Origen
Las siguientes propiedades se admiten para Azure Blob Storage en la pestaña Origen de una actividad de copia.
Se requieren las siguientes propiedades:
- Tipo de almacén de datos: seleccione Externo.
- Conexión: seleccione una conexión de Azure Blob Storage en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión Azure Blob Storage seleccionando Nuevo.
- Ruta de acceso del archivo: seleccione Examinar para elegir el archivo que desea copiar o rellene manualmente la ruta de acceso.
- Configuración del archivo: seleccione Opciones de archivo para configurar el formato de archivo. Para ver la configuración de diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada.
En Avanzado, puede especificar los campos siguientes:
Tipo de ruta de acceso de archivo: puede elegir Ruta de acceso de archivo, Prefijo, Ruta de acceso de archivo comodín, Lista de archivos como tipo de ruta de acceso de archivo. La configuración de cada valor es:
Ruta de acceso del archivo: si elige este tipo, los datos se pueden copiar del contenedor o carpeta o ruta de acceso de archivo especificados anteriormente.
Prefijo: prefijo para el nombre del blob en el contenedor especificado configurado para filtrar los blobs de origen. Se seleccionan los blobs cuyo nombre comienza con
container/this_prefix
. Utiliza el filtro del lado del servicio para Blob Storage.Cuando se usa prefijo y se elige copiar en un destino basado en archivos con conservación de la jerarquía, se conserva la subruta después de la última "/" del prefijo. Por ejemplo, tiene un origen
container/folder/subfolder/file.txt
y configura el prefijo comofolder/sub
y, a continuación, la ruta de acceso del archivo conservado essubfolder/file.txt
.Ruta de acceso de archivo comodín: especifique la ruta de acceso de carpeta o archivo con caracteres comodín en el contenedor de blobs determinado para filtrar las carpetas o archivos de origen.
Los caracteres comodín permitidos son:
*
(equivale a cero o a varios caracteres) y?
(equivale a cero o a un único carácter). Use^
como escape si el nombre de la carpeta contiene un carácter comodín o este carácter de escape. Para obtener más ejemplos, vaya a Ejemplos de filtros de carpetas y archivos.Ruta de acceso de carpeta con caracteres comodín: especifique la ruta de acceso de la carpeta con caracteres comodín en el contenedor especificado para filtrar las carpetas de origen.
Nombre de archivo comodín: especifique el nombre de archivo con caracteres comodín en la ruta de acceso de carpeta y contenedor especificada (o ruta de acceso de carpeta comodín) para filtrar los archivos de origen.
Lista de archivos: indica un archivo determinado establecido en copiar. En Ruta de acceso a la lista de archivos, escriba o busque un archivo de texto que incluya una lista de archivos que desea copiar, un archivo por línea, que es la ruta de acceso relativa a cada archivo.
Cuando use esta opción, no especifique un nombre de archivo. Para obtener más ejemplos, vaya a Ejemplos de lista de archivos.
Recursivamente: si esta casilla está activada, todos los archivos de la carpeta de entrada y sus subcarpetas se procesan de forma recursiva. Si anula la selección de la casilla, solo se procesan las de la carpeta seleccionada. Esta configuración está deshabilitada cuando se selecciona un único archivo.
Eliminar archivos después de la finalización: si esta casilla está seleccionada, los archivos binarios se eliminan del almacén de origen después de moverse correctamente al almacén de destino. La eliminación de archivos es por archivo, por lo que, cuando se produce un error en la actividad de copia, observará que algunos archivos ya se han copiado en el destino y eliminado del origen, mientras que otros todavía permanecen en el almacén de origen.
Nota:
Esta propiedad solo es válida en un escenario de copia de archivos binarios.
Número máximo de conexiones simultáneas: esta propiedad indica el límite superior de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.
Destination
Se admiten las siguientes propiedades para Azure Blob Storage en la pestaña Destino de una actividad de copia.
Se requieren las siguientes propiedades:
- Tipo de almacén de datos: Seleccione Externo.
- Conexión: Seleccione una conexión Azure Blob Storage en la lista de conexiones. Si la conexión no existe, cree una nueva conexión Azure Blob Storage seleccionando Nuevo.
- Ruta de acceso del archivo: Seleccione Examinar para elegir el archivo que desea copiar o rellenar manualmente la ruta de acceso.
- Configuración del archivo: seleccione Opciones de archivo para configurar el formato de archivo. Para ver la configuración de diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada.
En Avanzado, puede especificar los campos siguientes:
Comportamiento de copia: define el comportamiento de copia cuando el origen es archivos de un almacén de datos basado en archivos. Puede elegir Agregar contenido dinámico, Ninguno, FlattenHierarchy o Conservar jerarquía en la lista desplegable.
Agregar contenido dinámico: para especificar una expresión para un valor de propiedad, seleccione Agregar contenido dinámico. Esta selección abre el generador de expresiones donde puede crear expresiones a partir de variables del sistema admitidas, salida de actividad, funciones y variables o parámetros especificados por el usuario. Para obtener información sobre el lenguaje de expresiones, vaya a Expresiones y funciones.
Ninguno: elija esta selección para no usar ningún comportamiento de copia.
Jerarquía plana: todos los archivos de la carpeta de origen están en el primer nivel de la carpeta de destino. Los archivos de destino tienen nombres generados automáticamente.
Conservar jerarquía: conserva la jerarquía de archivos en la carpeta de destino. La ruta de acceso relativa del archivo de origen que apunta a la carpeta de origen es idéntica a la ruta de acceso relativa del archivo de destino que apunta a la carpeta de destino.
Número máximo de conexiones simultáneas: límite superior de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.
Tamaño de bloque (MB): especifique el tamaño del bloque, en megabytes, que se usa para escribir datos en blobs en bloques. Para más información, vaya a Acerca de los blobs en bloques.
Metadatos: establezca metadatos personalizados al copiar en un destino. Cada objeto de la matriz
metadata
representa una columna adicional.name
define el nombre de la clave de metadatos yvalue
indica el valor de los datos de esa clave. Si se usa lacaracterística de conservación de atributos , los metadatos especificados unionarán o sobrescribirán con los metadatos del archivo de origen.Los valores permitidos de los datos son:
$$LASTMODIFIED
: una variable reservada indica que se debe almacenar la hora de la última modificación de los archivos de origen. Se aplica solo al origen basado en archivos con formato binario.Expression
Valor estático
Asignación
En Configuración de la pestaña Asignación , vaya a Configurar las asignaciones en la pestaña Asignación. Si elige Binario como formato de archivo, no se admitirá la asignación.
Configuración
Para la configuración de la pestaña Configuración , consulte Configuración de otras opciones en la pestaña Configuración.
Resumen de tabla
Las tablas siguientes contienen más información sobre la actividad de copia en Azure Blob Storage.
Información de origen
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | Tipo de almacén de datos. | Externo | Sí | / |
Connection | La conexión al almacén de datos de origen. | <la conexión> | Sí | conexión |
Ruta de acceso del archivo | Ruta de acceso del archivo de los datos de origen. | <ruta de acceso de archivo del origen> | Sí | contenedor fileName |
Tipo de ruta de acceso de archivo | Tipo de ruta de acceso de archivo que desea usar. | • Ruta de acceso del archivo •Prefijo • Ruta de acceso de carpeta comodín, nombre de archivo comodín • Lista de archivos |
No | •Prefijo • wildcardFolderPath, wildcardFileName • fileListPath |
Recursively | Procese todos los archivos de la carpeta de entrada y sus subcarpetas de forma recursiva o solo las de la carpeta seleccionada. Esta configuración está deshabilitada cuando se selecciona un único archivo. | Selección o anulación de selección | No | recursive |
Eliminar archivos después de la finalización | Los archivos del almacén de datos de origen se eliminarán justo después de moverse al almacén de destino. La eliminación de archivos es por archivo, por lo que cuando se produce un error en una actividad de copia, observará que algunos archivos ya se han copiado en el destino y eliminado del origen, mientras que otros todavía están en el almacén de origen. | Selección o anulación de selección | No | deleteFilesAfterCompletion |
Número máximo de conexiones simultáneas | Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. | <número máximo de conexiones simultáneas> | No | maxConcurrentConnections |
Información de destino
Nombre | Descripción | Value | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | Tipo de almacén de datos. | Externo | Sí | / |
Connection | La conexión al almacén de datos de destino. | <la conexión> | Sí | conexión |
Ruta de acceso del archivo | Ruta de acceso del archivo de los datos de destino. | Ruta de acceso del archivo del origen | Sí | contenedor fileName |
Comportamiento de copia | Define el comportamiento al copiar archivos de un sistema de archivos, como el almacenamiento, al otro (por ejemplo, de un almacenamiento de blobs a otro). | •Ninguno • Agregar contenido dinámico • Jerarquía de aplanar • Conservar la jerarquía |
No | copyBehavior |
Número máximo de conexiones simultáneas | Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. | <número máximo de conexiones simultáneas> | No | maxConcurrentConnections |
Tamaño de bloque (MB) | Especifique el tamaño del bloque en MB al escribir datos en Azure Blob Storage. El valor permitido está entre 4 y 100 MB. | <tamaño de bloque> | No | blockSizeInMB |
Metadatos | Establezca los metadatos personalizados al copiar en el destino. | • $$LASTMODIFIED •Expresión • Valor estático |
No | metadata |