Configuración de SFTP en una actividad de copia

En este artículo se resume cómo usar la actividad de copia en la canalización de datos para copiar datos desde SFTP.

Formato admitido

SFTP admite los siguientes formatos de archivo. Consulte los artículos para conocer la configuración basada en el formato.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Origen

Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Screenshot showing source tab and the list of properties.

Se requieren las siguientes tres propiedades:

  • Tipo de banco de datos : Seleccione Externo.

  • Conexión: Seleccione una conexión SFTP en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de SFTP seleccionando Nuevo.

  • Tipo de ruta de acceso de archivo: seleccione de Ruta de acceso de archivo, Ruta de acceso de archivo comodín y Lista de archivos en función de la forma en que quiera leer los archivos.

    • Ruta de acceso de archivo: si elige este tipo, especifique la ruta de acceso del archivo de origen. Puede seleccionar Examinar para seleccionar los archivos de origen o escribir manualmente la ruta de acceso del archivo.

    • Ruta de acceso de archivo comodín: si elige este tipo, especifique las Rutas de acceso comodín para filtrar las carpetas o archivos de origen.

      Los caracteres comodín permitidos son: * (equivale a cero o a varios caracteres) y ? (equivale a cero o a un único carácter). Use ^ como escape si el nombre de la carpeta contiene un carácter comodín o este carácter de escape. Para obtener más ejemplos, vaya a Ejemplos de filtros de carpetas y archivos .

      Screenshot showing wildcard file path.

      Ruta de acceso de carpeta comodín: especifique la ruta de acceso de la carpeta con caracteres comodín para filtrar las carpetas de origen.

      Nombre del archivo comodín: especifique el nombre del archivo con caracteres comodín debajo de la ruta de la carpeta (o la ruta de la carpeta comodín) para filtrar los archivos de origen.

    • Lista de archivos: si selecciona este tipo, especifique la ruta de acceso de la carpeta y la ruta de acceso del archivo para indicar que se copia un conjunto de archivos determinado. Señale un archivo de texto que incluya una lista de los archivos que quiere copiar, con un archivo por línea. Para obtener más ejemplos, vaya a Ejemplos de lista de archivos .

      • Ruta de acceso de la carpeta: especifique la ruta de acceso a la carpeta de origen. Es obligatorio.

      • Ruta de acceso a la lista de archivos: especifique la ruta de acceso del archivo de texto que incluye una lista de archivos que desea copiar.

        Screenshot showing list of files.

  • Formato de archivo: seleccione el formato de archivo en la lista desplegable. Seleccione Configuración para configurar el formato de archivo. Para ver la configuración de diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada.

En Avanzado, puede especificar los campos siguientes:

  • Filtrar por última modificación: los archivos se filtran en función de las fechas de última modificación que especifique. Esta propiedad no se aplica cuando se configura el tipo de ruta de acceso de archivos como Lista de archivos.

    • Hora de inicio (UTC): los archivos se seleccionan si su última hora de modificación es mayor o igual que la hora configurada.
    • Hora de finalización (UTC): los archivos se seleccionan si su última hora de modificación es inferior a la hora configurada.

    Cuando Hora de inicio (UTC) tiene el valor de fecha y hora, pero Hora de finalización (UTC) es NULL, significa que se seleccionarán los archivos cuyo último atributo modificado sea mayor o igual que el valor de la fecha y hora. Cuando Hora de finalización (UTC) tiene el valor de fecha y hora, pero Hora de inicio (UTC) es NULL, significa que se seleccionarán los archivos cuyo último atributo modificado sea inferior al valor de la fecha y hora. Las propiedades pueden ser NULL, en cuyo caso no se aplica ningún filtro de atributo de archivo al conjunto de datos.

  • Deshabilitar la fragmentación: la fragmentación está diseñada para optimizar el rendimiento y pasa desapercibida. Esta opción permite deshabilitar la fragmentación dentro de cada archivo. Al copiar datos desde SFTP, el servicio intenta obtener primero la longitud del archivo y, después, divide el archivo en varias partes y los lee en paralelo. Especifique si el servidor SFTP admite la obtención de la longitud del archivo o la búsqueda de lectura desde un desplazamiento determinado. No está seleccionado de forma predeterminada.

  • Habilitar la detección de particiones: especifique si quiere analizar las particiones de la ruta de acceso del archivo y agregarlas como columnas de origen adicionales. No se selecciona de forma predeterminada y no se admite cuando se usa el formato de archivo binario.

    • Ruta de acceso a la partición: cuando se habilita la detección de particiones, especifique la ruta de acceso raíz absoluta para leer las carpetas particionadas como columnas de datos.
      Si no se especifica, de forma predeterminada,

      • Cuando se usa la ruta de acceso de archivo o una lista de archivos del origen, la ruta de acceso raíz de la partición es la ruta de acceso que ha configurado.
      • Cuando se usa el filtro de carpeta con caracteres comodín, la ruta de acceso raíz de la partición es la subruta antes del primer carácter comodín.

      Por ejemplo, suponiendo que configura la ruta de acceso como root/folder/year=2020/month=08/day=27:

      • Si especifica la ruta de acceso raíz de la partición como root/folder/year=2020, la actividad de copia generará dos columnas más, mes y día, con el valor "08" y "27", respectivamente, además de las columnas de los archivos.
      • Si no se especifica la ruta de acceso raíz de la partición, no se generará ninguna columna adicional.

      Screenshot showing Enable partition discovery.

  • Máximo de conexiones simultáneas: esta propiedad indica el límite superior de conexiones simultáneas establecidas con el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.

  • Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia.

Destination

Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Screenshot showing destination tab and the list of properties.

  • Tipo de almacén de datos: seleccione Externo.
  • Conexión: Seleccione una conexión SFTP en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de SFTP seleccionando Nuevo.
  • Ruta de acceso del archivo: especifique la ruta de acceso del archivo en la que escribir los datos. Puede seleccionar Examinar para seleccionar los archivos de origen o escribir manualmente la ruta de acceso del archivo.
  • Formato de archivo: seleccione el formato de archivo en la lista desplegable. Seleccione Configuración para configurar el formato de archivo. Para ver la configuración de diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada.

En Avanzado, puede especificar los campos siguientes:

  • Comportamiento de la copia: especifique el comportamiento de la copia cuando el origen son archivos de un almacén de datos basado en archivos. Elija entre las siguientes propiedades.

    • Aplanar jerarquía: todos los archivos de la carpeta de origen están en el primer nivel de la carpeta de destino. Los archivos de destino tienen nombres generados automáticamente.
    • Combinar archivos: combina todos los archivos de la carpeta de origen en un archivo. Si se especifica el nombre del archivo, el nombre de archivo combinado es el nombre especificado. De lo contrario, es un nombre de archivo generado automáticamente.
    • Conservar jerarquía (valor predeterminado): conserva la jerarquía de archivos en la carpeta de destino. La ruta de acceso relativa del archivo de origen a la carpeta de origen es idéntica que la ruta de acceso relativa del archivo de destino a la carpeta de destino.
    • Agregar contenido dinámico: seleccione esta opción para especificar el comportamiento de la copia mediante el contenido dinámico.
  • Máximo de conexiones simultáneas: límite superior de conexiones simultáneas establecidas con el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.

  • Tiempo de espera de la operación (minutos): especifique el tiempo de espera para escribir cada fragmento en el servidor SFTP. El valor predeterminado es 60 minutos.

  • Subir con archivos temporales: especifique si desea cargar en archivos temporales y cambiarles el nombre, o bien escribir directamente en la ubicación de la carpeta o archivo de destino. De forma predeterminada, es seleccionado y el servicio primero escribe en archivos temporales y, a continuación, les cambia el nombre cuando finaliza la carga.

    Esta secuencia ayuda a (1) evitar conflictos que podrían dañar el archivo si tiene otros procesos que escriben en el mismo archivo y (2) asegurarse de que la versión original del archivo existe durante la transferencia. Si el servidor SFTP no admite la operación de cambio de nombre, deshabilite esta opción y asegúrese de que no tiene una escritura simultánea en el archivo de destino.

    Sugerencia

    Si recibe el error "UserErrorSftpPathNotFound", "UserErrorSftpPermissionDenied" o "SftpOperationFail" cuando escribe datos en SFTP, y el usuario de SFTP que usa tiene los permisos adecuados, compruebe si funciona la operación de cambio de nombre del archivo de compatibilidad del servidor SFTP. Si no es así, deshabilite la opción Cargar con archivo temporal e inténtelo de nuevo.

Asignación

Para la configuración de la pestaña Asignación, vea Configurar las asignaciones en la pestaña asignación . Si elige Binario como formato de archivo, no se admitirá la asignación.

Configuración

Para la configuración de la pestañaConfiguración, vaya a Configurar los otros parámetros en la ficha Configuración .

Resumen de tabla

La tabla siguiente contiene más información sobre la actividad de la copia en SFTP.

Source

Nombre Descripción Value Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Connection La conexión SFTP al almacén de datos de origen. < la conexión SFTP > conexión
Tipo de ruta de acceso de archivo El tipo de ruta de acceso de archivo que se usa para obtener datos de origen. Ruta del archivo
Ruta de acceso del archivo con carácter comodín
Lista de archivos
/
Ruta de acceso del archivo La ruta de acceso al archivo de origen. < ruta del archivo> fileName
folderPath
Ruta de acceso con carácter comodín La ruta de acceso comodín al archivo de origen. < ruta de acceso del archivo con carácter comodín> Sí para el nombre de archivo comodín wildcardFolderPath
wildcardFileName
Folder path (Ruta de acceso a la carpeta) La ruta de acceso a la carpeta de origen. < escriba la ruta de acceso de la carpeta> folderPath
Ruta de acceso a la lista de archivos Indica que se copie un conjunto de archivos determinado. Señale un archivo de texto que incluya una lista de los archivos que quiere copiar, con un archivo por línea. > ruta de acceso de la lista de archivos < No fileListPath
Formato de archivo El formato de archivo para los datos de origen. Para ver la configuración de los diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada. / /
Filtrar por última modificación Los archivos con la hora de la última modificación en el intervalo [Hora de inicio, Hora de finalización) se filtrarán para su posterior procesamiento. La hora se aplicará a la zona horaria UTC con el formato yyyy-mm-ddThh:mm:ss.fffZ. Esta propiedad se puede omitir, lo que significa que no se aplicará ningún filtro de atributo de archivo. Esta propiedad no se aplica cuando se configura el tipo de ruta de acceso de archivos como Lista de archivos. datetime No modifiedDatetimeStart
modifiedDatetimeEnd
Deshabilitar fragmentación La fragmentación está diseñada para optimizar el rendimiento y se produce debajo. Esta opción permite deshabilitar la fragmentación dentro de cada archivo. Al copiar datos desde SFTP, el servicio intenta obtener primero la longitud del archivo y, después, divide el archivo en varias partes y los lee en paralelo. Especifique si el servidor SFTP admite la obtención de la longitud del archivo o la búsqueda de lectura desde un desplazamiento determinado. seleccionado o no seleccionado (valor predeterminado) No disableChunking:
true o false (valor predeterminado)
Habilitar detección de particiones Indica si se analizan las particiones de la ruta de acceso del archivo y se agregan como columnas de origen adicionales. seleccionado o no seleccionado (valor predeterminado) No enablePartitionDiscovery:
true o false (valor predeterminado)
Ruta de acceso raíz de la partición La ruta de acceso raíz de partición absoluta para leer carpetas con particiones como columnas de datos. Especifíquelo cuando la detección de particiones esté habilitada. < ruta de acceso raíz de la partición > No partitionRootPath
Número máximo de conexiones simultáneas Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. < límite superior de conexiones simultáneas >
(entero)
No maxConcurrentConnections
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia • Nombre
• Valor
No additionalColumns:
• nombre
• value

Destination

Nombre Descripción Value Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Connection La conexión al SFTP de origen. < su conexión > conexión
Ruta de acceso del archivo Ruta de acceso del archivo de los datos de destino. Ruta de acceso del archivo del destino folderPath
fileName
Formato de archivo El formato de archivo para los datos de origen. Para ver la configuración de los diferentes formatos de archivo, consulte artículos en Formato admitido para obtener información detallada. / /
Comportamiento de copia Define el comportamiento de copia cuando el origen son archivos de un almacén de datos basados en archivos. • Aplanar jerarquía
• Combinar de archivos
• Conservar jerarquía
No copyBehavior:
- FlattenHierarchy
- MergeFiles
- PreserveHierarchy
Número máximo de conexiones simultáneas Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. < número máximo de conexiones simultáneas > No maxConcurrentConnections
Tiempo de espera de la operación (minutos) El tiempo de espera para escribir cada fragmento en el servidor SFTP. < tiempo de espera de la operación >
El valor predeterminado es 60
No operationTimeout
Carga con archivo temporal Indica si se van a cargar archivos temporales y cambiar el nombre. Deshabilite esta opción si el servidor SFTP no admite la operación de cambio de nombre. seleccionado (predeterminado) o no seleccionado No useTempFileRename:
true (valor predeterminado) o false