Configurare Archiviazione BLOB di Azure in un'attività di copia
Questo articolo illustra come usare l'attività di copia in una pipeline di dati per copiare dati da e in Archiviazione BLOB di Azure.
Formato supportato
Archiviazione BLOB di Azure supporta i formati di file seguenti. Per impostazioni basate sui formati, fare riferimento ai singoli articoli.
- Formato Avro
- Formato binario
- Formato testo delimitato
- Formato Excel
- Formato JSON
- Formato ORC
- Formato Parquet
- Formato XML
Configurazione supportata
Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.
Generali
Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .
Origine
Le proprietà seguenti sono supportate per Archiviazione BLOB di Azure nella scheda Origine di un'attività di copia.
Sono necessarie le proprietà seguenti:
- Tipo di archivio dati: selezionare Esterno.
- Connessione ion: selezionare una connessione Archiviazione BLOB di Azure dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione Archiviazione BLOB di Azure selezionando Nuovo.
- Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.
- Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere articoli in Formato supportato per informazioni dettagliate.
In Avanzate è possibile specificare i campi seguenti:
Tipo di percorso file: è possibile scegliere Percorso file, Prefisso, Percorso file con caratteri jolly, Elenco di file come tipo di percorso del file. La configurazione di ogni impostazione è:
Percorso file: se si sceglie questo tipo, i dati possono essere copiati dal contenitore o dal percorso di cartella/file specificato in precedenza.
Prefisso: prefisso per il nome del BLOB nel contenitore specificato configurato per filtrare i BLOB di origine. BLOB i cui nomi iniziano con
container/this_prefix
sono selezionati. Usa il filtro lato servizio per l'archiviazione BLOB.Quando si usa Il prefisso e si sceglie di copiare in una destinazione basata su file con conservazione della gerarchia, il sottopercorso dopo l'ultimo "/" nel prefisso viene mantenuto. Ad esempio, si dispone di un'origine
container/folder/subfolder/file.txt
e si configura il prefisso comefolder/sub
, quindi il percorso del file conservato èsubfolder/file.txt
.Percorso del file con caratteri jolly: specificare la cartella o il percorso del file con caratteri jolly nel contenitore BLOB specificato per filtrare le cartelle o i file di origine.
I caratteri jolly consentiti sono
*
(corrispondenza di zero o più caratteri) e?
(corrispondenza di zero caratteri o di un carattere singolo). Usare^
per eseguire l'escape se il nome della cartella ha un carattere jolly o questo carattere di escape all'interno. Per altri esempi, vedere Esempi di filtro di file e cartelle.Percorso cartella con caratteri jolly: specificare il percorso della cartella con caratteri jolly nel contenitore specificato per filtrare le cartelle di origine.
Nome file con caratteri jolly: specificare il nome file con caratteri jolly nel percorso del contenitore e della cartella specificato (o percorso della cartella con caratteri jolly) per filtrare i file di origine.
Elenco di file: indica un determinato set di file in cui eseguire la copia. In Percorso elenco file immettere o passare a un file di testo che include un elenco di file da copiare, un file per riga, ovvero il percorso relativo a ogni file.
Quando si usa questa opzione, non specificare un nome file. Per altri esempi, vedere Esempi di elenco file.
In modo ricorsivo: se questa casella di controllo è selezionata, tutti i file nella cartella di input e le relative sottocartelle vengono elaborati in modo ricorsivo. Se si deseleziona la casella di controllo, vengono elaborate solo quelle nella cartella selezionata. Questa impostazione è disabilitata quando viene selezionato un singolo file.
Elimina file dopo il completamento: se questa casella di controllo è selezionata, i file binari vengono eliminati dall'archivio di origine dopo il corretto spostamento nell'archivio di destinazione. L'eliminazione del file è per file, quindi quando l'attività di copia non riesce, si noterà che alcuni file sono già stati copiati nella destinazione ed eliminati dall'origine, mentre altri rimangono nell'archivio di origine.
Nota
Questa proprietà è valida solo in uno scenario di copia di file binari.
Numero massimo di connessioni simultanee: questa proprietà indica il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Destinazione
Le proprietà seguenti sono supportate per Archiviazione BLOB di Azure nella scheda Destinazione di un'attività di copia.
Sono necessarie le proprietà seguenti:
- Tipo di archivio dati: selezionare Esterno.
- Connessione ion: Selezionare una connessione Archiviazione BLOB di Azure dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione Archiviazione BLOB di Azure selezionando Nuovo.
- Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.
- Impostazioni file: selezionare Impostazioni file per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere articoli in Formato supportato per informazioni dettagliate.
In Avanzate è possibile specificare i campi seguenti:
Comportamento di copia: definisce il comportamento di copia quando l'origine è file da un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Nessuno, FlattenHierarchy o Mantieni gerarchia dall'elenco a discesa.
Aggiungi contenuto dinamico: per specificare un'espressione per un valore della proprietà, selezionare Aggiungi contenuto dinamico. Questa selezione apre il generatore di espressioni in cui è possibile compilare espressioni da variabili di sistema supportate, output di attività, funzioni e variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.
Nessuno: scegliere questa selezione per non usare alcun comportamento di copia.
Gerarchia flat: tutti i file della cartella di origine si trovano nel primo livello della cartella di destinazione. I file di destinazione hanno nomi generati automaticamente.
Mantieni gerarchia: mantiene la gerarchia di file nella cartella di destinazione. Il percorso relativo del file di origine nella cartella di origine è identico al percorso relativo del file di destinazione nella cartella di destinazione.
Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Dimensioni blocco (MB): specificare le dimensioni del blocco, in megabyte, usate per scrivere dati in BLOB in blocchi. Per altre informazioni, vedere Informazioni sui BLOB in blocchi.
Metadati: impostare metadati personalizzati durante la copia in una destinazione. Ogni oggetto sotto la
metadata
matrice rappresenta una colonna aggiuntiva.name
Definisce il nome della chiave di metadati e indicavalue
il valore dei dati di tale chiave. Se viene usata lafunzionalità mantieni attributi, i metadati specificati verranno uniti/sovrascritti con i metadati del file di origine.I valori dei dati consentiti sono:
$$LASTMODIFIED
: una variabile riservata indica di archiviare l'ora dell'ultima modifica dei file di origine. Si applica all'origine basata su file solo con formato binario.Expression
Valore statico
Mapping
Per La configurazione della scheda Mapping , passare a Configurare i mapping nella scheda Mapping. Se si sceglie Binary come formato di file, il mapping non sarà supportato.
Impostazione
Per Impostazioni configurazione della scheda, vedere Configurare le altre impostazioni nella scheda Impostazioni.
Riepilogo tabella
Le tabelle seguenti contengono altre informazioni sull'attività di copia in Archiviazione BLOB di Azure.
Informazioni sull'origine
Nome | Descrizione | Valore | Richiesto | Proprietà script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di origine. | <connessione> | Sì | connection |
Percorso file | Percorso del file dei dati di origine. | <percorso del file dell'origine> | Sì | Contenitore fileName |
Tipo di percorso del file | Tipo di percorso del file da usare. | • Percorso file •Prefisso • Percorso cartella con caratteri jolly, nome file con caratteri jolly • Elenco di file |
No | •Prefisso • wildcardFolderPath, wildcardFileName • fileListPath |
Ricorsivamente | Elaborare tutti i file nella cartella di input e nelle relative sottocartelle in modo ricorsivo o solo quelli nella cartella selezionata. Questa impostazione è disabilitata quando viene selezionato un singolo file. | Selezionato o deselezionato | No | recursive |
Eliminare i file dopo il completamento | I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione del file è per ogni file, quindi quando un'attività di copia ha esito negativo, è possibile indicare che alcuni file sono già stati copiati nella destinazione ed eliminati dall'origine, mentre altri sono ancora presenti nell'archivio di origine. | Selezionato o deselezionato | No | deleteFilesAfterCompletion |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Informazioni sulla destinazione
Nome | Descrizione | Valore | Richiesto | Proprietà script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di destinazione. | <connessione> | Sì | connection |
Percorso file | Percorso del file dei dati di destinazione. | Percorso del file dell'origine | Sì | Contenitore fileName |
Comportamento di copia | Definisce il comportamento durante la copia di file da un file system, ad esempio da un archivio BLOB a un altro, ad esempio da un archivio BLOB a un altro. | •Nessuno • Aggiungere contenuto dinamico • Appiattire la gerarchia • Mantenere la gerarchia |
No | copyBehavior |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Dimensioni blocco (MB) | Specificare le dimensioni del blocco in MB durante la scrittura di dati in Archiviazione BLOB di Azure. Il valore consentito è compreso tra 4 MB e 100 MB. | <dimensioni blocco> | No | blockSizeInMB |
Metadati UFX | Impostare i metadati personalizzati quando si esegue la copia nella destinazione. | • $$LASTMODIFIED •Espressione • Valore statico |
No | metadata |
Contenuto correlato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per