Condividi tramite


Configurare Snowflake in un'attività di copia

Questo articolo illustra come usare l'attività di copia nella pipeline di dati per copiare dati da e in Snowflake.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.

Generali

Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .

Origine

Le proprietà seguenti sono supportate per Snowflake nella scheda Origine di un'attività di copia.

Screenshot che mostra la scheda di origine e l'elenco delle proprietà.

Sono necessarie le proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione: selezionare una connessione Snowflake dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione Snowflake selezionando Nuovo.
  • Database: database predefinito da usare dopo la connessione. Deve essere un database esistente per il quale il ruolo specificato dispone di privilegi.
  • Usare la query: è possibile scegliere Tabella o Query come query di utilizzo. Nell'elenco seguente viene descritta la configurazione di ogni impostazione.
    • Tabella: selezionare la tabella nel database dall'elenco a discesa. In alternativa, selezionare Modifica per immettere manualmente il nome della tabella.
    • Query: specificare la query SQL per leggere i dati da Snowflake. Se i nomi dello schema, della tabella e delle colonne contengono lettere minuscole, virgolette l'identificatore dell'oggetto nella query, select * from "schema"."myTable"ad esempio .

In Avanzate è possibile specificare i campi seguenti:

  • Opzioni aggiuntive di copia snowflake: specificare altre opzioni di copia snowflake che verranno usate nell'istruzione SNOWFlake COPY per caricare i dati. Le opzioni di copia aggiuntive vengono fornite come dizionario di coppie chiave-valore. Esempi: MAX_FILE_SIZE, OVERWRITE. Per altre informazioni, vedere Opzioni di copia Snowflake.

    Screenshot che mostra altre opzioni di copia snowflake per l'origine.

  • Opzioni di formato Snowflake aggiuntive: specificare opzioni di formato Snowflake aggiuntive, che verranno usate nell'istruzione Snowflake COPY per caricare i dati. Le opzioni di formato di file aggiuntive fornite al comando COPY vengono fornite come dizionario di coppie chiave-valore. Esempi: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Per altre informazioni, vedere Opzioni del tipo di formato Snowflake.

    Screenshot che mostra opzioni di formato snowflake aggiuntive per l'origine.

Copia diretta da Snowflake

Se l'archivio dati di destinazione e il formato soddisfano i criteri descritti in questa sezione, è possibile usare il attività Copy per copiare direttamente da Snowflake a destinazione. Il servizio controlla le impostazioni e non riesce l'esecuzione del attività Copy se non vengono soddisfatti i criteri seguenti:

  • La connessione di destinazione è Archiviazione BLOB di Azure con autenticazione della firma di accesso condiviso. Se si vuole copiare direttamente i dati in Azure Data Lake Storage Gen2 nel formato supportato seguente, è possibile creare una connessione BLOB di Azure con l'autenticazione sas nell'account ADLS Gen2.

  • Il formato dei dati di destinazione è Parquet, DelimitedText o JSON con le configurazioni seguenti:

    • Per il formato Parquet , il codec di compressione è None, Snappy o Lzo.
    • Per Formato DelimitedText :
      • Il delimitatore di riga è \r\n o qualsiasi singolo carattere.
      • Il tipo di compressione può essere None, gzip, bzip2 o deflate.
      • La codifica viene lasciata come predefinita o impostata su UTF-8.
      • Il carattere virgolette doppie, virgolette singole o Nessun carattere virgolette.
    • Per il formato JSON , la copia diretta supporta solo il caso in cui il risultato della tabella Snowflake o della query di origine abbia solo una singola colonna e il tipo di dati di questa colonna sia VARIANT, OBJECT o ARRAY.
      • Il tipo di compressione può essere None, gzip, bzip2 o deflate.
      • La codifica viene lasciata come predefinita o impostata su UTF-8.
      • Il modello di file nella destinazione dell'attività di copia viene lasciato come predefinito o impostato su Set di oggetti.
  • Nell'origine dell'attività di copia non vengono specificate colonne aggiuntive.

  • Il mapping delle colonne non è specificato.

Destinazione

Le proprietà seguenti sono supportate per Snowflake nella scheda Destinazione di un'attività di copia.

Screenshot che mostra la scheda Destinazione.

Sono necessarie le proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione: selezionare una connessione Snowflake dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione Snowflake selezionando Nuovo.
  • Database: database predefinito da usare dopo la connessione. Deve essere un database esistente per il quale il ruolo specificato dispone di privilegi.
  • Tabella: selezionare la tabella nel database dall'elenco a discesa. In alternativa, selezionare Modifica per immettere manualmente il nome della tabella.

In Avanzate è possibile specificare i campi seguenti:

  • Script di pre-copia: specificare uno script per l'attività di copia da eseguire prima di scrivere i dati nella tabella di destinazione in ogni esecuzione. È possibile usare questa proprietà per pulire i dati precaricati.

  • Opzioni aggiuntive di copia snowflake: specificare altre opzioni di copia snowflake, che verranno usate nell'istruzione SNOWFlake COPY per caricare i dati. Le opzioni di copia aggiuntive vengono fornite come dizionario di coppie chiave-valore. Esempi: ON_ERROR, FORCE, LOAD_UNCERTAIN_FILES. Per altre informazioni, vedere Opzioni di copia Snowflake.

    Screenshot che mostra altre opzioni di copia snowflake per la destinazione.

  • Opzioni di formato Snowflake aggiuntive: specificare opzioni di formato Snowflake aggiuntive, che verranno usate nell'istruzione Snowflake COPY per caricare i dati. Le opzioni di formato di file aggiuntive fornite al comando COPY vengono fornite come dizionario di coppie chiave-valore. Esempi: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Per altre informazioni, vedere Opzioni del tipo di formato Snowflake.

    Screenshot che mostra opzioni di formato snowflake aggiuntive per la destinazione.

Copia diretta in Snowflake

Se l'archivio dati di origine e il formato soddisfano i criteri descritti in questa sezione, è possibile usare il attività Copy per copiare direttamente dall'origine a Snowflake. Il servizio controlla le impostazioni e non riesce l'esecuzione del attività Copy se non vengono soddisfatti i criteri seguenti:

  • La connessione di origine è Archiviazione BLOB di Azure con autenticazione con firma di accesso condiviso. Se si vuole copiare direttamente i dati da Azure Data Lake Storage Gen2 nel formato supportato seguente, è possibile creare una connessione BLOB di Azure con l'autenticazione sas per l'account ADLS Gen2.

  • Il formato dei dati di origine è Parquet, DelimitedText o JSON con le configurazioni seguenti:

    • Per il formato Parquet , il codec di compressione è Nessuno o Snappy.

    • Per Formato DelimitedText :

      • Il delimitatore di riga è \r\n o qualsiasi singolo carattere. Se il delimitatore di riga non è "\r\n", la prima riga come intestazione non è selezionata e il conteggio delle righe skip non viene specificato.
      • Il tipo di compressione può essere None, gzip, bzip2 o deflate.
      • La codifica viene lasciata come predefinita o impostata su "UTF-8", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "BIG5", "EUC-JP", "" EUC-KR", "GB18030", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2 " ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8855", "ISO-885 9-9", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255".
      • Il carattere virgolette doppie, virgolette singole o Nessun carattere virgolette.
    • Per il formato JSON , la copia diretta supporta solo il caso in cui la tabella Snowflake di destinazione ha solo una singola colonna e il tipo di dati di questa colonna è VARIANT, OBJECT o ARRAY.

      • Il tipo di compressione può essere None, gzip, bzip2 o deflate.
      • La codifica viene lasciata come predefinita o impostata su UTF-8.
      • Il mapping delle colonne non è specificato.
  • Nell'origine attività Copy:

    • Non sono specificate colonne aggiuntive.
    • Se l'origine è una cartella, viene selezionato In modo ricorsivo.
    • Prefisso, ora di inizio (UTC) e ora di fine (UTC) in Filtra per ultima modifica e Abilita individuazione partizione non specificata.

Mapping

Per La configurazione della scheda Mapping , passare a Configurare i mapping nella scheda Mapping.

Impostazione

Per Configurazione della scheda Impostazioni , passare a Configura le altre impostazioni nella scheda Impostazioni.

Riepilogo tabella

Le tabelle seguenti contengono altre informazioni sull'attività di copia in Snowflake.

Origine

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di origine. < connessione > connection
Database Il database usato come origine. < database > database
Usare la query Modo per leggere i dati da Snowflake. •Tavolo
•Quesito
No •tavolo
•quesito
Tabella Nome della tabella da leggere. < nome della tabella di origine> schema
table
Query Query SQL per leggere i dati da Snowflake. < nome della query di origine> query
Opzioni di copia di Snowflake aggiuntive Opzioni di copia aggiuntive, fornite come dizionario di coppie chiave-valore. Esempi: MAX_FILE_SIZE, OVERWRITE. Per altre informazioni, vedere Opzioni di copia Snowflake. • Name
•Valore
No additionalCopyOptions
Opzioni di formato Snowflake aggiuntive Opzioni di formato di file aggiuntive fornite al comando COPY come dizionario di coppie chiave-valore. Esempi: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Per altre informazioni, vedere Opzioni del tipo di formato Snowflake. • Name
•Valore
No additionalFormatOptions

Destinazione

Nota

Anche se le istanze non Azure Snowflake sono supportate per l'origine, solo le istanze di Azure Snowflake sono attualmente supportate per le destinazioni Snowflake (dette anche sink in Azure Data Factory).

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di destinazione. < connessione > connection
Database Database usato come destinazione. < database> /
Tabella Tabella dei dati di destinazione. < nome della tabella di destinazione> •schema
•tavolo
Script di pre-copia Query SQL per il attività Copy da eseguire prima di scrivere dati in Snowflake in ogni esecuzione. Usare questa proprietà per pulire i dati precaricati. < script di pre-copia> NO preCopyScript
Opzioni di copia di Snowflake aggiuntive Opzioni di copia aggiuntive, fornite come dizionario di coppie chiave-valore. Esempi: ON_ERROR, FORCE, LOAD_UNCERTAIN_FILES. Per altre informazioni, vedere Opzioni di copia Snowflake. • Name
•Valore
No additionalCopyOptions
Opzioni di formato Snowflake aggiuntive Opzioni di formato di file aggiuntive fornite al comando COPY, fornite come dizionario di coppie chiave-valore. Esempi: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Per altre informazioni, vedere Opzioni del tipo di formato Snowflake. • Name
•Valore
No additionalFormatOptions