Dela via


Konfigurera Snowflake i en kopieringsaktivitet

Den här artikeln beskriver hur du använder kopieringsaktiviteten i datapipelinen för att kopiera data från och till Snowflake.

Konfiguration som stöds

För konfigurationen av varje flik under kopieringsaktivitet går du till följande avsnitt.

Allmänt

Se vägledningen allmänna inställningar för att konfigurera fliken Allmänna inställningar.

Källa

Följande egenskaper stöds för Snowflake under fliken Källa i en kopieringsaktivitet.

Screenshot showing the source tab and the list of properties.

Följande egenskaper krävs:

  • Datalagertyp: Välj Extern.
  • Anslut ion: Välj en Snowflake-anslutning i anslutningslistan. Om anslutningen inte finns skapar du en ny Snowflake-anslutning genom att välja Ny.
  • Databas: Standarddatabasen som ska användas när den är ansluten. Det bör vara en befintlig databas som den angivna rollen har behörighet för.
  • Använd fråga: Du kan välja tabell eller fråga som användningsfråga. I följande lista beskrivs konfigurationen för varje inställning.
    • Tabell: Välj tabellen i databasen i listrutan. Eller markera Redigera för att ange tabellnamnet manuellt.
    • Fråga: Ange SQL-frågan för att läsa data från Snowflake. Om namnen på schemat, tabellen och kolumnerna innehåller gemener citerar du objektidentifieraren i frågan, t.ex. select * from "schema"."myTable".

Under Avancerat kan du ange följande fält:

  • Ytterligare snowflake-kopieringsalternativ: Ange ytterligare snowflake-kopieringsalternativ som ska användas i Snowflake COPY-instruktionen för att läsa in data. Ytterligare kopieringsalternativ tillhandahålls som en ordlista med nyckel/värde-par. Exempel: MAX_FILE_SIZE, SKRIV ÖVER. Mer information finns i Snowflake-kopieringsalternativ.

    Screenshot showing additional snowflake copy options for source.

  • Ytterligare formatalternativ för Snowflake: Ange ytterligare formatalternativ för Snowflake, som ska användas i Snowflake COPY-instruktionen för att läsa in data. Ytterligare filformatalternativ som tillhandahålls till kommandot COPY tillhandahålls som en ordlista med nyckel/värde-par. Exempel: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Mer information finns i Formattypsalternativ för Snowflake.

    Screenshot showing additional snowflake format options for source.

Direktkopia från Snowflake

Om måldatalagret och formatet uppfyller kriterierna som beskrivs i det här avsnittet kan du använda aktiviteten Kopiera för att kopiera direkt från Snowflake till målet. Tjänsten kontrollerar inställningarna och misslyckas med aktiviteten Kopiera köras om följande villkor inte uppfylls:

  • Målanslutningenär Azure Blob Storage med signaturautentisering för delad åtkomst. Om du vill kopiera data direkt till Azure Data Lake Storage Gen2 i följande format som stöds kan du skapa en Azure Blob-anslutning med SAS-autentisering mot ditt ADLS Gen2-konto.

  • Måldataformatet är Parquet, DelimitedText eller JSON med följande konfigurationer:

    • För Parquet-format är komprimeringskodcen Ingen, Snappy eller Lzo.
    • För avgränsattextformat :
      • Radgränsare är \r\n eller ett enskilt tecken.
      • Komprimeringstypen kan vara None, gzip, bzip2 eller deflate.
      • Kodning lämnas som standard eller anges till UTF-8.
      • Citattecken är dubbelt citattecken, enkelt citattecken eller Inget citattecken.
    • För JSON-format stöder direktkopiering endast fallet att snowflake-källtabellen eller frågeresultatet bara har en enda kolumn och datatypen för den här kolumnen är VARIANT, OBJECT eller ARRAY.
      • Komprimeringstypen kan vara None, gzip, bzip2 eller deflate.
      • Kodning lämnas som standard eller anges till UTF-8.
      • Filmönstret i kopieringsaktivitetens mål är kvar som standard eller inställt på Uppsättning objekt.
  • Ytterligare kolumner har inte angetts i kopieringsaktivitetskällan.

  • Kolumnmappning har inte angetts.

Mål

Följande egenskaper stöds för Snowflake under fliken Mål för en kopieringsaktivitet.

Screenshot showing Destination tab.

Följande egenskaper krävs:

  • Datalagertyp: Välj Extern.
  • Anslut ion: Välj en Snowflake-anslutning i anslutningslistan. Om anslutningen inte finns skapar du en ny Snowflake-anslutning genom att välja Ny.
  • Databas: Standarddatabasen som ska användas när den är ansluten. Det bör vara en befintlig databas som den angivna rollen har behörighet för.
  • Tabell: Välj tabellen i databasen i listrutan. Eller markera Redigera för att ange tabellnamnet manuellt.

Under Avancerat kan du ange följande fält:

  • Förkopieringsskript: Ange ett skript för kopieringsaktivitet som ska köras innan du skriver data till måltabellen i varje körning. Du kan använda den här egenskapen för att rensa inlästa data.

  • Ytterligare snowflake-kopieringsalternativ: Ange ytterligare alternativ för Snowflake-kopiering, som ska användas i Snowflake COPY-instruktionen för att läsa in data. Ytterligare kopieringsalternativ tillhandahålls som en ordlista med nyckel/värde-par. Exempel: ON_ERROR, FORCE, LOAD_UNCERTAIN_FILES. Mer information finns i Snowflake-kopieringsalternativ.

    Screenshot showing additional snowflake copy options for destination.

  • Ytterligare formatalternativ för Snowflake: Ange ytterligare formatalternativ för Snowflake, som ska användas i Snowflake COPY-instruktionen för att läsa in data. Ytterligare filformatalternativ som tillhandahålls till kommandot COPY tillhandahålls som en ordlista med nyckel/värde-par. Exempel: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Mer information finns i Formattypsalternativ för Snowflake.

    Screenshot showing additional snowflake format options for destination.

Direktkopia till Snowflake

Om källdatalagret och formatet uppfyller kriterierna som beskrivs i det här avsnittet kan du använda aktiviteten Kopiera för att kopiera direkt från källan till Snowflake. Tjänsten kontrollerar inställningarna och misslyckas med aktiviteten Kopiera köras om följande villkor inte uppfylls:

  • Källanslutningenär Azure Blob Storage med signaturautentisering för delad åtkomst. Om du vill kopiera data direkt från Azure Data Lake Storage Gen2 i följande format som stöds kan du skapa en Azure Blob-anslutning med SAS-autentisering mot ditt ADLS Gen2-konto.

  • Källdataformatetär Parquet, DelimitedText eller JSON med följande konfigurationer:

    • För Parquet-format är komprimeringskodcen Ingen eller Snappy.

    • För avgränsattextformat :

      • Radgränsare är \r\n eller ett enskilt tecken. Om radgränsare inte är "\r\n" är den första raden som rubrik avmarkerad och Hoppa över radantal har inte angetts.
      • Komprimeringstypen kan vara None, gzip, bzip2 eller deflate.
      • Kodning lämnas som standard eller inställt på "UTF-8", "UTF-16", "UTF-16BE", "UTF-32", "UTF-32BE", "BIG5", "EUC--JP", "EUC-KR", "GB18030", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2 ", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-89", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255".
      • Citattecken är dubbelt citattecken, enkelt citattecken eller Inget citattecken.
    • För JSON-format stöder direktkopiering endast fallet att snowflake-måltabellen bara har en enda kolumn och att datatypen för den här kolumnen är VARIANT, OBJECT eller ARRAY.

      • Komprimeringstypen kan vara None, gzip, bzip2 eller deflate.
      • Kodning lämnas som standard eller anges till UTF-8.
      • Kolumnmappning har inte angetts.
  • I aktiviteten Kopiera källa:

    • Ytterligare kolumner har inte angetts.
    • Om källan är en mapp väljs Rekursivt .
    • Prefix, Starttid (UTC) och Sluttid (UTC) i Filtrera efter senast ändrad och Aktivera partitionsidentifiering har inte angetts.

Mappning

För Konfiguration av fliken Mappning går du till Konfigurera dina mappningar under mappningsfliken.

Inställningar

För Inställningar flikkonfiguration går du till Konfigurera dina andra inställningar under fliken Inställningar.

Tabellsammanfattning

Följande tabeller innehåller mer information om kopieringsaktiviteten i Snowflake.

Källa

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Typ av datalager Din datalagertyp. Externt Ja /
Anslutning Din anslutning till källdatalagret. < din anslutning > Ja anslutning
Databas Din databas som du använder som källa. < din databas > Ja database
Använda fråga Sättet att läsa data från Snowflake. •Tabell
•Fråga
Nej •Tabell
•Fråga
Tabell Namnet på tabellen som ska läsa data. < namnet på källtabellen> Ja Schemat
table
Fråga SQL-frågan för att läsa data från Snowflake. < namnet på källfrågan> Ja query
Ytterligare alternativ för Snowflake-kopiering Ytterligare kopieringsalternativ tillhandahålls som en ordlista med nyckel/värde-par. Exempel: MAX_FILE_SIZE, SKRIV ÖVER. Mer information finns i Snowflake-kopieringsalternativ. • Namn
•Värde
Nej additionalCopyOptions
Ytterligare formatalternativ för Snowflake Ytterligare filformatalternativ som tillhandahålls för kommandot COPY som en ordlista med nyckel/värde-par. Exempel: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Mer information finns i Formattypsalternativ för Snowflake. • Namn
•Värde
Nej additionalFormatOptions

Mål

Name Beskrivning Värde Obligatoriskt JSON-skriptegenskap
Typ av datalager Din datalagertyp. Externt Ja /
Anslutning Din anslutning till måldatalagret. < din anslutning > Ja anslutning
Databas Din databas som du använder som mål. < din databas> Ja /
Tabell Måldatatabellen. < namn på måltabellen> Ja •Schemat
•Tabell
Förkopieringsskript En SQL-fråga för aktiviteten Kopiera att köra innan du skriver data till Snowflake i varje körning. Använd den här egenskapen för att rensa inlästa data. < ditt förkopieringsskript> NEJ preCopyScript
Ytterligare alternativ för Snowflake-kopiering Ytterligare kopieringsalternativ tillhandahålls som en ordlista med nyckel/värde-par. Exempel: ON_ERROR, FORCE, LOAD_UNCERTAIN_FILES. Mer information finns i Snowflake-kopieringsalternativ. • Namn
•Värde
Nej additionalCopyOptions
Ytterligare formatalternativ för Snowflake Ytterligare filformatalternativ som tillhandahålls till kommandot COPY, som tillhandahålls som en ordlista med nyckel/värde-par. Exempel: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. Mer information finns i Formattypsalternativ för Snowflake. • Namn
•Värde
Nej additionalFormatOptions