Megosztás a következőn keresztül:


Teradata konfigurálása egy másolási tevékenységben

Ez a cikk azt ismerteti, hogyan használhatja a másolási tevékenységet egy csővezetékben adatok másolására Teradata-ból és Teradata-ba.

Támogatott konfiguráció

A másolási tevékenység alatt lévő lapok konfigurációjához tekintse meg a következő szakaszokat.

Általános

Az Általános lap konfigurációjához lépjen az Általános lapra.

Forrás

Jótanács

Ha hatékonyan szeretne adatokat betölteni a Teradatából adatparticionálás segítségével, további információt a Párhuzamos másolás a Teradatából szakaszról kaphat.

A Teradata a másolási tevékenység Forrás lapján az alábbi tulajdonságokat támogatja.

Képernyőkép a forráslapról és a tulajdonságok listájáról.

A következő tulajdonságok szükségesek:

  • Kapcsolat: Válasszon ki egy Teradata-kapcsolatot a kapcsolatlistából. Ha nincs kapcsolat, hozzon létre egy új Teradata-kapcsolatot.

  • Lekérdezés használata: Tábla vagy lekérdezés kiválasztása.

    • Ha Tábla-et választja:

      • Táblázat: Adja meg a tábla nevét a Teradata-ban az adatok olvasásához. Válassza ki a táblázatot a legördülő listából, vagy a séma és a tábla nevének megadásához válassza az Enter manuálisan lehetőséget .
    • Ha a lekérdezéstválasztja:

      • Lekérdezés: Adja meg a saját SQL lekérdezést, amelyet az adatok beolvasására kíván használni.

        Képernyőkép a lekérdezésről.

A Speciálisterületen a következő mezőket adhatja meg:

  • Partíciós beállítás: A Teradata adatainak betöltéséhez használt adatparticionálási beállításokat adja meg. Az engedélyezési értékek a következők: Nincs (alapértelmezett), DynamicRange és Kivonat. Ha egy partíciós beállítás engedélyezve van (azaz nem None), a Teradata-adatok egyidejű betöltéséhez szükséges párhuzamosság mértékét a másolási tevékenység beállításai lapon található másolási párhuzamosság mértéke szabályozza.

    • Nincs: Válassza ezt a beállítást, ha nem használ partíciót.

    • Dinamikus tartomány: Ha párhuzamosan engedélyezett lekérdezést használ, a tartomány partícióparaméterére (?DfDynamicRangePartitionCondition) van szükség. Minta lekérdezés: SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition.

      • Partícióoszlop neve: Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, smallint, bigint, date, smalldatetime, datetime, datetime2vagy datetimeoffset), amelyet a párhuzamos másoláshoz használt tartományparticionálás használ. Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.

      • Partíció felső határa: Adja meg a partícióoszlop maximális értékét a partíciós tartományok felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül.

      • Partíció alsó határa: Adja meg a partícióoszlop minimális értékét a partíció tartomány felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül.

        Képernyőkép a dinamikus tartományról.

    • Hash: Ha a lekérdezésnél a párhuzamos feldolgozás engedélyezve van, hash partíciós paraméterre (?AdfHashPartitionCondition) van szükség. Minta lekérdezés: select * from <TableName> where ?AdfHashPartitionCondition.

      • Partícióoszlop neve: Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, smallint, bigint, date, smalldatetime, datetime, datetime2vagy datetimeoffset), amelyet a párhuzamos másoláshoz használt tartományparticionálás használ. Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.

        Képernyőkép a kivonatról.

  • További oszlopok: További adatoszlopok hozzáadása a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. A kifejezés az utóbbi esetében támogatott.

Úti cél

A másolási tevékenység Cél lapján a Teradata az alábbi tulajdonságokat támogatja.

Képernyőkép a céllapról.

A következő tulajdonságok szükségesek:

  • Kapcsolat: Válasszon ki egy Teradata-kapcsolatot a kapcsolatlistából. Ha nincs kapcsolat, hozzon létre egy új Teradata-kapcsolatot.

  • Táblázat: Adja meg a tábla nevét a Teradata-ban az adatok írásához. Válassza ki a táblázatot a legördülő listából, vagy a séma és a tábla nevének megadásához válassza az Enter manuálisan lehetőséget .

A Speciálisterületen a következő mezőket adhatja meg:

  • További Teradata formátumbeállítások: Adjon meg további formátumbeállításokat, amelyeket a COPY utasítás használ az adatok betöltéséhez. Példák: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. További információ: Teradata DATE Formátum. Ez a tulajdonság csak a DelimitedText formátumforrásból a Teradata-ba történő közvetlen másolásra használható.

Közvetlen másolás a Teradata-ba

Ha a forrásadattár és a formátum megfelel az ebben a szakaszban ismertetett feltételeknek, a Másolás tevékenység használatával közvetlenül másolhat a forrásból a Teradata-ba. A szolgáltatás ellenőrzi a beállításokat, és megszakítja a Copy tevékenység lefutását, ha a következő feltétel nem teljesül:

  • A forráskapcsolat az Azure Blob Storage és az Azure Data Lake Storage Gen2fiókkulcs és közös hozzáférésű jogosultságkód-hitelesítés .

  • A forrásadat formátumaParquet és DelimitedText , a következő konfigurációkkal:

    • Parquet formátum esetén a tömörítési kodek Nincs vagy Snappy.

    • Tagolt szövegformátum esetén:

      • rowDelimiter \n.
      • compression lehet nincs tömörítés vagy gzip. Ha a gzip-tömörítés ki van jelölve, a fájlnak .gz kiterjesztéssel kell végződnie.
      • encodingName alapértelmezettként marad, vagy UTF-8 értékre van állítva.
      • quoteChar idézőjel" vagy üres karakterlánc.
      • escapeChar idézőjel" vagy üres karakterlánc.
      • nullValue Null értékű vagy üres karakterlánc.
  • A Másolási művelet forrásában:

    • Az Azure Data Lake Storage Gen2 használatakor csak statikus elérési út engedélyezett.
    • Csak statikus elérési út, és prefix az Azure Blob Storage használata esetén engedélyezett.

    A statikus elérési utak előtagként szolgálnak, amikor a Teradata-ba másolódnak.

Szakaszos másolás a Teradatába

Ha a forrásadattár vagy -formátum natív módon nem kompatibilis a Teradata COPY paranccsal, ahogyan azt az előző szakaszban említettük, engedélyezze a beépített szakaszos példányt egy köztes Azure Blob Storage-példány használatával. A szakaszos másolási funkció jobb átviteli sebességet is biztosít. A szolgáltatás automatikusan átalakítja az adatokat úgy, hogy megfeleljenek a Teradata adatformátum-követelményeinek. Ezután meghívja a COPY parancsot, hogy adatokat töltsön be a Teradata-ba. Végül törli az ideiglenes adatokat a blobtárolóból.

A funkció használatához hozzon létre egy Azure Blob Storage-kapcsolatot , amely köztes előkészítésként hivatkozik az Azure Storage-fiókra. Ezután adja meg a enableStaging tulajdonságait a Copy tevékenységhez, és a stagingSettings tulajdonságait.

Megjegyzés:

Az átmeneti Azure Blob Storage-kapcsolatnak a Teradata COPY parancs által megkövetelt fiókkulcsot vagy közös hozzáférésű jogosultságkód-hitelesítést kell használnia.

Térképezés

A Leképezés lap konfigurálásához válassza a Leképezés lap leképezési beállításainak konfigurálását.

Beállítások

A Beállítások lap konfigurációjának megtekintéséhez lépjen a -be, és állítsa be a többi beállítást a Beállítások fül alatt.

Párhuzamos másolás a Teradata-ból

A Teradata-összekötő beépített adatparticionálást biztosít az adatok párhuzamos másolásához a Teradata-ból. Az adatparticionálási beállításokat a másolási tevékenység forrástábláján találja.

A particionált példány engedélyezésekor a szolgáltatás párhuzamos lekérdezéseket futtat a Teradata-forráson az adatok partíciók szerinti betöltéséhez. A párhuzamos fokot a másolási tevékenység beállításai lap másolási párhuzamossági foka szabályozza. Ha például a másolási párhuzamosság fokát négyre állítja, a szolgáltatás egyszerre generál és futtat négy lekérdezést a megadott partícióbeállítás és beállítások alapján, és mindegyik lekérdezés lekéri az adatok egy részét a Teradata-ból.

Javasoljuk, hogy engedélyezze a párhuzamos másolást adatparticionálással, különösen akkor, ha nagy mennyiségű adatot tölt be a Teradata-ból. A következő javasolt konfigurációk különböző forgatókönyvekhez. Ha fájlalapú adattárba másol adatokat, ajánlott több fájlként írni egy mappába (csak a mappa nevét kell megadni), ebben az esetben a teljesítmény jobb, mint egyetlen fájlba írni.

Forgatókönyv Javasolt beállítások
Nagy táblából történő teljes betöltés. Partíciós lehetőség: Hash.

A végrehajtás során a szolgáltatás automatikusan észleli az elsődleges indexoszlopot, kivonatot alkalmaz rá, és partíciók alapján másolja az adatokat.
Nagy mennyiségű adat betöltése egyéni lekérdezéssel. Partíciós lehetőség: Hash.
Lekérdezés: SELECT * FROM <TABLENAME> WHERE ?AdfHashPartitionCondition AND <your_additional_where_clause>.
Partícióoszlop: Adja meg a kivonatpartíció alkalmazásához használt oszlopot. Ha nincs megadva, a szolgáltatás automatikusan észleli a Teradata-adatokban megadott tábla PK oszlopát.

A végrehajtás során a szolgáltatás a kivonat partíciólogikát lecseréli ?AdfHashPartitionCondition-re, és elküldi a Teradatának.
Nagy mennyiségű adatot tölthet be egyéni lekérdezéssel, és egy egyenletesen elosztott értékkel rendelkező egész oszlopot használ a tartomány particionálásához. Partícióbeállítások: Dinamikus tartomány partíciója.
Lekérdezés: SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.
Partícióoszlop: Adja meg az adatok particionálásához használt oszlopot. Az egész szám adattípusú oszlop ellen particionálást végezhet.
Partíció felső határa és a partíció alsó határa: Adja meg, hogy a partícióoszlopra szeretne-e szűrni, hogy csak az alsó és a felső tartomány közötti adatokat kérje le.

A végrehajtás során a szolgáltatás lecseréli az egyes partíciók ?AdfRangePartitionColumnName?AdfRangePartitionUpbound?AdfRangePartitionLowbound tényleges oszlopnevét és értéktartományait, és elküldi a Teradata-nak.
Ha például az "ID" partícióoszlop alsó határként 1-et, felső határként pedig 80-at állít be, és a párhuzamos másolás értéke 4, akkor a szolgáltatás 4 partícióra osztva kéri le az adatokat. Azonosítójuk [1,20], [21, 40], [41, 60] és [61, 80] között van.

Példa: lekérdezés kivonatpartícióval

"source": {
    "type": "TeradataSource",
    "query": "SELECT * FROM <TABLENAME> WHERE ?AdfHashPartitionCondition AND <your_additional_where_clause>",
    "partitionOption": "Hash",
    "partitionSettings": {
        "partitionColumnName": "<hash_partition_column_name>"
    }
}

Példa: lekérdezés dinamikus tartománypartícióval

"source": {
    "type": "TeradataSource",
    "query": "SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>",
    "partitionOption": "DynamicRange",
    "partitionSettings": {
        "partitionColumnName": "<dynamic_range_partition_column_name>",
        "partitionUpperBound": "<upper_value_of_partition_column>",
        "partitionLowerBound": "<lower_value_of_partition_column>"
    }
}

Táblázat összefoglalása

Az alábbi táblázatok további információkat tartalmaznak egy Teradata másolási tevékenységéről.

Forrásadatok

Név Leírás Érték Kötelező JSON-szkripttulajdonság
Kapcsolat A forrásadattárhoz való kapcsolódás. < a Teradata-kapcsolat > Igen kapcsolat
A lekérdezés használata Adatok beolvasása a Teradata-ból. Tábla alkalmazása a megadott táblából az adatok olvasására, vagy Lekérdezés alkalmazása az adatok lekérdezésekkel történő olvasására. tábla
lekérdezés
Nem /
Tábla esetén
séma név A séma neve. sémanév <> Nem séma
táblanév A tábla neve. az ön táblaneve <> Nem tábla
Lekérdezés esetén
Lekérdezés Az adatok olvasásához használja az egyéni SQL-lekérdezést. SQL-lekérdezések <> Nem lekérdezés
Partíció beállítás A Teradata adatainak betöltéséhez használt adatparticionálási beállítások. Nincs
Dinamikus tartomány
Hash
Nem /
Dinamikus tartomány esetén
partícióoszlop neve Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, , smallint, bigint, datesmalldatetime, datetime, , datetime2, ) datetimeoffset, amelyet a párhuzamos másolás tartományparticionálása használ.
Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.
< a partícióoszlopneveid > Nem partícióoszlopNév
Partíció felső határa Adja meg a partíciótartomány-felosztás partícióoszlopának maximális értékét. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül. < a partíció felső határa > Nem partíció felső határa
Partíció alsó határ Adja meg a partícióoszlop minimális értékét a partíciótartomány felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül. < a partíció alsó határa > Nem partíció alsó határértéke
Kivonat esetén
partícióoszlop neve Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, , smallint, bigint, datesmalldatetime, datetime, , datetime2, ) datetimeoffset, amelyet a párhuzamos másolás tartományparticionálása használ.
Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.
< a partícióoszlopneveid > Nem partícióoszlopNév
További oszlopok Adjon hozzá további adatoszlopokat a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. A kifejezés az utóbbi esetében támogatott. •Név
•Érték
Nem továbbicolumnok:
• név
•érték

Céladatok

Név Leírás Érték Kötelező JSON-szkripttulajdonság
Kapcsolat A céladattárhoz való kapcsolódás. < a Teradata-kapcsolat > Igen kapcsolat
Tábla A céladatok táblája, ahova adatokat írsz fel. az ön táblaneve <> Igen /
séma név A séma neve. sémanév <> Nem séma
táblanév A tábla neve. az ön táblaneve <> Nem tábla
További Teradata formátumbeállítások Adjon meg további formátumbeállításokat, amelyeket a COPY utasítás használ az adatok betöltéséhez. Példák: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. További információ: Teradata DATE Formátum. Ez a tulajdonság csak a DelimitedText formátumforrásból a Teradata-ba történő közvetlen másolásra használható. • DÁTUM_FORMÁTUM
• IDŐ_FORMÁTUM
• Időbélyeg formátum
Nem további formázási lehetőségek
• DÁTUM_FORMÁTUM
• IDŐ_FORMÁTUM
• Időbélyeg formátum