Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Ez a cikk azt ismerteti, hogyan használhatja a másolási tevékenységet egy csővezetékben adatok másolására Teradata-ból és Teradata-ba.
Támogatott konfiguráció
A másolási tevékenység alatt lévő lapok konfigurációjához tekintse meg a következő szakaszokat.
Általános
Az Általános lap konfigurációjához lépjen az Általános lapra.
Forrás
Jótanács
Ha hatékonyan szeretne adatokat betölteni a Teradatából adatparticionálás segítségével, további információt a Párhuzamos másolás a Teradatából szakaszról kaphat.
A Teradata a másolási tevékenység Forrás lapján az alábbi tulajdonságokat támogatja.
A következő tulajdonságok szükségesek:
Kapcsolat: Válasszon ki egy Teradata-kapcsolatot a kapcsolatlistából. Ha nincs kapcsolat, hozzon létre egy új Teradata-kapcsolatot.
Lekérdezés használata: Tábla vagy lekérdezés kiválasztása.
Ha Tábla-et választja:
- Táblázat: Adja meg a tábla nevét a Teradata-ban az adatok olvasásához. Válassza ki a táblázatot a legördülő listából, vagy a séma és a tábla nevének megadásához válassza az Enter manuálisan lehetőséget .
Ha a lekérdezéstválasztja:
A Speciálisterületen a következő mezőket adhatja meg:
Partíciós beállítás: A Teradata adatainak betöltéséhez használt adatparticionálási beállításokat adja meg. Az engedélyezési értékek a következők: Nincs (alapértelmezett), DynamicRange és Kivonat. Ha egy partíciós beállítás engedélyezve van (azaz nem
None), a Teradata-adatok egyidejű betöltéséhez szükséges párhuzamosság mértékét a másolási tevékenység beállításai lapon található másolási párhuzamosság mértéke szabályozza.Nincs: Válassza ezt a beállítást, ha nem használ partíciót.
Dinamikus tartomány: Ha párhuzamosan engedélyezett lekérdezést használ, a tartomány partícióparaméterére (
?DfDynamicRangePartitionCondition) van szükség. Minta lekérdezés:SELECT * FROM <TableName> WHERE ?DfDynamicRangePartitionCondition.Partícióoszlop neve: Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (
int,smallint,bigint,date,smalldatetime,datetime,datetime2vagydatetimeoffset), amelyet a párhuzamos másoláshoz használt tartományparticionálás használ. Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.Partíció felső határa: Adja meg a partícióoszlop maximális értékét a partíciós tartományok felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül.
Partíció alsó határa: Adja meg a partícióoszlop minimális értékét a partíció tartomány felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül.
Hash: Ha a lekérdezésnél a párhuzamos feldolgozás engedélyezve van, hash partíciós paraméterre (
?AdfHashPartitionCondition) van szükség. Minta lekérdezés:select * from <TableName> where ?AdfHashPartitionCondition.Partícióoszlop neve: Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (
int,smallint,bigint,date,smalldatetime,datetime,datetime2vagydatetimeoffset), amelyet a párhuzamos másoláshoz használt tartományparticionálás használ. Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja.
További oszlopok: További adatoszlopok hozzáadása a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. A kifejezés az utóbbi esetében támogatott.
Úti cél
A másolási tevékenység Cél lapján a Teradata az alábbi tulajdonságokat támogatja.
A következő tulajdonságok szükségesek:
Kapcsolat: Válasszon ki egy Teradata-kapcsolatot a kapcsolatlistából. Ha nincs kapcsolat, hozzon létre egy új Teradata-kapcsolatot.
Táblázat: Adja meg a tábla nevét a Teradata-ban az adatok írásához. Válassza ki a táblázatot a legördülő listából, vagy a séma és a tábla nevének megadásához válassza az Enter manuálisan lehetőséget .
A Speciálisterületen a következő mezőket adhatja meg:
- További Teradata formátumbeállítások: Adjon meg további formátumbeállításokat, amelyeket a COPY utasítás használ az adatok betöltéséhez. Példák: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. További információ: Teradata DATE Formátum. Ez a tulajdonság csak a DelimitedText formátumforrásból a Teradata-ba történő közvetlen másolásra használható.
Közvetlen másolás a Teradata-ba
Ha a forrásadattár és a formátum megfelel az ebben a szakaszban ismertetett feltételeknek, a Másolás tevékenység használatával közvetlenül másolhat a forrásból a Teradata-ba. A szolgáltatás ellenőrzi a beállításokat, és megszakítja a Copy tevékenység lefutását, ha a következő feltétel nem teljesül:
A forráskapcsolat az Azure Blob Storage és az Azure Data Lake Storage Gen2fiókkulcs és közös hozzáférésű jogosultságkód-hitelesítés .
A forrásadat formátumaParquet és DelimitedText , a következő konfigurációkkal:
Parquet formátum esetén a tömörítési kodek Nincs vagy Snappy.
Tagolt szövegformátum esetén:
-
rowDelimiter\n. -
compressionlehet nincs tömörítés vagy gzip. Ha a gzip-tömörítés ki van jelölve, a fájlnak .gz kiterjesztéssel kell végződnie. -
encodingNamealapértelmezettként marad, vagy UTF-8 értékre van állítva. -
quoteCharidézőjel"vagy üres karakterlánc. -
escapeCharidézőjel"vagy üres karakterlánc. -
nullValueNull értékű vagy üres karakterlánc.
-
A Másolási művelet forrásában:
- Az Azure Data Lake Storage Gen2 használatakor csak statikus elérési út engedélyezett.
- Csak statikus elérési út, és
prefixaz Azure Blob Storage használata esetén engedélyezett.
A statikus elérési utak előtagként szolgálnak, amikor a Teradata-ba másolódnak.
Szakaszos másolás a Teradatába
Ha a forrásadattár vagy -formátum natív módon nem kompatibilis a Teradata COPY paranccsal, ahogyan azt az előző szakaszban említettük, engedélyezze a beépített szakaszos példányt egy köztes Azure Blob Storage-példány használatával. A szakaszos másolási funkció jobb átviteli sebességet is biztosít. A szolgáltatás automatikusan átalakítja az adatokat úgy, hogy megfeleljenek a Teradata adatformátum-követelményeinek. Ezután meghívja a COPY parancsot, hogy adatokat töltsön be a Teradata-ba. Végül törli az ideiglenes adatokat a blobtárolóból.
A funkció használatához hozzon létre egy Azure Blob Storage-kapcsolatot , amely köztes előkészítésként hivatkozik az Azure Storage-fiókra. Ezután adja meg a enableStaging tulajdonságait a Copy tevékenységhez, és a stagingSettings tulajdonságait.
Megjegyzés:
Az átmeneti Azure Blob Storage-kapcsolatnak a Teradata COPY parancs által megkövetelt fiókkulcsot vagy közös hozzáférésű jogosultságkód-hitelesítést kell használnia.
Térképezés
A Leképezés lap konfigurálásához válassza a Leképezés lap leképezési beállításainak konfigurálását.
Beállítások
A Beállítások lap konfigurációjának megtekintéséhez lépjen a -be, és állítsa be a többi beállítást a Beállítások fül alatt.
Párhuzamos másolás a Teradata-ból
A Teradata-összekötő beépített adatparticionálást biztosít az adatok párhuzamos másolásához a Teradata-ból. Az adatparticionálási beállításokat a másolási tevékenység forrástábláján találja.
A particionált példány engedélyezésekor a szolgáltatás párhuzamos lekérdezéseket futtat a Teradata-forráson az adatok partíciók szerinti betöltéséhez. A párhuzamos fokot a másolási tevékenység beállításai lap másolási párhuzamossági foka szabályozza. Ha például a másolási párhuzamosság fokát négyre állítja, a szolgáltatás egyszerre generál és futtat négy lekérdezést a megadott partícióbeállítás és beállítások alapján, és mindegyik lekérdezés lekéri az adatok egy részét a Teradata-ból.
Javasoljuk, hogy engedélyezze a párhuzamos másolást adatparticionálással, különösen akkor, ha nagy mennyiségű adatot tölt be a Teradata-ból. A következő javasolt konfigurációk különböző forgatókönyvekhez. Ha fájlalapú adattárba másol adatokat, ajánlott több fájlként írni egy mappába (csak a mappa nevét kell megadni), ebben az esetben a teljesítmény jobb, mint egyetlen fájlba írni.
| Forgatókönyv | Javasolt beállítások |
|---|---|
| Nagy táblából történő teljes betöltés. |
Partíciós lehetőség: Hash. A végrehajtás során a szolgáltatás automatikusan észleli az elsődleges indexoszlopot, kivonatot alkalmaz rá, és partíciók alapján másolja az adatokat. |
| Nagy mennyiségű adat betöltése egyéni lekérdezéssel. |
Partíciós lehetőség: Hash. Lekérdezés: SELECT * FROM <TABLENAME> WHERE ?AdfHashPartitionCondition AND <your_additional_where_clause>.Partícióoszlop: Adja meg a kivonatpartíció alkalmazásához használt oszlopot. Ha nincs megadva, a szolgáltatás automatikusan észleli a Teradata-adatokban megadott tábla PK oszlopát. A végrehajtás során a szolgáltatás a kivonat partíciólogikát lecseréli ?AdfHashPartitionCondition-re, és elküldi a Teradatának. |
| Nagy mennyiségű adatot tölthet be egyéni lekérdezéssel, és egy egyenletesen elosztott értékkel rendelkező egész oszlopot használ a tartomány particionálásához. |
Partícióbeállítások: Dinamikus tartomány partíciója. Lekérdezés: SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>.Partícióoszlop: Adja meg az adatok particionálásához használt oszlopot. Az egész szám adattípusú oszlop ellen particionálást végezhet. Partíció felső határa és a partíció alsó határa: Adja meg, hogy a partícióoszlopra szeretne-e szűrni, hogy csak az alsó és a felső tartomány közötti adatokat kérje le. A végrehajtás során a szolgáltatás lecseréli az egyes partíciók ?AdfRangePartitionColumnName?AdfRangePartitionUpbound?AdfRangePartitionLowbound tényleges oszlopnevét és értéktartományait, és elküldi a Teradata-nak. Ha például az "ID" partícióoszlop alsó határként 1-et, felső határként pedig 80-at állít be, és a párhuzamos másolás értéke 4, akkor a szolgáltatás 4 partícióra osztva kéri le az adatokat. Azonosítójuk [1,20], [21, 40], [41, 60] és [61, 80] között van. |
Példa: lekérdezés kivonatpartícióval
"source": {
"type": "TeradataSource",
"query": "SELECT * FROM <TABLENAME> WHERE ?AdfHashPartitionCondition AND <your_additional_where_clause>",
"partitionOption": "Hash",
"partitionSettings": {
"partitionColumnName": "<hash_partition_column_name>"
}
}
Példa: lekérdezés dinamikus tartománypartícióval
"source": {
"type": "TeradataSource",
"query": "SELECT * FROM <TABLENAME> WHERE ?AdfRangePartitionColumnName <= ?AdfRangePartitionUpbound AND ?AdfRangePartitionColumnName >= ?AdfRangePartitionLowbound AND <your_additional_where_clause>",
"partitionOption": "DynamicRange",
"partitionSettings": {
"partitionColumnName": "<dynamic_range_partition_column_name>",
"partitionUpperBound": "<upper_value_of_partition_column>",
"partitionLowerBound": "<lower_value_of_partition_column>"
}
}
Táblázat összefoglalása
Az alábbi táblázatok további információkat tartalmaznak egy Teradata másolási tevékenységéről.
Forrásadatok
| Név | Leírás | Érték | Kötelező | JSON-szkripttulajdonság |
|---|---|---|---|---|
| Kapcsolat | A forrásadattárhoz való kapcsolódás. | < a Teradata-kapcsolat > | Igen | kapcsolat |
| A lekérdezés használata | Adatok beolvasása a Teradata-ból. Tábla alkalmazása a megadott táblából az adatok olvasására, vagy Lekérdezés alkalmazása az adatok lekérdezésekkel történő olvasására. | • tábla • lekérdezés |
Nem | / |
| Tábla esetén | ||||
| séma név | A séma neve. | sémanév <> | Nem | séma |
| táblanév | A tábla neve. | az ön táblaneve <> | Nem | tábla |
| Lekérdezés esetén | ||||
| Lekérdezés | Az adatok olvasásához használja az egyéni SQL-lekérdezést. | SQL-lekérdezések <> | Nem | lekérdezés |
| Partíció beállítás | A Teradata adatainak betöltéséhez használt adatparticionálási beállítások. | • Nincs • Dinamikus tartomány • Hash |
Nem | / |
| Dinamikus tartomány esetén | ||||
| partícióoszlop neve | Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, , smallint, bigint, datesmalldatetime, datetime, , datetime2, ) datetimeoffset, amelyet a párhuzamos másolás tartományparticionálása használ.Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja. |
< a partícióoszlopneveid > | Nem | partícióoszlopNév |
| Partíció felső határa | Adja meg a partíciótartomány-felosztás partícióoszlopának maximális értékét. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül. | < a partíció felső határa > | Nem | partíció felső határa |
| Partíció alsó határ | Adja meg a partícióoszlop minimális értékét a partíciótartomány felosztásához. Ez az érték a partíciós léptetés meghatározására szolgál, nem pedig a tábla sorainak szűrésére. A tábla vagy a lekérdezés eredményének összes sora particionálásra és másolásra kerül. | < a partíció alsó határa > | Nem | partíció alsó határértéke |
| Kivonat esetén | ||||
| partícióoszlop neve | Adja meg a forrásoszlop nevét egész számban vagy dátum/dátum/idő típusban (int, , smallint, bigint, datesmalldatetime, datetime, , datetime2, ) datetimeoffset, amelyet a párhuzamos másolás tartományparticionálása használ.Ha nincs megadva, a rendszer automatikusan észleli a tábla indexét vagy elsődleges kulcsát, és partícióoszlopként használja. |
< a partícióoszlopneveid > | Nem | partícióoszlopNév |
| További oszlopok | Adjon hozzá további adatoszlopokat a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. A kifejezés az utóbbi esetében támogatott. | •Név •Érték |
Nem | továbbicolumnok: • név •érték |
Céladatok
| Név | Leírás | Érték | Kötelező | JSON-szkripttulajdonság |
|---|---|---|---|---|
| Kapcsolat | A céladattárhoz való kapcsolódás. | < a Teradata-kapcsolat > | Igen | kapcsolat |
| Tábla | A céladatok táblája, ahova adatokat írsz fel. | az ön táblaneve <> | Igen | / |
| séma név | A séma neve. | sémanév <> | Nem | séma |
| táblanév | A tábla neve. | az ön táblaneve <> | Nem | tábla |
| További Teradata formátumbeállítások | Adjon meg további formátumbeállításokat, amelyeket a COPY utasítás használ az adatok betöltéséhez. Példák: DATE_FORMAT, TIME_FORMAT, TIMESTAMP_FORMAT. További információ: Teradata DATE Formátum. Ez a tulajdonság csak a DelimitedText formátumforrásból a Teradata-ba történő közvetlen másolásra használható. | • DÁTUM_FORMÁTUM • IDŐ_FORMÁTUM • Időbélyeg formátum |
Nem | további formázási lehetőségek • DÁTUM_FORMÁTUM • IDŐ_FORMÁTUM • Időbélyeg formátum |