A Lakehouse konfigurálása másolási tevékenységben
Ez a cikk azt ismerteti, hogyan használhatja a másolási tevékenységet egy adatfolyamban adatok másolására a Fabric Lakehouse-ból és onnan a Háló Lakehouse-ba.
Fontos
A Microsoft Fabric jelenleg előzetes verzióban érhető el. Ezek az információk egy előzetes termékre vonatkoznak, amely a kiadás előtt lényegesen módosulhat. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát az itt megadott információkra vonatkozóan. Tekintse meg Azure Data Factory azure-beli szolgáltatás dokumentációját.
Támogatott formátum
A Lakehouse a következő fájlformátumokat támogatja. A formátumalapú beállításokat az egyes cikkekben találja.
- Avro formátum
- Bináris formátum
- Tagolt szövegformátum
- Excel formátum
- JSON formátum
- ORC formátum
- Parquet formátum
- XML formátum
Támogatott konfiguráció
A másolási tevékenység alatti lapok konfigurációját a következő szakaszokban találja.
Általános kérdések
Az Általános lapkonfigurációhoz lépjen az Általános lapra.
Forrás
A Lakehouse a másolási tevékenység Forrás lapján az alábbi tulajdonságokat támogatja.
A következő tulajdonságok szükségesek:
- Adattár típusa: Válassza a Munkaterület lehetőséget.
- Munkaterület adattárolójának típusa: Válassza a Lakehouse lehetőséget az adattár típuslistájából.
- Lakehouse: Válasszon ki egy meglévő Lakehouse-t a munkaterületről. Ha nincs ilyen, hozzon létre egy új Lakehouse-t az Új gombra kattintva.
- Gyökérmappa: Válassza a Táblák vagy fájlok lehetőséget, amely a tó felügyelt vagy nem felügyelt területének virtuális nézetét jelzi. További információt a Lakehouse bemutatása című témakörben talál.
- Ha a Táblák lehetőséget választja:
- Tábla neve: Válasszon ki egy meglévő táblát a táblázatlistából, vagy adjon meg egy táblanevet forrásként.
- A Speciális területen a következő mezőket adhatja meg:
- Időbélyeg: Itt adhatja meg, hogy egy régebbi pillanatképet szeretne lekérdezni időbélyeg alapján.
- Verzió: Adja meg, hogy egy régebbi pillanatképet szeretne lekérdezni verzió szerint.
- További oszlopok: Adjon hozzá további adatoszlopokat a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. Az utóbbi esetében a kifejezés támogatott.
- Ha a Fájlok lehetőséget választja:
Fájl elérési útjának típusa: A fájl elérési útjaként választhatja a Fájl elérési útját, a Helyettesítő karakteres fájl elérési útját vagy a Fájlok listáját . Az alábbi lista az egyes beállítások konfigurációját ismerteti:
Fájl elérési útja: Válassza a Tallózás lehetőséget a másolni kívánt fájl kiválasztásához, vagy töltse ki manuálisan az elérési utat.
Helyettesítő karakteres fájl elérési útja: A forrásmappák vagy fájlok szűréséhez adja meg a mappát vagy a fájl elérési útját helyettesítő karakterekkel az adott Lakehouse nem felügyelt területén (a Fájlok területen). Az engedélyezett helyettesítő karakterek a következők:
*
(nullával vagy több karaktersel egyezik meg) és?
(nulla vagy egyetlen karakternek felel meg). A használatával^
feloldhatja, ha a mappában vagy a fájlnévben helyettesítő karakter vagy ez a feloldó karakter található.Helyettesítő karakteres mappa elérési útja: Az adott tároló alatti mappa elérési útja. Ha helyettesítő karaktert szeretne használni a mappa szűréséhez, hagyja ki ezt a beállítást, és adja meg ezt az információt a tevékenység forrásbeállításaiban.
Helyettesítő karakteres fájlnév: A megadott Lakehouse nem felügyelt területének fájlneve (a Fájlok területen) és a mappa elérési útja.
Fájlok listája: Egy adott fájlkészlet másolását jelzi.
- Mappa elérési útja: A másolni kívánt fájlokat tartalmazó mappára mutat.
- Fájllista elérési útja: Egy szövegfájlra mutat, amely a másolni kívánt fájlok listáját tartalmazza, soronként egy fájlt, amely a konfigurált fájlelérési út relatív elérési útja.
Rekurzív módon: Azt jelzi, hogy az adatok rekurzív módon vannak-e beolvasva az almappákból vagy csak a megadott mappából. Ha engedélyezve van, a bemeneti mappában és annak almappáiban lévő összes fájl rekurzív módon lesz feldolgozva. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.
Fájlformátum: Válassza ki a fájlformátumot a legördülő listából. Válassza a Beállítások gombot a fájlformátum konfigurálásához. A különböző fájlformátumok beállításairól további információt a Támogatott formátumú cikkekben talál.
A Speciális területen a következő mezőket adhatja meg:
- Szűrés az utolsó módosítás szerint: A fájlok szűrése az utolsó módosítás dátuma alapján történik. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.
- Kezdési idő: A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja nagyobb vagy egyenlő a konfigurált idővel.
- Befejezési idő: A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja kisebb, mint a konfigurált idő.
- Partíciófelderítés engedélyezése: Particionált fájlok esetén adja meg, hogy elemezze-e a partíciókat a fájl elérési útján, és adja hozzá őket további forrásoszlopokként.
- Partíció gyökérútvonala: Ha a partíciófelderítés engedélyezve van, adja meg az abszolút gyökérelérési utat a particionált mappák adatoszlopként való olvasásához.
- Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátját jelzi. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.
- Szűrés az utolsó módosítás szerint: A fájlok szűrése az utolsó módosítás dátuma alapján történik. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.
- Ha a Táblák lehetőséget választja:
Cél
A Lakehouse a másolási tevékenység Cél lapján az alábbi tulajdonságokat támogatja.
A következő tulajdonságok szükségesek:
- Adattár típusa: Válassza a Munkaterület lehetőséget.
- Munkaterület adattárolójának típusa: Válassza a Lakehouse lehetőséget az adattár típuslistájából.
- Lakehouse: Válasszon ki egy meglévő Lakehouse-t a munkaterületről. Ha nincs ilyen, hozzon létre egy új Lakehouse-t az Új gombra kattintva.
- Gyökérmappa: Válassza a Táblák vagy fájlok lehetőséget, amely a tó felügyelt vagy nem felügyelt területének virtuális nézetét jelzi. További információt a Lakehouse bemutatása című témakörben talál.
Ha a Táblák lehetőséget választja:
Tábla neve: Válasszon ki egy meglévő táblát a táblázatlistából, vagy adjon meg egy táblanevet célként.
A Speciális területen a következő mezőket adhatja meg:
- Maximális sorok fájlonként: Adja meg a fájlonkénti maximális sorokat, amikor adatokat ír a Lakehouse-ba.
- Táblaműveletek: Adja meg a műveletet a kijelölt táblán.
- Hozzáfűzés: Új értékek hozzáfűzése meglévő táblához.
- Felülírás: Írja felül a tábla meglévő adatait és sémáját az új értékekkel. Ha ezt a műveletet választja, engedélyezheti a partíciót a céltáblán:
- Partíció engedélyezése: Ezzel a beállítással partíciókat hozhat létre egy mappastruktúrában egy vagy több oszlop alapján. Minden különálló oszlopérték (pár) egy új partíció. Például: "year=2000/month=01/file". Ez a kijelölés támogatja a csak beszúrási módot, és üres könyvtárat igényel a célhelyen.
- Partícióoszlop neve: Válasszon a sémaleképezés céloszlopai közül. A támogatott adattípusok a következők: sztring, egész szám, logikai és dátum/idő. A Formátum a Leképezés lap típuskonverziós beállításait figyelembe véve jelenik meg.
- Partíció engedélyezése: Ezzel a beállítással partíciókat hozhat létre egy mappastruktúrában egy vagy több oszlop alapján. Minden különálló oszlopérték (pár) egy új partíció. Például: "year=2000/month=01/file". Ez a kijelölés támogatja a csak beszúrási módot, és üres könyvtárat igényel a célhelyen.
- Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.
Ha a Fájlok lehetőséget választja:
Fájl elérési útja: Válassza a Tallózás lehetőséget a másolni kívánt fájl kiválasztásához, vagy töltse ki manuálisan az elérési utat.
Fájlformátum: Válassza ki a fájlformátumot a legördülő listából. A fájlformátum konfigurálásához válassza a Beállítások lehetőséget. A különböző fájlformátumok beállításairól további információt a Támogatott formátumú cikkekben talál.
A Speciális területen a következő mezőket adhatja meg:
Másolási viselkedés: Meghatározza a másolási viselkedést, ha a forrás fájlalapú adattárból származó fájl. Másolási viselkedésként választhatja a Dinamikus tartalom hozzáadása, a Nincs, az Egybesimított hierarchia vagy a Hierarchia megőrzése lehetőséget. Az egyes beállítások konfigurációja a következő:
Dinamikus tartalom hozzáadása: Egy tulajdonságérték kifejezésének megadásához válassza a Dinamikus tartalom hozzáadása lehetőséget. Ez a mező megnyitja a kifejezésszerkesztőt, ahol támogatott rendszerváltozókból, tevékenységkimenetekből, függvényekből és felhasználó által megadott változókból vagy paraméterekből hozhat létre kifejezéseket. A kifejezés nyelvéről további információt a Kifejezések és függvények című témakörben talál.
Nincs: Ezt a kijelölést választva nem használhat másolási viselkedést.
Egybesimított hierarchia: A forrásmappa összes fájlja a célmappa első szintjén található. A célfájlok automatikusan létrehozott névvel rendelkeznek.
Hierarchia megőrzése: Megőrzi a fájlhierarchiát a célmappában. A forrásfájl forrásmappához való relatív elérési útja megegyezik a célfájl célmappához viszonyított elérési útjának relatív elérési útjára.
Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.
Blokkméret (MB): Adja meg a blokkméretet MB-ban, amikor adatokat ír a Lakehouse-ba. Az engedélyezett érték 4 MB és 100 MB között lehet.
Metaadatok: Egyéni metaadatok beállítása a céladattárba való másoláskor. A tömb minden objektuma
metadata
egy további oszlopot jelöl. Aname
határozza meg a metaadatkulcs nevét, avalue
pedig a kulcs adatértékét. Az attribútumok megőrzése funkció használata esetén a megadott metaadatok egyesülnek/felülírják a forrásfájl metaadatait. Az engedélyezett adatértékek a következők:
Társítás
A Leképezés lap konfigurációja: Leképezés. Ha a Bináris fájlt választja fájlformátumként, a leképezés nem támogatott.
Beállítások
A Beállítások lap konfigurációját a Beállítások lapon találja.
Táblázat összegzése
Az alábbi táblázatok további információt tartalmaznak a Lakehouse-beli másolási tevékenységről.
Forrásadatok
Név | Leírás | Érték | Kötelező | JSON-szkript tulajdonság |
---|---|---|---|---|
Adattár típusa | Az adattár típusa. | Munkaterület | Yes | / |
Munkaterület adattárának típusa | A munkaterület adattártípusának kiválasztására vonatkozó szakasz. | Tótárház | Yes | típus |
Tótárház | A Tótárház, amelyet forrásként használ. | <az Ön Tótárháza> | Yes | workspaceId artifactId |
Gyökérmappa | A gyökérmappa típusa. | * Táblázatok * Fájlokat |
No | rootFolder: Tábla vagy fájlok |
Tábla neve | Az adatokat beolvasni kívánt tábla neve. | <tábla neve> | Igen, amikor a Táblák lehetőséget választja a Gyökérmappában | tábla (a typeProperties - ->>source typeProperties ) |
Időbélyeg | Egy régebbi pillanatkép lekérdezésének időbélyege. | <Időbélyeg> | No | timestampAsOf |
Verzió | A régebbi pillanatkép lekérdezéséhez használandó verzió. | <Változat> | No | versionAsOf |
További oszlopok | További adatoszlopok a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. Az utóbbi esetében a kifejezés támogatott. | *Név *Érték |
No | additionalColumns: *név *Érték |
Fájl elérési útjának típusa | A használt fájlelérési út típusa. | * Fájl elérési útja * Helyettesítő karakteres fájl elérési útja * Fájlok listája |
Yes | / |
Fájl elérési útja | Másolja az elérési útból a forrásadattárban lévő mappába/fájlba. A Fájl elérési útjának kiválasztásakor alkalmazza a fájl elérési útját a Fájl elérési útjának típusában. | <fájl elérési útja> | Igen, amikor a Fájl elérési útját választja | * folderPath *Fájlnév |
Helyettesítő karakterek elérési útjai | A forrásadattárban helyettesítő karaktereket tartalmazó mappa elérési útja, amely a forrásmappák szűrésére van konfigurálva. A helyettesítő karakteres fájl elérési útja a Fájl elérési útjának típusánál alkalmazható. | <helyettesítő karakterek elérési útjai> | Igen, amikor helyettesítő karakteres fájl elérési útját választja | * helyettesítő karakterFolderPath * helyettesítő karakterFileName |
Mappa elérési útja | Egy másolni kívánt fájlokat tartalmazó mappára mutat. Alkalmazza a parancsot a Fájl elérési útjának típusában található fájlok listájának kiválasztásakor. | <mappa elérési útja> | No | folderPath |
Fájllista elérési útja | Egy adott fájlkészlet másolását jelzi. Mutasson egy szövegfájlra, amely tartalmazza a másolni kívánt fájlok listáját, soronként egy fájlt, amely a konfigurált elérési út relatív elérési útja. Alkalmazza a parancsot a Fájl elérési útjának típusában található fájlok listájának kiválasztásakor. | <elérési út a fájllistához> | No | fileListPath |
Rekurzív | A bemeneti mappában és annak almappáiban lévő összes fájl rekurzív feldolgozása, vagy csak a kijelölt mappában lévő fájlok feldolgozása. Ez a beállítás egyetlen fájl kijelölésekor le van tiltva. | kijelölés vagy a kijelölés megszüntetése | No | Rekurzív: true (igaz) vagy false (hamis) |
Fájlformátum | A használt fájl formátuma. | <fájlformátum> | Yes | típus (alatt formatSettings ):DelimitedTextReadSettings |
Szűrés az utolsó módosítás szerint | A ([Kezdési időpont, Befejezés időpontja] tartományban legutóbb módosított időponttal rendelkező fájlok további feldolgozásra lesznek szűrve. Az időpont az UTC időzónára lesz alkalmazva éé-hh-nnThh:mm:ss.fffZ formátumban. Ez a tulajdonság kihagyható, ami azt jelenti, hogy a rendszer nem alkalmaz fájlattribútum-szűrőt. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja. |
* Kezdés időpontja * Befejezés időpontja |
No | modifiedDatetimeStart modifiedDatetimeEnd |
Partíciófelderítés engedélyezése | Elemezni szeretné-e a partíciókat a fájl elérési útjából, és további forrásoszlopokként adja-e hozzá őket. | Kijelölve vagy kijelölve | No | enablePartitionDiscovery: igaz vagy hamis (alapértelmezett) |
Partíció gyökérútvonala | A particionált mappák adatoszlopként való olvasásának abszolút partíciós gyökérútvonala. | <a partíció gyökérútvonala> | No | partitionRootPath |
Egyidejű kapcsolatok maximális mérete | Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor van szükség értékre, ha korlátozni szeretné az egyidejű kapcsolatokat. | <egyidejű kapcsolatok maximális mérete> | No | maxConcurrentConnections |
Céladatok
Név | Leírás | Érték | Kötelező | JSON-szkript tulajdonság |
---|---|---|---|---|
Adattár típusa | Az adattár típusa. | Munkaterület | Yes | / |
Munkaterület adattárának típusa | A munkaterület adattártípusának kiválasztására vonatkozó szakasz. | Tótárház | Yes | típus |
Tótárház | A Tótárház, amelyet célként használ. | <az Ön Tótárháza> | Yes | workspaceId artifactId |
Gyökérmappa | A gyökérmappa típusa. | * Táblázatok * Fájlokat |
Yes | rootFolder: Tábla vagy fájlok |
Tábla neve | Annak a táblának a neve, amelybe adatokat szeretne írni. | <a tábla neve> | Igen, amikor a Táblák lehetőséget választja a Gyökérmappában | tábla (a typeProperties - ->>sink typeProperties ) |
Sorok maximális száma fájlonként | Amikor adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti maximális sorokat. | <sorok maximális száma flie-nként> | No | maxRowsPerFile |
Táblaművelet | Új értékek hozzáfűzése egy meglévő táblához, vagy felülírja a tábla meglévő adatait és sémáját az új értékekkel. | * Hozzáfűzés * Felülírja |
No | tableActionOption: Hozzáfűzés vagy felülírás |
Egyidejű kapcsolatok maximális mérete | Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. | <egyidejű kapcsolatok maximális mérete> | No | maxConcurrentConnections |
Fájl elérési útja | Adatok írása egy mappa/fájl elérési útjára a céladattárban. | <fájl elérési útja> | No | * folderPath *Fájlnév |
Fájlformátum | A használt fájl formátuma. | <fájlformátum> | Yes | típus (alatt formatSettings ):DelimitedTextWriteSettings |
Másolási viselkedés | A másolási viselkedés, amely akkor van meghatározva, ha a forrás fájlalapú adattárból származik. | * Dinamikus tartalom hozzáadása * Nincs * Hierarchia egybesimítása * Hierarchia megőrzése |
No | copyBehavior: * FlattenHierarchy * PreserveHierarchy |
Blokkméret (MB) | Az adatok Lakehouse-ba való írásához használt blokkméret MB-ban. Az engedélyezett érték 4 MB és 100 MB között lehet. | <blokkméret> | No | blockSizeInMB |
Metaadatok | A célhelyre történő másoláskor beállított egyéni metaadatok. | * $$LASTMODIFIED *Kifejezés * Statikus érték |
No | metaadatok |