A Lakehouse konfigurálása másolási tevékenységben

Ez a cikk azt ismerteti, hogyan használhatja a másolási tevékenységet egy adatfolyamban adatok másolására a Fabric Lakehouse-ból és onnan a Háló Lakehouse-ba.

Fontos

A Microsoft Fabric jelenleg előzetes verzióban érhető el. Ezek az információk egy előzetes termékre vonatkoznak, amely a kiadás előtt lényegesen módosulhat. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát az itt megadott információkra vonatkozóan. Tekintse meg Azure Data Factory azure-beli szolgáltatás dokumentációját.

Támogatott formátum

A Lakehouse a következő fájlformátumokat támogatja. A formátumalapú beállításokat az egyes cikkekben találja.

Támogatott konfiguráció

A másolási tevékenység alatti lapok konfigurációját a következő szakaszokban találja.

Általános kérdések

Az Általános lapkonfigurációhoz lépjen az Általános lapra.

Forrás

A Lakehouse a másolási tevékenység Forrás lapján az alábbi tulajdonságokat támogatja.

Képernyőkép a forráslapról és a tulajdonságok listájáról.

A következő tulajdonságok szükségesek:

  • Adattár típusa: Válassza a Munkaterület lehetőséget.
  • Munkaterület adattárolójának típusa: Válassza a Lakehouse lehetőséget az adattár típuslistájából.
  • Lakehouse: Válasszon ki egy meglévő Lakehouse-t a munkaterületről. Ha nincs ilyen, hozzon létre egy új Lakehouse-t az Új gombra kattintva.
  • Gyökérmappa: Válassza a Táblák vagy fájlok lehetőséget, amely a tó felügyelt vagy nem felügyelt területének virtuális nézetét jelzi. További információt a Lakehouse bemutatása című témakörben talál.
    • Ha a Táblák lehetőséget választja:
      • Tábla neve: Válasszon ki egy meglévő táblát a táblázatlistából, vagy adjon meg egy táblanevet forrásként.
      • A Speciális területen a következő mezőket adhatja meg:
        • Időbélyeg: Itt adhatja meg, hogy egy régebbi pillanatképet szeretne lekérdezni időbélyeg alapján.
        • Verzió: Adja meg, hogy egy régebbi pillanatképet szeretne lekérdezni verzió szerint.
        • További oszlopok: Adjon hozzá további adatoszlopokat a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. Az utóbbi esetében a kifejezés támogatott.
    • Ha a Fájlok lehetőséget választja:
      • Fájl elérési útjának típusa: A fájl elérési útjaként választhatja a Fájl elérési útját, a Helyettesítő karakteres fájl elérési útját vagy a Fájlok listáját . Az alábbi lista az egyes beállítások konfigurációját ismerteti:

        Képernyőkép a fájl elérési útjáról.

        • Fájl elérési útja: Válassza a Tallózás lehetőséget a másolni kívánt fájl kiválasztásához, vagy töltse ki manuálisan az elérési utat.

        • Helyettesítő karakteres fájl elérési útja: A forrásmappák vagy fájlok szűréséhez adja meg a mappát vagy a fájl elérési útját helyettesítő karakterekkel az adott Lakehouse nem felügyelt területén (a Fájlok területen). Az engedélyezett helyettesítő karakterek a következők: * (nullával vagy több karaktersel egyezik meg) és ? (nulla vagy egyetlen karakternek felel meg). A használatával ^ feloldhatja, ha a mappában vagy a fájlnévben helyettesítő karakter vagy ez a feloldó karakter található.

          • Helyettesítő karakteres mappa elérési útja: Az adott tároló alatti mappa elérési útja. Ha helyettesítő karaktert szeretne használni a mappa szűréséhez, hagyja ki ezt a beállítást, és adja meg ezt az információt a tevékenység forrásbeállításaiban.

          • Helyettesítő karakteres fájlnév: A megadott Lakehouse nem felügyelt területének fájlneve (a Fájlok területen) és a mappa elérési útja.

            Képernyőkép helyettesítő karakteres fájl elérési útjáról.

        • Fájlok listája: Egy adott fájlkészlet másolását jelzi.

          • Mappa elérési útja: A másolni kívánt fájlokat tartalmazó mappára mutat.
          • Fájllista elérési útja: Egy szövegfájlra mutat, amely a másolni kívánt fájlok listáját tartalmazza, soronként egy fájlt, amely a konfigurált fájlelérési út relatív elérési útja.

          Képernyőkép a fájllista elérési útjáról.

      • Rekurzív módon: Azt jelzi, hogy az adatok rekurzív módon vannak-e beolvasva az almappákból vagy csak a megadott mappából. Ha engedélyezve van, a bemeneti mappában és annak almappáiban lévő összes fájl rekurzív módon lesz feldolgozva. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.

      • Fájlformátum: Válassza ki a fájlformátumot a legördülő listából. Válassza a Beállítások gombot a fájlformátum konfigurálásához. A különböző fájlformátumok beállításairól további információt a Támogatott formátumú cikkekben talál.

      • A Speciális területen a következő mezőket adhatja meg:

        • Szűrés az utolsó módosítás szerint: A fájlok szűrése az utolsó módosítás dátuma alapján történik. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.
          • Kezdési idő: A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja nagyobb vagy egyenlő a konfigurált idővel.
          • Befejezési idő: A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja kisebb, mint a konfigurált idő.
        • Partíciófelderítés engedélyezése: Particionált fájlok esetén adja meg, hogy elemezze-e a partíciókat a fájl elérési útján, és adja hozzá őket további forrásoszlopokként.
          • Partíció gyökérútvonala: Ha a partíciófelderítés engedélyezve van, adja meg az abszolút gyökérelérési utat a particionált mappák adatoszlopként való olvasásához.
        • Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátját jelzi. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.

Cél

A Lakehouse a másolási tevékenység Cél lapján az alábbi tulajdonságokat támogatja.

Képernyőkép a céllapról.

A következő tulajdonságok szükségesek:

  • Adattár típusa: Válassza a Munkaterület lehetőséget.
  • Munkaterület adattárolójának típusa: Válassza a Lakehouse lehetőséget az adattár típuslistájából.
  • Lakehouse: Válasszon ki egy meglévő Lakehouse-t a munkaterületről. Ha nincs ilyen, hozzon létre egy új Lakehouse-t az Új gombra kattintva.
  • Gyökérmappa: Válassza a Táblák vagy fájlok lehetőséget, amely a tó felügyelt vagy nem felügyelt területének virtuális nézetét jelzi. További információt a Lakehouse bemutatása című témakörben talál.
    • Ha a Táblák lehetőséget választja:

      • Tábla neve: Válasszon ki egy meglévő táblát a táblázatlistából, vagy adjon meg egy táblanevet célként.

        Képernyőkép a tábla nevéről.

      • A Speciális területen a következő mezőket adhatja meg:

        • Maximális sorok fájlonként: Adja meg a fájlonkénti maximális sorokat, amikor adatokat ír a Lakehouse-ba.
        • Táblaműveletek: Adja meg a műveletet a kijelölt táblán.
          • Hozzáfűzés: Új értékek hozzáfűzése meglévő táblához.
          • Felülírás: Írja felül a tábla meglévő adatait és sémáját az új értékekkel. Ha ezt a műveletet választja, engedélyezheti a partíciót a céltáblán:
            • Partíció engedélyezése: Ezzel a beállítással partíciókat hozhat létre egy mappastruktúrában egy vagy több oszlop alapján. Minden különálló oszlopérték (pár) egy új partíció. Például: "year=2000/month=01/file". Ez a kijelölés támogatja a csak beszúrási módot, és üres könyvtárat igényel a célhelyen.
              • Partícióoszlop neve: Válasszon a sémaleképezés céloszlopai közül. A támogatott adattípusok a következők: sztring, egész szám, logikai és dátum/idő. A Formátum a Leképezés lap típuskonverziós beállításait figyelembe véve jelenik meg.
        • Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.
    • Ha a Fájlok lehetőséget választja:

      • Fájl elérési útja: Válassza a Tallózás lehetőséget a másolni kívánt fájl kiválasztásához, vagy töltse ki manuálisan az elérési utat.

        Képernyőkép a fájlok elérési útjáról a célhelyen.

      • Fájlformátum: Válassza ki a fájlformátumot a legördülő listából. A fájlformátum konfigurálásához válassza a Beállítások lehetőséget. A különböző fájlformátumok beállításairól további információt a Támogatott formátumú cikkekben talál.

      • A Speciális területen a következő mezőket adhatja meg:

        • Másolási viselkedés: Meghatározza a másolási viselkedést, ha a forrás fájlalapú adattárból származó fájl. Másolási viselkedésként választhatja a Dinamikus tartalom hozzáadása, a Nincs, az Egybesimított hierarchia vagy a Hierarchia megőrzése lehetőséget. Az egyes beállítások konfigurációja a következő:

          • Dinamikus tartalom hozzáadása: Egy tulajdonságérték kifejezésének megadásához válassza a Dinamikus tartalom hozzáadása lehetőséget. Ez a mező megnyitja a kifejezésszerkesztőt, ahol támogatott rendszerváltozókból, tevékenységkimenetekből, függvényekből és felhasználó által megadott változókból vagy paraméterekből hozhat létre kifejezéseket. A kifejezés nyelvéről további információt a Kifejezések és függvények című témakörben talál.

          • Nincs: Ezt a kijelölést választva nem használhat másolási viselkedést.

          • Egybesimított hierarchia: A forrásmappa összes fájlja a célmappa első szintjén található. A célfájlok automatikusan létrehozott névvel rendelkeznek.

          • Hierarchia megőrzése: Megőrzi a fájlhierarchiát a célmappában. A forrásfájl forrásmappához való relatív elérési útja megegyezik a célfájl célmappához viszonyított elérési útjának relatív elérési útjára.

            Képernyőkép a másolási viselkedésről.

        • Egyidejű kapcsolatok maximális száma: Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat.

        • Blokkméret (MB): Adja meg a blokkméretet MB-ban, amikor adatokat ír a Lakehouse-ba. Az engedélyezett érték 4 MB és 100 MB között lehet.

        • Metaadatok: Egyéni metaadatok beállítása a céladattárba való másoláskor. A tömb minden objektuma metadata egy további oszlopot jelöl. A name határozza meg a metaadatkulcs nevét, a value pedig a kulcs adatértékét. Az attribútumok megőrzése funkció használata esetén a megadott metaadatok egyesülnek/felülírják a forrásfájl metaadatait. Az engedélyezett adatértékek a következők:

          • $$LASTMODIFIED: a fenntartott változó azt jelzi, hogy a forrásfájlok utolsó módosítási időpontját tárolja. Csak bináris formátumú fájlalapú forrásra alkalmazható.

          • Expression

          • Statikus érték

            Képernyőkép a metaadatokról.

Társítás

A Leképezés lap konfigurációja: Leképezés. Ha a Bináris fájlt választja fájlformátumként, a leképezés nem támogatott.

Beállítások

A Beállítások lap konfigurációját a Beállítások lapon találja.

Táblázat összegzése

Az alábbi táblázatok további információt tartalmaznak a Lakehouse-beli másolási tevékenységről.

Forrásadatok

Név Leírás Érték Kötelező JSON-szkript tulajdonság
Adattár típusa Az adattár típusa. Munkaterület Yes /
Munkaterület adattárának típusa A munkaterület adattártípusának kiválasztására vonatkozó szakasz. Tótárház Yes típus
Tótárház A Tótárház, amelyet forrásként használ. <az Ön Tótárháza> Yes workspaceId
artifactId
Gyökérmappa A gyökérmappa típusa. * Táblázatok
* Fájlokat
No rootFolder:
Tábla vagy fájlok
Tábla neve Az adatokat beolvasni kívánt tábla neve. <tábla neve> Igen, amikor a Táblák lehetőséget választja a Gyökérmappában tábla
(a typeProperties - ->>sourcetypeProperties)
Időbélyeg Egy régebbi pillanatkép lekérdezésének időbélyege. <Időbélyeg> No timestampAsOf
Verzió A régebbi pillanatkép lekérdezéséhez használandó verzió. <Változat> No versionAsOf
További oszlopok További adatoszlopok a forrásfájlok relatív elérési útjának vagy statikus értékének tárolásához. Az utóbbi esetében a kifejezés támogatott. *Név
*Érték
No additionalColumns:
*név
*Érték
Fájl elérési útjának típusa A használt fájlelérési út típusa. * Fájl elérési útja
* Helyettesítő karakteres fájl elérési útja
* Fájlok listája
Yes /
Fájl elérési útja Másolja az elérési útból a forrásadattárban lévő mappába/fájlba. A Fájl elérési útjának kiválasztásakor alkalmazza a fájl elérési útját a Fájl elérési útjának típusában. <fájl elérési útja> Igen, amikor a Fájl elérési útját választja * folderPath
*Fájlnév
Helyettesítő karakterek elérési útjai A forrásadattárban helyettesítő karaktereket tartalmazó mappa elérési útja, amely a forrásmappák szűrésére van konfigurálva. A helyettesítő karakteres fájl elérési útja a Fájl elérési útjának típusánál alkalmazható. <helyettesítő karakterek elérési útjai> Igen, amikor helyettesítő karakteres fájl elérési útját választja * helyettesítő karakterFolderPath
* helyettesítő karakterFileName
Mappa elérési útja Egy másolni kívánt fájlokat tartalmazó mappára mutat. Alkalmazza a parancsot a Fájl elérési útjának típusában található fájlok listájának kiválasztásakor. <mappa elérési útja> No folderPath
Fájllista elérési útja Egy adott fájlkészlet másolását jelzi. Mutasson egy szövegfájlra, amely tartalmazza a másolni kívánt fájlok listáját, soronként egy fájlt, amely a konfigurált elérési út relatív elérési útja. Alkalmazza a parancsot a Fájl elérési útjának típusában található fájlok listájának kiválasztásakor. <elérési út a fájllistához> No fileListPath
Rekurzív A bemeneti mappában és annak almappáiban lévő összes fájl rekurzív feldolgozása, vagy csak a kijelölt mappában lévő fájlok feldolgozása. Ez a beállítás egyetlen fájl kijelölésekor le van tiltva. kijelölés vagy a kijelölés megszüntetése No Rekurzív:
true (igaz) vagy false (hamis)
Fájlformátum A használt fájl formátuma. <fájlformátum> Yes típus (alatt formatSettings):
DelimitedTextReadSettings
Szűrés az utolsó módosítás szerint A ([Kezdési időpont, Befejezés időpontja] tartományban legutóbb módosított időponttal rendelkező fájlok további feldolgozásra lesznek szűrve.

Az időpont az UTC időzónára lesz alkalmazva éé-hh-nnThh:mm:ss.fffZ formátumban.

Ez a tulajdonság kihagyható, ami azt jelenti, hogy a rendszer nem alkalmaz fájlattribútum-szűrőt. Ez a tulajdonság nem érvényes, ha a fájl elérési útjának típusát fájlok listájaként konfigurálja.
* Kezdés időpontja
* Befejezés időpontja
No modifiedDatetimeStart
modifiedDatetimeEnd
Partíciófelderítés engedélyezése Elemezni szeretné-e a partíciókat a fájl elérési útjából, és további forrásoszlopokként adja-e hozzá őket. Kijelölve vagy kijelölve No enablePartitionDiscovery:
igaz vagy hamis (alapértelmezett)
Partíció gyökérútvonala A particionált mappák adatoszlopként való olvasásának abszolút partíciós gyökérútvonala. <a partíció gyökérútvonala> No partitionRootPath
Egyidejű kapcsolatok maximális mérete Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor van szükség értékre, ha korlátozni szeretné az egyidejű kapcsolatokat. <egyidejű kapcsolatok maximális mérete> No maxConcurrentConnections

Céladatok

Név Leírás Érték Kötelező JSON-szkript tulajdonság
Adattár típusa Az adattár típusa. Munkaterület Yes /
Munkaterület adattárának típusa A munkaterület adattártípusának kiválasztására vonatkozó szakasz. Tótárház Yes típus
Tótárház A Tótárház, amelyet célként használ. <az Ön Tótárháza> Yes workspaceId
artifactId
Gyökérmappa A gyökérmappa típusa. * Táblázatok
* Fájlokat
Yes rootFolder:
Tábla vagy fájlok
Tábla neve Annak a táblának a neve, amelybe adatokat szeretne írni. <a tábla neve> Igen, amikor a Táblák lehetőséget választja a Gyökérmappában tábla
(a typeProperties - ->>sinktypeProperties)
Sorok maximális száma fájlonként Amikor adatokat ír egy mappába, több fájlba is írhat, és megadhatja a fájlonkénti maximális sorokat. <sorok maximális száma flie-nként> No maxRowsPerFile
Táblaművelet Új értékek hozzáfűzése egy meglévő táblához, vagy felülírja a tábla meglévő adatait és sémáját az új értékekkel. * Hozzáfűzés
* Felülírja
No tableActionOption:
Hozzáfűzés vagy felülírás
Egyidejű kapcsolatok maximális mérete Az adattárhoz a tevékenységfuttatás során létesített egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. <egyidejű kapcsolatok maximális mérete> No maxConcurrentConnections
Fájl elérési útja Adatok írása egy mappa/fájl elérési útjára a céladattárban. <fájl elérési útja> No * folderPath
*Fájlnév
Fájlformátum A használt fájl formátuma. <fájlformátum> Yes típus (alatt formatSettings):
DelimitedTextWriteSettings
Másolási viselkedés A másolási viselkedés, amely akkor van meghatározva, ha a forrás fájlalapú adattárból származik. * Dinamikus tartalom hozzáadása
* Nincs
* Hierarchia egybesimítása
* Hierarchia megőrzése
No copyBehavior:


* FlattenHierarchy
* PreserveHierarchy
Blokkméret (MB) Az adatok Lakehouse-ba való írásához használt blokkméret MB-ban. Az engedélyezett érték 4 MB és 100 MB között lehet. <blokkméret> No blockSizeInMB
Metaadatok A célhelyre történő másoláskor beállított egyéni metaadatok. * $$LASTMODIFIED
*Kifejezés
* Statikus érték
No metaadatok

Következő lépések