Megosztás:


Adatok másolása az Azure Filesból vagy az Azure Filesba az Azure Data Factory használatával

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

Ez a cikk azt ismerteti, hogyan másolhat adatokat az Azure Filesba és onnan. Az Azure Data Factory megismeréséhez olvassa el a bevezető cikket.

Támogatott képességek

Ez az Azure Files-összekötő a következő képességeket támogatja:

Támogatott képességek integrációs modul Felügyelt privát végpont
Másolási tevékenység (forrás/cél) (1) (2) ** ✓ Tárfiók V1 kizárása
Keresési tevékenység (1) (2) ** ✓ Tárfiók V1 kizárása
GetMetadata-tevékenység (1) (2) ** ✓ Tárfiók V1 kizárása
Tevékenység törlése (1) (2) ** ✓ Tárfiók V1 kizárása

(1) Azure-integrációs modul (2) Saját üzemeltetésű integrációs modul

Adatokat másolhat az Azure Filesból bármely támogatott fogadóadattárba, vagy adatokat másolhat bármely támogatott forrásadattárból az Azure Filesba. Azoknak az adattáraknak a listáját, amelyeket a Másolási tevékenység forrásként és fogadóként támogat, tekintse meg a támogatott adattárakat és formátumokat.

Ez az Azure Files-összekötő a következőket támogatja:

  • Fájlok másolása fiókkulcs vagy szolgáltatás közös hozzáférésű jogosultságkód (SAS) hitelesítésével.
  • Fájlok másolása a támogatott fájlformátumokkal és tömörítési kodekekkel, illetve fájlok elemzése/generálása.

Első lépések

A másolási tevékenység folyamattal való végrehajtásához használja az alábbi eszközök vagy SDK-k egyikét:

Társított szolgáltatás létrehozása az Azure Fileshoz felhasználói felületen

Az alábbi lépésekkel létrehozhat egy társított szolgáltatást az Azure Fileshoz az Azure Portal felhasználói felületén.

  1. Keresse meg az Azure Data Factory vagy a Synapse-munkaterület Kezelés lapját, és válassza a Társított szolgáltatások lehetőséget, majd kattintson az Új gombra:

  2. Keressen rá a fájlra, és válassza ki az Azure Files Azure File Storage címkével ellátott összekötőjét.

    Képernyőkép az Azure File Storage-összekötőről.

  3. Konfigurálja a szolgáltatás részleteit, tesztelje a kapcsolatot, és hozza létre az új társított szolgáltatást.

    Képernyőkép egy Azure File Storage társított szolgáltatáskonfigurációjáról.

Az összekötő konfigurációjának részletei

Az alábbi szakaszok az Azure Filesra jellemző entitások definiálásához használt tulajdonságok részleteit ismertetik.

Társított szolgáltatás tulajdonságai

Az Azure Files-összekötő a következő hitelesítési típusokat támogatja. Részletekért tekintse meg a megfelelő szakaszokat.

Megjegyzés

Ha az Azure Files kapcsolt szolgáltatást a örökölt modellel használta, ahol az ADF szerkesztőfelületén "Alapszintű hitelesítésként" jelenik meg, a szolgáltatás továbbra is változatlanul támogatott, miközben javasoljuk, hogy a jövőben az új modellt használja. Az örökölt modell a kiszolgálói üzenetblokkon (SMB) keresztül továbbítja az adatokat a tárolóba, míg az új modell a jobb átviteli sebességet biztosító tároló SDK-t használja. A frissítéshez szerkesztheti a társított szolgáltatást, hogy a hitelesítési módszert "Fiókkulcs" vagy "SAS URI" értékre váltsa; nincs szükség módosításra az adathalmazon vagy a másolási tevékenységen.

Fiókkulcs-hitelesítés

A Data Factory az Alábbi tulajdonságokat támogatja az Azure Files-fiókkulcs-hitelesítéshez:

Ingatlan Leírás Kötelező
típus A típustulajdonságnak a következőre kell állítania: AzureFileStorage. Igen
connectionString Adja meg az Azure Fileshoz való csatlakozáshoz szükséges információkat.
A fiókkulcsot az Azure Key Vaultban is elhelyezheti, és lekérheti a accountKey konfigurációt a kapcsolati karakterláncból. További információkért tekintse meg az alábbi mintákat, valamint az Azure Key Vaultban történő hitelesítő adatok tárolásáról szóló cikket.
Igen
fájlmegosztás Adja meg a fájlmegosztást. Igen
pillanatkép Adja meg a fájlmegosztás pillanatképének dátumát, ha pillanatképből szeretne másolni. Nem
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul . Használhatja az Azure Integration Runtime-ot vagy a saját üzemeltetésű integrációs modult (ha az adattár magánhálózaton található). Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem

Példa:

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountName>;AccountKey=<accountKey>;EndpointSuffix=core.windows.net;",
            "fileShare": "<file share name>"
        },
        "connectVia": {
          "referenceName": "<name of Integration Runtime>",
          "type": "IntegrationRuntimeReference"
        }
    }
}

Példa: a fiókkulcs tárolása az Azure Key Vaultban

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;",
            "fileShare": "<file share name>",
            "accountKey": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }            
    }
}

Közös hozzáférésű jogosultságkód hitelesítése

A megosztott hozzáférésű jogosultságkód delegált hozzáférést biztosít a tárfiók erőforrásaihoz. A megosztott hozzáférésű jogosultságkódokkal korlátozott engedélyeket adhat egy ügyfélnek a tárfiókban lévő objektumokhoz egy adott időre. A közös hozzáférésű jogosultságkódokkal kapcsolatos további információkért lásd : Közös hozzáférésű jogosultságkódok: A közös hozzáférésű jogosultságkód-modell ismertetése.

A szolgáltatás a következő tulajdonságokat támogatja a közös hozzáférésű jogosultságkód-hitelesítés használatához:

Ingatlan Leírás Kötelező
típus A típustulajdonságnak a következőre kell állítania: AzureFileStorage. Igen
sasUri Adja meg az erőforrások megosztott hozzáférésű jogosultságkódjának URI-jának megadását.
Jelölje meg ezt a mezőt SecureStringként a biztonságos tároláshoz. Az SAS-jogkivonatot az Azure Key Vaultban is elhelyezheti az automatikus elforgatás érdekében, így a tokenrészt is eltávolíthatja szükség esetén. További információ: az alábbi minták és a hitelesítő adatok tárolása az Azure Key Vaultban.
Igen
fájlmegosztás Adja meg a fájlmegosztást. Igen
pillanatkép Adja meg a fájlmegosztás pillanatképének dátumát, ha pillanatképből szeretne másolni. Nem
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul . Használhatja az Azure Integration Runtime-ot vagy a saját üzemeltetésű integrációs modult (ha az adattár magánhálózaton található). Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem

Példa:

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {
            "sasUri": {
                "type": "SecureString",
                "value": "<SAS URI of the resource e.g. https://<accountname>.file.core.windows.net/?sv=<storage version>&st=<start time>&se=<expire time>&sr=<resource>&sp=<permissions>&sip=<ip range>&spr=<protocol>&sig=<signature>>"
            },
            "fileShare": "<file share name>",
            "snapshot": "<snapshot version>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Példa: az SAS-jogkivonat tárolása az Azure Key Vaultban

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {
            "sasUri": {
                "type": "SecureString",
                "value": "<SAS URI of the Azure Storage resource without token e.g. https://<accountname>.file.core.windows.net/>"
            },
            "sasToken": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName with value of SAS token e.g. ?sv=<storage version>&st=<start time>&se=<expire time>&sr=<resource>&sp=<permissions>&sip=<ip range>&spr=<protocol>&sig=<signature>>" 
            },
            "fileShare": "<file share name>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Rendszer által hozzárendelt felügyelt identitás hitelesítése

Egy adat-előállító vagy Synapse-folyamat társítható az Azure-erőforrások rendszer által hozzárendelt felügyelt identitásával, amely ezt az erőforrást jelöli más Azure-szolgáltatásokhoz való hitelesítéshez. Ezt a rendszer által hozzárendelt felügyelt identitást használhatja az Azure Files-hitelesítéshez. Az Azure-erőforrások felügyelt identitásairól további információt az Azure-erőforrások felügyelt identitásai című témakörben talál.

A rendszer által hozzárendelt felügyelt identitás hitelesítésének használatához kövesse az alábbi lépéseket:

  1. A rendszer által hozzárendelt felügyelt identitás adatainak lekéréséhez másolja a rendszer által hozzárendelt felügyelt identitásobjektum-azonosító értékét a gyári vagy a Synapse-munkaterülettel együtt.

  2. Adjon engedélyt a felügyelt identitásnak az Azure Filesban. A szerepkörökről további információt ebben a cikkben talál.

    • A forrás esetében, a Hozzáférés-kezelés (IAM) szolgáltatáson belül adjon meg legalább a Storage File Data Privileged Reader szerepkört.
    • Fogadóként a Hozzáférés-vezérlés (IAM) szolgáltatásban adjon meg legalább a Storage File Data Privileged Contributor szerepkört.

Ezek a tulajdonságok támogatottak az Azure Files társított szolgáltatásában:

Ingatlan Leírás Kötelező
típus A típustulajdonságot AzureFileStorage értékre kell állítani. Igen
serviceEndpoint Adja meg az Azure Files szolgáltatásvégpontot a következő mintával https://<accountName>.file.core.windows.net/: . Igen
fájlmegosztás Adja meg a fájlmegosztást. Igen
pillanatkép Adja meg a fájlmegosztás pillanatképének dátumát, ha pillanatképből szeretne másolni. Nem
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul . Használhatja az Azure Integration Runtime-ot. Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem

Megjegyzés

A rendszer által hozzárendelt felügyelt identitás hitelesítését csak az Azure integrációs modulja támogatja.

Példa:

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {            
            "serviceEndpoint": "https://<accountName>.file.core.windows.net/",
            "fileShare": "<file share name>",
            "snapshot": "<snapshot version>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Felhasználó által hozzárendelt felügyelt identitás hitelesítése

Egy adatgyár egy vagy több felhasználó által hozzárendelt felügyelt identitással hozzárendelhető. Ezt a felhasználó által hozzárendelt felügyelt identitást használhatja az Azure Files-hitelesítéshez, amely lehetővé teszi az adatok elérését és másolását az Azure Filesból vagy az Azure Filesba. Az Azure-erőforrások felügyelt identitásairól további információt az Azure-erőforrások felügyelt identitásai című témakörben talál.

A felhasználó által hozzárendelt felügyelt identitáshitelesítés használatához kövesse az alábbi lépéseket:

  1. Hozzon létre egy vagy több felhasználó által hozzárendelt felügyelt identitást , és adjon engedélyt az Azure Filesban. A szerepkörökről további információt ebben a cikkben talál.

    • A forrás esetében, a Hozzáférés-kezelés (IAM) szolgáltatáson belül adjon meg legalább a Storage File Data Privileged Reader szerepkört.
    • Fogadóként a Hozzáférés-vezérlés (IAM) szolgáltatásban adjon meg legalább a Storage File Data Privileged Contributor szerepkört.
  2. Rendeljen hozzá egy vagy több felhasználó által hozzárendelt felügyelt identitást az adat-előállítóhoz, és hozzon létre hitelesítő adatokat minden felhasználó által hozzárendelt felügyelt identitáshoz.

Ezek a tulajdonságok támogatottak az Azure Files társított szolgáltatásában:

Ingatlan Leírás Kötelező
típus A típustulajdonságot AzureFileStorage értékre kell állítani. Igen
serviceEndpoint Adja meg az Azure Files szolgáltatásvégpontot a következő mintával https://<accountName>.file.core.windows.net/: . Igen
azonosító adatok Adja meg a felhasználó által hozzárendelt felügyelt identitást hitelesítő objektumként. Igen
fájlmegosztás Adja meg a fájlmegosztást. Igen
pillanatkép Adja meg a fájlmegosztás pillanatképének dátumát, ha pillanatképből szeretne másolni. Nem
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul . Használhatja az Azure Integration Runtime-ot vagy a saját üzemeltetésű integrációs modult (ha az adattár magánhálózaton található). Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem

Példa:

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {            
            "serviceEndpoint": "https://<accountName>.file.core.windows.net/",
            "credential": {
                "referenceName": "credential1",
                "type": "CredentialReference"
            },
            "fileShare": "<file share name>",
            "snapshot": "<snapshot version>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Régi modell

Ingatlan Leírás Kötelező
típus A típustulajdonságnak a következőre kell állítania: AzureFileStorage. Igen
állomás Az Azure Files-végpontot a következőképpen adja meg:
-Felhasználói felület használata: adja meg \\<storage name>.file.core.windows.net\<file service name>
A JSON használata: "host": "\\\\<storage name>.file.core.windows.net\\<file service name>".
Igen
felhasználóazonosító Adja meg az Azure Files eléréséhez szükséges felhasználót a következő módon:
-Felhasználói felület használata: adja meg AZURE\<storage name>
-A JSON használata: "userid": "AZURE\\<storage name>".
Igen
jelszó Adja meg a tárelérési kulcsot. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja a Data Factoryben, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. Igen
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul . Használhatja az Azure Integration Runtime-ot vagy a saját üzemeltetésű integrációs modult (ha az adattár magánhálózaton található). Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem a forrás, Igen a fogadó

Példa:

{
    "name": "AzureFileStorageLinkedService",
    "properties": {
        "type": "AzureFileStorage",
        "typeProperties": {
            "host": "\\\\<storage name>.file.core.windows.net\\<file service name>",
            "userid": "AZURE\\<storage name>",
            "password": {
                "type": "SecureString",
                "value": "<storage access key>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Adathalmaz tulajdonságai

Az adathalmazok meghatározásához elérhető szakaszok és tulajdonságok teljes listáját az Adathalmazok című cikkben találja.

Az Azure Data Factory a következő fájlformátumokat támogatja. A formátumalapú beállításokat az egyes cikkekben találja.

Az Azure Files a formátumalapú adatkészlet beállításai között location az alábbi tulajdonságokat támogatja:

Ingatlan Leírás Kötelező
típus Az adathalmazon belül a location típustulajdonságot az AzureFileStorageLocation értékre kell állítani. Igen
folderPath A mappa elérési útja. Ha helyettesítő karaktert szeretne használni a mappa szűréséhez, hagyja ki ezt a beállítást, és adja meg a tevékenység forrásbeállításaiban. Nem
fájlnév A fájl neve az adott folderPath mappában. Ha helyettesítő karaktert szeretne használni a fájlok szűréséhez, hagyja ki ezt a beállítást, és adja meg a tevékenység forrásbeállításaiban. Nem

Példa:

{
    "name": "DelimitedTextDataset",
    "properties": {
        "type": "DelimitedText",
        "linkedServiceName": {
            "referenceName": "<Azure File Storage linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, auto retrieved during authoring > ],
        "typeProperties": {
            "location": {
                "type": "AzureFileStorageLocation",
                "folderPath": "root/folder/subfolder"
            },
            "columnDelimiter": ",",
            "quoteChar": "\"",
            "firstRowAsHeader": true,
            "compressionCodec": "gzip"
        }
    }
}

Másolási tevékenység tulajdonságai

A tevékenységek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját a Folyamatok című cikkben találja. Ez a szakasz az Azure Files-forrás és fogadó által támogatott tulajdonságok listáját tartalmazza.

Azure Files mint forrás

Az Azure Data Factory a következő fájlformátumokat támogatja. A formátumalapú beállításokat az egyes cikkekben találja.

Az Azure Files a formátumalapú másolási forrás beállításai között storeSettings az alábbi tulajdonságokat támogatja:

Ingatlan Leírás Kötelező
típus A típustulajdonságot az storeSettings esetén az AzureFileStorageReadSettings értékre kell állítani. Igen
Keresse meg a másolandó fájlokat:
1. LEHETŐSÉG: statikus elérési út
Másolja ki az adathalmazban megadott mappa/fájl elérési útját. Ha az összes fájlt egy mappából szeretné másolni, adja meg a wildcardFileName az * ként is.
2. LEHETŐSÉG: fájlelőtag
-prefixum
A fájlnév előtagja az adott fájlmegosztás alatt, amely egy adatkészletben konfigurálva van a forrásfájlok szűréséhez. A rendszer kijelöli a kezdő névvel fileshare_in_linked_service/this_prefix rendelkező fájlokat. A szolgáltatásoldali szűrőt használja az Azure Fileshoz, amely jobb teljesítményt nyújt, mint egy helyettesítő karakterszűrő. Ez a funkció örökölt társított szolgáltatásmodell használatakor nem támogatott. Nem
3. LEHETŐSÉG: helyettesítő karakter
- helyettesítő karakterekFolderPath
A mappa útvonala helyettesítő karakterekkel a forrásmappák szűréséhez.
Az engedélyezett helyettesítő karakterek a következők: * (nulla vagy több karakternek felel meg) és ? (nulla vagy egyetlen karakternek felel meg); akkor használható ^ a feloldáshoz, ha a mappa tényleges neve helyettesítő karaktert tartalmaz, vagy ez a feloldó karakter található benne.
További példák a mappa- és fájlszűrő példákban.
Nem
3. LEHETŐSÉG: helyettesítő karakter
- wildcardFileName
A forrásfájlok szűréséhez használt fájlnév helyettesítő karaktereket tartalmaz az adott mappa vagy helyettesítő karaktermappa útvonalában.
Az engedélyezett helyettesítő karakterek a következők: * (nulla vagy több karakternek felel meg) és ? (nulla vagy egyetlen karakternek felel meg); akkor használható ^ a feloldásra, ha a tényleges fájlnév helyettesítő karaktert tartalmaz, vagy ez a feloldó karakter található benne. További példák a mappa- és fájlszűrő példákban.
Igen
4. LEHETŐSÉG: a fájlok listája
- fileListPath
Egy adott fájlkészlet másolását jelzi. Adjon meg egy szövegfájlt, amely tartalmazza a másolandó fájlok listáját, úgy, hogy minden sor egy fájlt tartalmazzon, ami az adathalmazban konfigurált elérési útvonalhoz képesti relatív útvonal.
Ha ezt a lehetőséget használja, ne adjon meg fájlnevet az adathalmazban. További példák a 'Fájllista példák' részben.
Nem
További beállítások:
rekurzív Azt jelzi, hogy az adatok rekurzív módon vannak-e beolvasva az almappákból vagy csak a megadott mappából. Ha a rekurzív érték igaz, és a fogadó fájlalapú tároló, a rendszer nem másol vagy hoz létre üres mappát vagy almappát a fogadóban.
Az megengedett értékek: true (alapértelmezett) és false.
Ez a tulajdonság nem érvényes a konfiguráláskor fileListPath.
Nem
töröljeAFájlokatBefejezésUtán Azt jelzi, hogy a bináris fájlok törölve lesznek-e a forrástárból a céltárolóba való sikeres áthelyezés után. A fájltörlés fájlonként történik, ezért ha a másolási tevékenység meghiúsul, látni fogja, hogy egyes fájlok már át lettek másolva a célhelyre, és törölve lettek a forrásból, míg mások továbbra is a forrástárban maradnak.
Ez a tulajdonság csak bináris fájlok másolási forgatókönyvében érvényes. Az alapértelmezett érték: hamis.
Nem
módosítottDátumIdőKezdete A fájlok szűrése a következő attribútum alapján történik: Utolsó módosítás.
A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja nagyobb vagy egyenlő modifiedDatetimeStart és kisebb modifiedDatetimeEnd. Az idő az UTC időzónára "2018-12-01T05:00:00Z" formátumban lesz alkalmazva.
A tulajdonságok null értékűek lehetnek, ami azt jelenti, hogy az adathalmazra nem alkalmaz fájlattribútum-szűrőt. Ha modifiedDatetimeStart dátum/idő érték van megadva, de modifiedDatetimeEnd NULL, az azt jelenti, hogy a program kijelöli azokat a fájlokat, amelyek utolsó módosított attribútuma nagyobb vagy egyenlő a datetime értékkel. Ha modifiedDatetimeEnd dátum/idő érték van megadva, de modifiedDatetimeStart NULL, az azt jelenti, hogy azok a fájlok lesznek kiválasztva, amelyeknek az utolsó módosított attribútuma kisebb, mint a datetime érték.
Ez a tulajdonság nem érvényes a konfiguráláskor fileListPath.
Nem
módosított dátum/idővége Lásd fentebb. Nem
partíciófelfedezés engedélyezése Particionált fájlok esetén adja meg, hogy elemezni szeretné-e a partíciókat a fájl elérési útján, és további forrásoszlopokként adja hozzá őket.
Az engedélyezett értékek hamis (alapértelmezett) és igaz.
Nem
partitionRootPath Ha a partíciófelderítés engedélyezve van, adja meg az abszolút gyökér elérési utat a particionált mappák adatoszlopként való olvasásához.

Ha nincs megadva, alapértelmezés szerint
– Amikor fájlelérési utakat használ az adathalmazban vagy a forrásban lévő fájlok listájában, a partíció gyökérútvonala az az útvonal, amely az adathalmazban van konfigurálva.
– Helyettesítő karakteres mappaszűrő használata esetén a partíció gyökérútvonala az első helyettesítő karakter előtti alútvonal.

Tegyük fel például, hogy az adathalmaz elérési útját "root/folder/year=2020/month=08/day=27" értékre konfigurálja:
- Ha a partíció gyökér elérési útját "root/folder/year=2020" értékként adja meg, a másolási tevékenység a fájlokon belüli oszlopok mellett két további oszlopot monthday hoz létre, valamint a "08" és a "27" értéket.
– Ha nincs megadva partíciógyökér elérési útja, a rendszer nem hoz létre további oszlopot.
Nem
maximális egyidejű kapcsolatok Az adattárhoz a tevékenység futtatása során létrehozott egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. Nem

Példa:

"activities":[
    {
        "name": "CopyFromAzureFileStorage",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Delimited text input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "DelimitedTextSource",
                "formatSettings":{
                    "type": "DelimitedTextReadSettings",
                    "skipLineCount": 10
                },
                "storeSettings":{
                    "type": "AzureFileStorageReadSettings",
                    "recursive": true,
                    "wildcardFolderPath": "myfolder*A",
                    "wildcardFileName": "*.csv"
                }
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Azure Files fogadóként

Az Azure Data Factory a következő fájlformátumokat támogatja. A formátumalapú beállításokat az egyes cikkekben találja.

Az Azure Files a formátumalapú másolási fogadó beállításai között storeSettings az alábbi tulajdonságokat támogatja:

Ingatlan Leírás Kötelező
típus Az alatta lévő storeSettings típustulajdonságnak AzureFileStorageWriteSettings értékre kell állítania. Igen
copyBehavior Meghatározza a másolási viselkedést, ha a forrás fájlalapú adattárból származó fájlok.

Az engedélyezett értékek a következők:
- PreserveHierarchy (alapértelmezett): Megőrzi a fájlhierarchiát a célmappában. A forrásfájl forrásmappához viszonyított elérési útja megegyezik a célfájl célmappához viszonyított elérési útjával.
- FlattenHierarchy: A forrásmappából származó összes fájl a célmappa első szintjén található. A célfájlok automatikusan létrehozott névvel rendelkeznek.
- MergeFiles: A forrásmappából származó összes fájlt egyetlen fájlba egyesíti. Ha a fájlnév meg van adva, az egyesített fájlnév a megadott név. Ellenkező esetben ez egy automatikusan létrehozott fájlnév.
Nem
maximális egyidejű kapcsolatok Az adattárhoz a tevékenység futtatása során létrehozott egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. Nem

Példa:

"activities":[
    {
        "name": "CopyToAzureFileStorage",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Parquet output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "ParquetSink",
                "storeSettings":{
                    "type": "AzureFileStorageWriteSettings",
                    "copyBehavior": "PreserveHierarchy"
                }
            }
        }
    }
]

Megjegyzés

Akár 4 MB adatot is másolhat a fogadóhelyre, ha rendszer által hozzárendelt vagy felhasználó által hozzárendelt felügyelt identitást használ hitelesítési típusként.

Mappa- és fájlszűrő példák

Ez a szakasz ismerteti, hogyan viselkedik a mappa elérési útja és a fájlnév, amikor helyettesítő karaktereket alkalmazunk.

folderPath fájlnév rekurzív A forrásmappa struktúrája és a szűrés eredménye (a félkövér fájlokat a rendszer lekéri)
Folder* (üres, alapértelmezett beállítás) false FolderA
     File1.csv
     File2.json
    Almappák1
        File3.csv
        File4.json
        File5.csv
Másik MappaB
    File6.csv
Folder* (üres, alapértelmezett beállítás) igaz FolderA
     File1.csv
     File2.json
    Almappák1
         File3.csv
         File4.json
         File5.csv
Másik MappaB
    File6.csv
Folder* *.csv false FolderA
     File1.csv
    File2.json
    Almappák1
        File3.csv
        File4.json
        File5.csv
Másik MappaB
    File6.csv
Folder* *.csv igaz FolderA
     File1.csv
    File2.json
    Almappák1
         File3.csv
        File4.json
         File5.csv
Másik MappaB
    File6.csv

Példák fájllistára

Ez a szakasz a fájllista elérési útjának másolási tevékenység forrásában való használatát ismerteti.

Feltéve, hogy a következő forrásmappa-struktúrával rendelkezik, és félkövér formátumban szeretné másolni a fájlokat:

Minta forrásstruktúra A FileListToCopy.txt tartalma Konfiguráció
gyökér
    FolderA
         File1.csv
        File2.json
        Almappák1
             File3.csv
            File4.json
             File5.csv
    Metaadatok
        FileListToCopy.txt
File1.csv
Almappák1/File3.csv
Almappák1/File5.csv
Adatkészletben:
- Mappa elérési útja: root/FolderA

Másolási tevékenység forrása:
- Fájllista elérési útja: root/Metadata/FileListToCopy.txt

A fájllista elérési útja egy olyan szövegfájlra mutat ugyanabban az adattárban, amely tartalmazza a másolni kívánt fájlok listáját. Soronként egy fájl szerepel benne, a fájl relatív elérési útjával az adathalmazban konfigurált elérési úthoz képest.

rekurzív és copyBehavior példák

Ez a szakasz a Másolás művelet eredményül kapott viselkedését ismerteti a rekurzív és a copyBehavior értékek különböző kombinációihoz.

rekurzív copyBehavior Forrásmappa-struktúra Eredményként kapott cél
igaz hierarchia megőrzése Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A Mappa1 célmappa a forrással megegyező struktúrával jön létre:

Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5.
igaz hierarchia laposítása Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A célmappa1 a következő struktúrával jön létre:

Mappa1
    a Fájl1 automatikusan létrehozott neve
    Az automatikusan létrehozott név a File2-höz.
    a Fájl3 automatikusan létrehozott neve
    a Fájl4 automatikusan létrehozott neve
    a Fájl5 automatikusan létrehozott neve
igaz Fájlok egyesítése Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A célmappa1 a következő struktúrával jön létre:

Mappa1
    File1 + File2 + File3 + File4 + File 5 tartalom egyesítése egy fájlba automatikusan létrehozott fájlnévvel
false hierarchia megőrzése Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A Mappa1 célmappa a következő struktúrával jön létre

Mappa1
    Fájl1
    Fájl2

Az Subfolder1 Fájl3, Fájl4 és Fájl5 fájljait nem vették fel.
false hierarchia laposítása Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A Mappa1 célmappa a következő struktúrával jön létre

Mappa1
    a Fájl1 automatikusan létrehozott neve
    Az automatikusan létrehozott név a File2-höz.

Az Subfolder1 Fájl3, Fájl4 és Fájl5 fájljait nem vették fel.
false Fájlok egyesítése Mappa1
    Fájl1
    Fájl2
    Almappák1
        Fájl3
        Fájl4
        Fájl5
A Mappa1 célmappa a következő struktúrával jön létre

Mappa1
    Az 1. és a 2. fájl tartalma egy automatikusan létrehozott fájlnévvel rendelkező fájlba egyesül. a Fájl1 automatikusan létrehozott neve

Az Subfolder1 Fájl3, Fájl4 és Fájl5 fájljait nem vették fel.

Keresési tevékenység tulajdonságai

A tulajdonságok részleteinek megismeréséhez tekintse meg a keresési tevékenységet.

GetMetadata tevékenység tulajdonságai

A tulajdonságok részleteinek megismeréséhez ellenőrizze a GetMetadata-tevékenységet

Tevékenységtulajdonságok törlése

A tulajdonságok részleteinek megismeréséhez ellenőrizze a Törlési tevékenységet

Régi modellek

Megjegyzés

Az alábbi modellek továbbra is támogatottak a visszamenőleges kompatibilitás érdekében. Javasoljuk, hogy a fenti szakaszokban említett új modellt használja, és a szerzői felhasználói felület átállt az új modell létrehozására.

Örökölt adathalmaz-modell

Ingatlan Leírás Kötelező
típus Az adathalmaz típustulajdonságának a következőnek kell lennie: FileShare Igen
folderPath A mappa elérési útja.

A helyettesítő karakterek szűrője támogatott, az engedélyezett helyettesítő karakterek a következők: * (nulla vagy több karakternek felel meg) és ? (nulla vagy egyetlen karakternek felel meg); akkor használható ^ , ha a mappa tényleges neve helyettesítő karaktert tartalmaz, vagy ez a feloldó karakter található benne.

Példák: gyökérmappák/almappák/, további példák a Mappa és fájlszűrő példákban.
Igen
fájlnév A megadott "folderPath" alatt található fájl(ok) neve vagy helyettesítő karakterszűrője . Ha nem ad meg értéket ehhez a tulajdonsághoz, az adathalmaz a mappában lévő összes fájlra mutat.

Szűrő esetén az engedélyezett helyettesítő karakterek a következők: * (nulla vagy több karakternek felel meg) és ? (nulla vagy egy karakternek felel meg).
- 1. példa: "fileName": "*.csv"
- 2. példa: "fileName": "???20180427.txt"
A feloldás akkor használható ^ , ha a tényleges fájlnévben helyettesítő karakter vagy ez a feloldó karakter található.

Ha a fájlnév nincs megadva kimeneti adatkészlethez, és a preserveHierarchy nincs megadva a tevékenység kimenetében, a másolási tevékenység automatikusan létrehozza a fájlnevet a következő mintával: "Data.[tevékenység-futtatás azonosítója GUID].[GUID ha FlattenHierarchy].[formátum, ha konfigurálva van].[tömörítés, ha konfigurálva]", például "Data.0a405f8a-93ff-4c6f-b3be-f69616f1df7a.txt.gz"; ha lekérdezés helyett táblanév alapján másol táblázatos forrásból, a névminta a következő: "[táblanév].[formátum].[tömörítés, ha konfigurálva van]", például "MyTable.csv".
Nem
módosítottDátumIdőKezdete A fájlok szűrése a következő attribútum alapján történik: Utolsó módosítás. A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja nagyobb vagy egyenlő modifiedDatetimeStart és kisebb modifiedDatetimeEnd. Az idő az UTC időzónára "2018-12-01T05:00:00Z" formátumban lesz alkalmazva.

Vegye figyelembe, hogy az adatáthelyezés általános teljesítménye hatással lesz erre a beállításra, ha nagy mennyiségű fájlból szeretne fájlszűrőt végezni.

A tulajdonságok null értékűek lehetnek, ami azt jelenti, hogy az adathalmazra nem alkalmaz fájlattribútum-szűrőt. Ha modifiedDatetimeStart dátum/idő érték van megadva, de modifiedDatetimeEnd NULL, az azt jelenti, hogy a program kijelöli azokat a fájlokat, amelyek utolsó módosított attribútuma nagyobb vagy egyenlő a datetime értékkel. Ha modifiedDatetimeEnd dátum/idő érték van megadva, de modifiedDatetimeStart NULL, az azt jelenti, hogy azok a fájlok lesznek kiválasztva, amelyeknek az utolsó módosított attribútuma kisebb, mint a datetime érték.
Nem
módosított dátum/idővége A fájlok szűrése a következő attribútum alapján történik: Utolsó módosítás. A fájlok akkor lesznek kijelölve, ha az utolsó módosításuk időpontja nagyobb vagy egyenlő modifiedDatetimeStart és kisebb modifiedDatetimeEnd. Az idő az UTC időzónára "2018-12-01T05:00:00Z" formátumban lesz alkalmazva.

Vegye figyelembe, hogy az adatáthelyezés általános teljesítménye hatással lesz erre a beállításra, ha nagy mennyiségű fájlból szeretne fájlszűrőt végezni.

A tulajdonságok null értékűek lehetnek, ami azt jelenti, hogy az adathalmazra nem alkalmaz fájlattribútum-szűrőt. Ha modifiedDatetimeStart dátum/idő érték van megadva, de modifiedDatetimeEnd NULL, az azt jelenti, hogy a program kijelöli azokat a fájlokat, amelyek utolsó módosított attribútuma nagyobb vagy egyenlő a datetime értékkel. Ha modifiedDatetimeEnd dátum/idő érték van megadva, de modifiedDatetimeStart NULL, az azt jelenti, hogy azok a fájlok lesznek kiválasztva, amelyeknek az utolsó módosított attribútuma kisebb, mint a datetime érték.
Nem
formátum Ha fájlokat szeretne másolni fájlalapú tárolók között (bináris másolás), hagyja ki a formátumszakaszt a bemeneti és kimeneti adatkészlet-definíciókban.

Ha adott formátumú fájlokat szeretne elemezni vagy létrehozni, a következő fájlformátumtípusok támogatottak: TextFormat, JsonFormat, AvroFormat, OrcFormat, ParquetFormat. A formátum alatti típustulajdonság beállítása az alábbi értékek egyikére. További információ: Szövegformátum, JSON Formátum, Avro Formátum, Orc Format és Parquet Format szakaszok.
Nem (csak bináris másolási forgatókönyv esetén)
tömörítés Adja meg az adatok tömörítési típusát és szintjét. További információ: Támogatott fájlformátumok és tömörítési kodekek.
Támogatott típusok: GZip, Deflate, BZip2 és ZipDeflate.
Támogatott szintek: Optimális és Leggyorsabb.
Nem

Tipp.

Ha az összes fájlt át szeretné másolni egy mappában, csak a folderPath értéket adja meg.
Ha egy adott nevű fájlt szeretne másolni, adja meg a folderPath mellé a mappát, és a fileName mellé a fájlnevet.
Ha egy mappa alá szeretné másolni a fájlok egy részhalmazát, adja meg a folderPath mapparészt és a fileName fájlt helyettesítő karakter szűrővel.

Megjegyzés

Ha a fájlszűrőhöz a "fileFilter" tulajdonságot használta, az továbbra is támogatott, miközben a rendszer azt javasolja, hogy használja a fájlnévhez hozzáadott új szűrőképességet.

Példa:

{
    "name": "AzureFileStorageDataset",
    "properties": {
        "type": "FileShare",
        "linkedServiceName":{
            "referenceName": "<Azure File Storage linked service name>",
            "type": "LinkedServiceReference"
        },
        "typeProperties": {
            "folderPath": "folder/subfolder/",
            "fileName": "*",
            "modifiedDatetimeStart": "2018-12-01T05:00:00Z",
            "modifiedDatetimeEnd": "2018-12-01T06:00:00Z",
            "format": {
                "type": "TextFormat",
                "columnDelimiter": ",",
                "rowDelimiter": "\n"
            },
            "compression": {
                "type": "GZip",
                "level": "Optimal"
            }
        }
    }
}

Régi másolási tevékenység forrásmodellje

Ingatlan Leírás Kötelező
típus A másolási tevékenység forrásának típustulajdonságának a következőnek kell lennie: FileSystemSource Igen
rekurzív Azt jelzi, hogy az adatok rekurzív módon vannak-e beolvasva az almappákból vagy csak a megadott mappából. Vegye figyelembe, hogy ha a rekurzív beállítás igaz, és a cél fájlalapú tároló, az üres mappa/almappa nem lesz másolva vagy létrehozva a célhelyen.
Az engedélyezett értékek a következők: igaz (alapértelmezett), hamis
Nem
maximális egyidejű kapcsolatok Az adattárhoz a tevékenység futtatása során létrehozott egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. Nem

Példa:

"activities":[
    {
        "name": "CopyFromAzureFileStorage",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Azure File Storage input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "FileSystemSource",
                "recursive": true
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Régi másolási tevékenység tároló modell

Ingatlan Leírás Kötelező
típus A másolási tevékenység fogadójának típustulajdonságaként a következőt kell megadni: FileSystemSink Igen
copyBehavior Meghatározza a másolási viselkedést, ha a forrás fájlalapú adattárból származó fájlok.

Az engedélyezett értékek a következők:
- PreserveHierarchy (alapértelmezett): megőrzi a fájlhierarchiát a célmappában. A forrásfájl forrásmappához viszonyított elérési útja megegyezik a célfájl célmappához viszonyított elérési útjával.
- FlattenHierarchy: a forrásmappából származó összes fájl a célmappa első szintjén található. A célfájlok neve automatikusan létre lett hozva.
- MergeFiles: a forrásmappából származó összes fájlt egyetlen fájlba egyesíti. Ha a fájlnév meg van adva, az egyesített fájlnév lesz a megadott név; ellenkező esetben automatikusan generált fájlnév lenne.
Nem
maximális egyidejű kapcsolatok Az adattárhoz a tevékenység futtatása során létrehozott egyidejű kapcsolatok felső korlátja. Csak akkor adjon meg értéket, ha korlátozni szeretné az egyidejű kapcsolatokat. Nem

Példa:

"activities":[
    {
        "name": "CopyToAzureFileStorage",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure File Storage output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "FileSystemSink",
                "copyBehavior": "PreserveHierarchy"
            }
        }
    }
]

A másolási tevékenység által forrásként és fogadóként támogatott adattárak listáját a támogatott adattárakban találja.