Adatok másolása és átalakítása a Microsoft 365-ből (Office 365) az Azure-ba az Azure Data Factory vagy a Synapse Analytics használatával

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

Az Azure Data Factory és a Synapse Analytics-folyamatok integrálhatók a Microsoft Graph Adatösszekötő, így a Microsoft 365 -ös (Office 365-ös) bérlő gazdag szervezeti adatait skálázható módon hozhatja be az Azure-ba, elemzési alkalmazásokat hozhat létre, és elemzéseket nyerhet ki ezek alapján az értékes adategységek alapján. A Privileged Access Managementtel való integráció biztonságos hozzáférés-vezérlést biztosít a Microsoft 365 (Office 365) értékes válogatott adataihoz. A Microsoft Graph Adatösszekötő áttekintéséhez tekintse meg ezt a hivatkozást.

Ez a cikk bemutatja, hogyan másolhat adatokat a Másolási tevékenység használatával, és hogyan Adatfolyam adatokat átalakítani a Microsoft 365-ből (Office 365). Az adatok másolásának bemutatásához olvassa el a másolási tevékenység áttekintését. Az adatok átalakításának bemutatásához olvassa el a leképezési adatfolyam áttekintését.

Megjegyzés:

A Microsoft 365 Adatfolyam-összekötő jelenleg előzetes verzióban érhető el. A részvételhez használja ezt a regisztrációs űrlapot: M365 + Analytics Preview.

Támogatott képességek

Ez a Microsoft 365 -összekötő (Office 365) a következő képességeket támogatja:

Támogatott képességek IR
Copy tevékenység (forrás/-)
Adatfolyam leképezése (forrás/-)

(1) Azure-integrációs modul (2) Saját üzemeltetésű integrációs modul

Az ADF Microsoft 365 (Office 365) összekötő és Microsoft Graph Adatösszekötő lehetővé teszi az Exchange E-mail-kompatibilis postaládák különböző típusú adathalmazainak nagy méretű betöltését, beleértve a címjegyzékbeli névjegyeket, a naptáreseményeket, az e-mail üzeneteket, a felhasználói adatokat, a postaláda-beállításokat stb. Az elérhető adathalmazok teljes listáját itt tekintheti meg.

Egyelőre egyetlen másolási tevékenységen és adatfolyamon belül csak a Microsoft 365-ből (Office 365) lehet adatokat betöltésre az Azure Blob Storage-ba, az Azure Data Lake Storage Gen1-be és az Azure Data Lake Storage Gen2-be JSON formátumban (type setOfObjects). Az Azure Blob Storage-ba való másoláskor a kimenet egy JSON-szöveget tartalmazó blob. Ha a Microsoft 365-öt (Office 365) más típusú adattárakba vagy más formátumokba szeretné betölteni, az első másolási tevékenységet vagy adatfolyamot egy későbbi tevékenységgel láncolhatja, hogy az adatokat a támogatott ADF-céltárolókba tovább betöltse (lásd a "Támogatott adattárak és formátumok" tábla "támogatott fogadóként" oszlopát).

Fontos

  • Az adat-előállítót vagy a Synapse-munkaterületet tartalmazó Azure-előfizetésnek és a fogadó adattárnak a Microsoft 365 (Office 365) bérlőjével azonos Microsoft Entra-bérlő alatt kell lennie.
  • Győződjön meg arról, hogy a másolási tevékenységhez használt Azure Integration Runtime régió és a cél ugyanabban a régióban található, ahol a Microsoft 365 (Office 365) bérlői felhasználói postaládája található. Itt megtudhatja, hogyan határozható meg az Azure IR-hely. A támogatott Office-régiók és a hozzájuk tartozó Azure-régiók listáját itt találja.
  • A szolgáltatásnév-hitelesítés az egyetlen olyan hitelesítési mechanizmus, amelyet az Azure Blob Storage, az Azure Data Lake Storage Gen1 és az Azure Data Lake Storage Gen2 támogat céltárolóként.

Megjegyzés:

Használja az Azure integrációs modult a forrás- és fogadóalapú társított szolgáltatásokban is. A saját üzemeltetésű integrációs modul és a felügyelt virtuális hálózati integrációs modul nem támogatott.

Előfeltételek

A Microsoft 365 -ből (Office 365) származó adatok Azure-ba való másolásához és átalakításához el kell végeznie az alábbi előfeltétel-lépéseket:

  • A Microsoft 365 (Office 365) bérlői rendszergazdának beszállási műveleteket kell végrehajtania az itt leírtak szerint.
  • Microsoft Entra-webalkalmazás létrehozása és konfigurálása a Microsoft Entra-azonosítóban. Útmutatásért lásd: Microsoft Entra-alkalmazás létrehozása.
  • Jegyezze fel a következő értékeket, amelyeket a Microsoft 365 (Office 365) társított szolgáltatásának meghatározásához fog használni:
  • Adja hozzá azt a felhasználói identitást, aki a Microsoft Entra webalkalmazás tulajdonosaként fogja megadni az adathozzáférési kérelmet (a Microsoft Entra webalkalmazásból > Gépház > Tulajdonos > hozzáadása).
    • A felhasználói identitásnak a Microsoft 365 (Office 365) szervezetében kell lennie, ahonnan adatokat kap, és nem lehet vendégfelhasználó.

Új adathozzáférési kérelmek jóváhagyása

Ha ez az első alkalom, hogy adatokat kér ehhez a környezethez (amelyből az adattábla elérése folyamatban van, melyik célfiókba tölti be az adatokat, és melyik felhasználói identitás teszi meg az adathozzáférési kérelmet), akkor a másolási tevékenység állapota "Folyamatban" állapotú lesz, és csak akkor, ha a Műveletek területen a "Részletek" hivatkozásra kattint, a "RequestingConsent" állapot jelenik meg. Az adathozzáférés-jóváhagyó csoport egy tagjának jóvá kell hagynia a kérést a Privileged Access Managementben, mielőtt az adatkinyerés folytatódhat.

Itt megtudhatja, hogyan hagyhatja jóvá a jóváhagyó az adathozzáférési kérelmet, és itt talál magyarázatot a Privileged Access Management általános integrációjáról, beleértve az adathozzáférés-jóváhagyó csoport beállítását is.

Első lépések

Tipp.

A Microsoft 365 (Office 365) összekötő használatáról további információt a Microsoft 365 (Office 365) adatainak betöltése című cikkben talál.

Az alábbi eszközök vagy SDK-k egyikével létrehozhat egy folyamatot a másolási tevékenységgel és az adatfolyammal. Kattintson egy hivatkozásra egy oktatóanyagra lépésenkénti útmutatással egy másolási tevékenységgel rendelkező folyamat létrehozásához.

Társított szolgáltatás létrehozása a Microsoft 365-höz (Office 365) felhasználói felülettel

Az alábbi lépésekkel létrehozhat egy társított szolgáltatást a Microsoft 365-höz (Office 365) az Azure Portal felhasználói felületén.

  1. Keresse meg az Azure Data Factory vagy a Synapse-munkaterület Kezelés lapját, és válassza a Társított szolgáltatások lehetőséget, majd kattintson az Új gombra:

  2. Keresse meg a Microsoft 365-öt (Office 365), és válassza a Microsoft 365 (Office 365) összekötőt.

    Screenshot of the Microsoft 365 (Office 365) connector.

  3. Konfigurálja a szolgáltatás részleteit, tesztelje a kapcsolatot, és hozza létre az új társított szolgáltatást.

    Screenshot of linked service configuration for Microsoft 365 (Office 365).

Csatlakozás or konfigurációjának részletei

Az alábbi szakaszok a Microsoft 365 -összekötőre (Office 365) jellemző Data Factory-entitások meghatározásához használt tulajdonságok részleteit ismertetik.

Társított szolgáltatás tulajdonságai

A Microsoft 365 (Office 365) társított szolgáltatásához az alábbi tulajdonságok támogatottak:

Property Leírás Required
típus A típustulajdonságnak a következőnek kell lennie: Office365 Igen
office365TenantId Az Azure-bérlő azonosítója, amelyhez a Microsoft 365 (Office 365) fiók tartozik. Igen
servicePrincipalTenantId Adja meg azokat a bérlői adatokat, amelyek alatt a Microsoft Entra-webalkalmazás található. Igen
servicePrincipalId Adja meg az alkalmazás ügyfél-azonosítóját. Igen
servicePrincipalKey Adja meg az alkalmazás kulcsát. Jelölje meg ezt a mezőt SecureStringként a biztonságos tároláshoz. Igen
connectVia Az adattárhoz való csatlakozáshoz használandó integrációs modul. Ha nincs megadva, az alapértelmezett Azure Integration Runtime-t használja. Nem

Megjegyzés:

Az office365TenantId és a servicePrincipalTenantId és a megfelelő érték közötti különbség:

  • Ha Ön nagyvállalati fejlesztő, aki a saját szervezetének használatára fejleszt alkalmazást a Microsoft 365 (Office 365) adatai alapján, akkor mindkét tulajdonsághoz ugyanazt a bérlőazonosítót kell megadnia, amely a szervezet Microsoft Entra-bérlőazonosítója.
  • Ha Ön isV-fejlesztő, aki egy alkalmazást fejleszt az ügyfelei számára, akkor az office365TenantId lesz az ügyfél (alkalmazástelepítő) Microsoft Entra-bérlőazonosítója, a servicePrincipalTenantId pedig a vállalat Microsoft Entra-bérlőazonosítója.

Példa

{
    "name": "Office365LinkedService",
    "properties": {
        "type": "Office365",
        "typeProperties": {
            "office365TenantId": "<Microsoft 365 (Office 365) tenant id>",
            "servicePrincipalTenantId": "<AAD app service principal tenant id>",
            "servicePrincipalId": "<AAD app service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<AAD app service principal key>"
            }
        }
    }
}

Adathalmaz tulajdonságai

Az adathalmazok meghatározásához elérhető szakaszok és tulajdonságok teljes listáját az adathalmazokról szóló cikkben találja. Ez a szakasz a Microsoft 365 (Office 365) adatkészlet által támogatott tulajdonságok listáját tartalmazza.

Ha adatokat szeretne másolni a Microsoft 365-ből (Office 365), az alábbi tulajdonságok támogatottak:

Property Leírás Required
típus Az adathalmaz típustulajdonságának a következőnek kell lennie: Office365Table Igen
tableName A Microsoft 365-ből kinyerni kívánt adatkészlet neve (Office 365). A kinyeréshez elérhető Microsoft 365 -ös (Office 365-ös) adatkészletek listáját itt találja. Igen

Ha beállította a , dateFilterColumnstartTime, endTimeés userScopeFilterUri az adathalmazban, akkor is támogatott, miközben a tevékenységforrásban javasolt az új modell használata.

Példa

{
    "name": "DS_May2019_O365_Message",
    "properties": {
        "type": "Office365Table",
        "linkedServiceName": {
            "referenceName": "<Microsoft 365 (Office 365) linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "tableName": "BasicDataSet_v0.Event_v1"
        }
    }
}

Másolási tevékenység tulajdonságai

A tevékenységek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját a Folyamatok című cikkben találja. Ez a szakasz a Microsoft 365 (Office 365) forrás által támogatott tulajdonságok listáját tartalmazza.

Microsoft 365 (Office 365) forrásként

Ha adatokat szeretne másolni a Microsoft 365-ből (Office 365), a másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak:

Property Leírás Required
típus A másolási tevékenység forrásának típustulajdonságának a következőnek kell lennie: Office365Source Igen
allowedGroups Csoportválasztási predikátum. Ezzel a tulajdonságkal legfeljebb 10 olyan felhasználói csoportot választhat ki, amelynek adatait lekéri. Ha nincs megadva csoport, akkor a rendszer a teljes szervezet adatait adja vissza. Nem
userScopeFilterUri Ha allowedGroups nincs megadva tulajdonság, a teljes bérlőre alkalmazott predikátumkifejezéssel szűrheti az adott sorokat a Microsoft 365-ből (Office 365). A predikátum formátumának meg kell egyeznie a Microsoft Graph API-k lekérdezési formátumával, például. https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance' Nem
dateFilterColumn A DateTime szűrőoszlop neve. Ezzel a tulajdonságkal korlátozhatja a Microsoft 365 (Office 365) adatainak kinyerési időtartamát. Igen, ha az adatkészlet egy vagy több DateTime-oszlopot tartalmaz. A DateTime-szűrőt igénylő adathalmazok listáját itt találja.
startTime Indítsa el a DateTime értéket, amelyen szűrni szeretne. Igen, ha dateFilterColumn meg van adva
endTime Záró Dátum/idő érték, amelyen szűrni szeretne. Igen, ha dateFilterColumn meg van adva
outputColumns A fogadóba másolandó oszlopok tömbje. Nem

Példa

"activities": [
    {
        "name": "CopyFromO365ToBlob",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Microsoft 365 (Office 365) input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "Office365Source",
                "dateFilterColumn": "CreatedDateTime",
                "startTime": "2019-04-28T16:00:00.000Z",
                "endTime": "2019-05-05T16:00:00.000Z",
                "userScopeFilterUri": "https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'",
                "outputColumns": [
                    {
                        "name": "Id"
                    },
                    {
                        "name": "CreatedDateTime"
                    },
                    {
                        "name": "LastModifiedDateTime"
                    },
                    {
                        "name": "ChangeKey"
                    },
                    {
                        "name": "Categories"
                    },
                    {
                        "name": "OriginalStartTimeZone"
                    },
                    {
                        "name": "OriginalEndTimeZone"
                    },
                    {
                        "name": "ResponseStatus"
                    },
                    {
                        "name": "iCalUId"
                    },
                    {
                        "name": "ReminderMinutesBeforeStart"
                    },
                    {
                        "name": "IsReminderOn"
                    },
                    {
                        "name": "HasAttachments"
                    },
                    {
                        "name": "Subject"
                    },
                    {
                        "name": "Body"
                    },
                    {
                        "name": "Importance"
                    },
                    {
                        "name": "Sensitivity"
                    },
                    {
                        "name": "Start"
                    },
                    {
                        "name": "End"
                    },
                    {
                        "name": "Location"
                    },
                    {
                        "name": "IsAllDay"
                    },
                    {
                        "name": "IsCancelled"
                    },
                    {
                        "name": "IsOrganizer"
                    },
                    {
                        "name": "Recurrence"
                    },
                    {
                        "name": "ResponseRequested"
                    },
                    {
                        "name": "ShowAs"
                    },
                    {
                        "name": "Type"
                    },
                    {
                        "name": "Attendees"
                    },
                    {
                        "name": "Organizer"
                    },
                    {
                        "name": "WebLink"
                    },
                    {
                        "name": "Attachments"
                    },
                    {
                        "name": "BodyPreview"
                    },
                    {
                        "name": "Locations"
                    },
                    {
                        "name": "OnlineMeetingUrl"
                    },
                    {
                        "name": "OriginalStart"
                    },
                    {
                        "name": "SeriesMasterId"
                    }
                ]
            },
            "sink": {
                "type": "BlobSink"
            }
        }
    }
]

Adatok átalakítása a Microsoft 365-összekötővel

A Microsoft 365-adathalmazok forrásként használhatók az adatfolyamok leképezéséhez. Az adatfolyam az adathalmaz automatikus összesimításával átalakítja az adatokat. Ez lehetővé teszi a felhasználók számára, hogy az összesimított adatkészletek kihasználására összpontosíthassanak az elemzési forgatókönyvek felgyorsítása érdekében.

Adatfolyam-tulajdonságok leképezése

Ha a Microsoft 365-összekötővel forrásként szeretne leképezési adatfolyamot létrehozni, hajtsa végre az alábbi lépéseket:

  1. Az ADF Studióban nyissa meg a Szerzői központ Adatfolyamok szakaszát, válassza a ... gombot az Adatfolyam-műveletek menü legördülő menüjéhez, majd válassza az Új adatfolyam elemet. Kapcsolja be a hibakeresési módot az adatfolyam-vászon felső sávjának Adatfolyam hibakeresés gombjával.

    Screenshot of the data flow debug button in mapping data flow.

  2. A leképezési adatfolyam-szerkesztőben válassza a Forrás hozzáadása lehetőséget.

    Screenshot of add source in mapping data flow.

  3. A Forrásbeállítások lapon válassza a Beágyazott elemet a Forrástípus tulajdonságban, a Microsoft 365 (Office 365) inline adathalmaztípusban, valamint a Korábban létrehozott Microsoft 365 társított szolgáltatást.

    Screenshot of the select dataset option in source settings of mapping data flow source.

  4. A Lapon a Forrásbeállítások lapon válassza ki az átalakítani kívánt Microsoft 365-tábla táblanevét . Válassza az Automatikus simítás lehetőséget is, hogy eldöntse, szeretné-e, hogy az adatfolyam automatikusan összesimíthassa a forrásadatkészletet.

    Screenshot of the source options of mapping data flow source.

  5. A Leképezés, az Optimalizálás és a Vizsgálat lapfülek esetében kövesse a leképezési adatfolyamot.

  6. A lapon az Adatok előnézete gombra kattintva a Frissítés gombra kattintva lekérhet egy mintaadatkészletet az ellenőrzéshez.

A másolási tevékenység által forrásként és fogadóként támogatott adattárak listáját a támogatott adattárakban találja.