Delen via


Kopiëren van Microsoft 365 (Office 365) naar Azure met behulp van Azure Data Factory of Synapse Analytics

VAN TOEPASSING OP: Azure Data Factory Azure Synapse Analytics

Tip

Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .

Azure Data Factory- en Synapse Analytics-pijplijnen kunnen worden geïntegreerd met Microsoft Graph Data Connect, zodat u de uitgebreide organisatiegegevens in uw Microsoft 365-tenant (Office 365) op een schaalbare manier in Azure kunt plaatsen en analysetoepassingen kunt bouwen en inzichten kunt extraheren op basis van deze waardevolle gegevensassets. Integratie met Privileged Access Management biedt beveiligd toegangsbeheer voor de waardevolle gecureerde gegevens in Microsoft 365 (Office 365). Raadpleeg deze koppeling voor een overzicht van Microsoft Graph-gegevensverbinding.

In dit artikel wordt beschreven hoe u de kopieeractiviteit gebruikt om gegevens te kopiëren en Gegevensstroom om gegevens van Microsoft 365 (Office 365) te transformeren. Lees het overzicht van de kopieeractiviteit voor een inleiding tot het kopiëren van gegevens. Lees het overzicht van toewijzingsgegevensstromen voor een inleiding tot het transformeren van gegevens.

Notitie

Microsoft 365 Gegevensstroom-connector is momenteel beschikbaar als preview-versie. Als u wilt deelnemen, gebruikt u dit aanmeldingsformulier: M365 + Analytics Preview.

Ondersteunde mogelijkheden

Deze Microsoft 365-connector (Office 365) wordt ondersteund voor de volgende mogelijkheden:

Ondersteunde mogelijkheden IR
Copy-activiteit (bron/-) (1)
Toewijzingsgegevensstroom (bron/-) (1)

(1) Azure Integration Runtime (2) Zelf-hostende Integration Runtime

Met de ADF Microsoft 365-connector (Office 365) en Microsoft Graph Data Connect kunnen verschillende typen gegevenssets worden opgenomen in postvakken met exchange-e-mail, waaronder adresboekcontactpersonen, agendagebeurtenissen, e-mailberichten, gebruikersgegevens, postvakinstellingen enzovoort. Raadpleeg hier de volledige lijst met beschikbare gegevenssets.

Voorlopig kunt u binnen één kopieeractiviteit en gegevensstroom alleen gegevens van Microsoft 365 (Office 365) opnemen in Azure Blob Storage, Azure Data Lake Storage Gen1 en Azure Data Lake Storage Gen2 in JSON-indeling (type setOfObjects). Wanneer u kopieert naar Azure Blob Storage, is de uitvoer een blob met JSON-tekst. Als u Microsoft 365 (Office 365) wilt laden in andere typen gegevensarchieven of in andere indelingen, kunt u de eerste kopieeractiviteit of gegevensstroom koppelen aan een volgende activiteit om gegevens verder te laden in een van de ondersteunde ADF-doelarchieven (raadpleeg de kolom Ondersteund als een sink in de tabel Ondersteunde gegevensarchieven en -indelingen).

Belangrijk

  • Het Azure-abonnement met de data factory of Synapse-werkruimte en het sinkgegevensarchief moeten zich onder dezelfde Microsoft Entra-tenant bevinden als de Microsoft 365-tenant (Office 365).
  • Zorg ervoor dat de Azure Integration Runtime-regio die wordt gebruikt voor kopieeractiviteit en de bestemming zich in dezelfde regio bevindt als waar het postvak van gebruikers van de Microsoft 365-tenant (Office 365) zich bevindt. Raadpleeg hier om te begrijpen hoe de Azure IR-locatie wordt bepaald. Raadpleeg hier de tabel voor de lijst met ondersteunde Office-regio's en bijbehorende Azure-regio's.
  • Service-principalverificatie is het enige verificatiemechanisme dat wordt ondersteund voor Azure Blob Storage, Azure Data Lake Storage Gen1 en Azure Data Lake Storage Gen2 als doelopslag.

Notitie

Gebruik Azure Integration Runtime in gekoppelde bron- en sinkservices. De zelf-hostende Integration Runtime en de beheerde integratieruntime voor virtuele netwerken worden niet ondersteund.

Vereisten

Als u gegevens van Microsoft 365 (Office 365) naar Azure wilt kopiëren en transformeren, moet u de volgende vereiste stappen uitvoeren:

  • De tenantbeheerder van Microsoft 365 (Office 365) moet de instapacties voltooien, zoals hier wordt beschreven.
  • Maak en configureer een Microsoft Entra-webtoepassing in Microsoft Entra-id. Zie Een Microsoft Entra-toepassing maken voor instructies.
  • Noteer de volgende waarden die u gebruikt om de gekoppelde service voor Microsoft 365 (Office 365) te definiëren:
  • Voeg de gebruikersidentiteit toe die de aanvraag voor gegevenstoegang indient als eigenaar van de Microsoft Entra-webtoepassing (van de eigenaar van de Microsoft Entra-webtoepassingsinstellingen > > toevoegen > ).
    • De gebruikersidentiteit moet zich in de Microsoft 365-organisatie (Office 365) bevinden waaruit u gegevens ontvangt en mag geen gastgebruiker zijn.

Nieuwe aanvragen voor gegevenstoegang goedkeuren

Als dit de eerste keer is dat u gegevens aanvraagt voor deze context (een combinatie van welke gegevenstabel toegang heeft, in welk doelaccount de gegevens worden geladen en in welke gebruikersidentiteit de aanvraag voor gegevenstoegang wordt ingediend), ziet u de status van de kopieeractiviteit als 'Wordt uitgevoerd' en alleen wanneer u klikt op de koppeling Details onder Acties ziet u de status 'RequestingConsent'. Een lid van de groep fiatteurs voor gegevenstoegang moet de aanvraag goedkeuren in Privileged Access Management voordat de gegevensextractie kan worden voortgezet.

Raadpleeg hier hoe de fiatteur de aanvraag voor gegevenstoegang kan goedkeuren.

Aan de slag

Tip

Zie het artikel Gegevens laden uit Microsoft 365 (Office 365) voor een overzicht van het gebruik van de Microsoft 365-connector (Office 365).

U kunt een pijplijn maken met de kopieeractiviteit en gegevensstroom met behulp van een van de volgende hulpprogramma's of SDK's. Selecteer een koppeling om naar een zelfstudie te gaan met stapsgewijze instructies voor het maken van een pijplijn met een kopieeractiviteit.

Een gekoppelde service maken met Microsoft 365 (Office 365) met behulp van de gebruikersinterface

Gebruik de volgende stappen om een gekoppelde service te maken voor Microsoft 365 (Office 365) in de gebruikersinterface van Azure Portal.

  1. Blader naar het tabblad Beheren in uw Azure Data Factory- of Synapse-werkruimte en selecteer Gekoppelde services en klik vervolgens op Nieuw:

  2. Zoek naar Microsoft 365 (Office 365) en selecteer de Microsoft 365-connector (Office 365).

    Schermopname van de Microsoft 365-connector (Office 365).

  3. Configureer de servicedetails, test de verbinding en maak de nieuwe gekoppelde service.

    Schermopname van de configuratie van gekoppelde services voor Microsoft 365 (Office 365).

Configuratiedetails van connector

De volgende secties bevatten details over eigenschappen die worden gebruikt voor het definiëren van Data Factory-entiteiten die specifiek zijn voor De Microsoft 365-connector (Office 365).

Eigenschappen van gekoppelde service

De volgende eigenschappen worden ondersteund voor gekoppelde Microsoft 365-service (Office 365):

Eigenschappen Beschrijving Vereist
type De eigenschap type moet worden ingesteld op: Office365 Ja
office365TenantId Azure-tenant-id waartoe het Microsoft 365-account (Office 365) behoort. Ja
servicePrincipalTenantId Geef de tenantgegevens op waaronder uw Microsoft Entra-webtoepassing zich bevindt. Ja
servicePrincipalId Geef de client-id van de toepassing op. Ja
servicePrincipalKey Geef de sleutel van de toepassing op. Markeer dit veld als securestring om het veilig op te slaan. Ja
connectVia De Integration Runtime die moet worden gebruikt om verbinding te maken met het gegevensarchief. Als dit niet is opgegeven, wordt de standaard Azure Integration Runtime gebruikt. Nr.

Notitie

Het verschil tussen office365TenantId en servicePrincipalTenantId en de bijbehorende waarde:

  • Als u een bedrijfsontwikkelaar bent die een toepassing ontwikkelt op basis van Microsoft 365-gegevens (Office 365) voor het gebruik van uw eigen organisatie, moet u dezelfde tenant-id opgeven voor beide eigenschappen, wat de Microsoft Entra-tenant-id van uw organisatie is.
  • Als u een ISV-ontwikkelaar bent die een toepassing ontwikkelt voor uw klanten, is office365TenantId de Microsoft Entra-tenant-id van uw klant (toepassingsinstallatieprogramma) en servicePrincipalTenantId van uw bedrijf de Microsoft Entra-tenant-id van uw bedrijf.

Voorbeeld:

{
    "name": "Office365LinkedService",
    "properties": {
        "type": "Office365",
        "typeProperties": {
            "office365TenantId": "<Microsoft 365 (Office 365) tenant id>",
            "servicePrincipalTenantId": "<AAD app service principal tenant id>",
            "servicePrincipalId": "<AAD app service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<AAD app service principal key>"
            }
        }
    }
}

Eigenschappen van gegevensset

Zie het artikel gegevenssets voor een volledige lijst met secties en eigenschappen die beschikbaar zijn voor het definiëren van gegevenssets . Deze sectie bevat een lijst met eigenschappen die worden ondersteund door de Gegevensset van Microsoft 365 (Office 365).

Als u gegevens wilt kopiëren van Microsoft 365 (Office 365), worden de volgende eigenschappen ondersteund:

Eigenschappen Beschrijving Vereist
type De typeeigenschap van de gegevensset moet worden ingesteld op: Office365Table Ja
tableName Naam van de gegevensset die moet worden geëxtraheerd uit Microsoft 365 (Office 365). Raadpleeg hier de lijst met Microsoft 365-gegevenssets (Office 365) die beschikbaar zijn voor extractie. Ja

Als u de gegevensset insteltdateFilterColumn, startTimeendTimeen userScopeFilterUri in de gegevensset, wordt deze nog steeds ondersteund, terwijl u wordt aangeraden het nieuwe model in de activiteitsbron in de toekomst te gebruiken.

Voorbeeld

{
    "name": "DS_May2019_O365_Message",
    "properties": {
        "type": "Office365Table",
        "linkedServiceName": {
            "referenceName": "<Microsoft 365 (Office 365) linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "tableName": "BasicDataSet_v0.Event_v1"
        }
    }
}

Eigenschappen van de kopieeractiviteit

Zie het artikel Pijplijnen voor een volledige lijst met secties en eigenschappen die beschikbaar zijn voor het definiëren van activiteiten. Deze sectie bevat een lijst met eigenschappen die worden ondersteund door de Bron van Microsoft 365 (Office 365).

Microsoft 365 (Office 365) als bron

Als u gegevens wilt kopiëren van Microsoft 365 (Office 365), worden de volgende eigenschappen ondersteund in de sectie bron van kopieeractiviteit:

Eigenschappen Beschrijving Vereist
type De typeeigenschap van de bron van de kopieeractiviteit moet zijn ingesteld op: Office365Source Ja
allowedGroups Groepsselectiepredicaat. Gebruik deze eigenschap om maximaal 10 gebruikersgroepen te selecteren voor wie de gegevens worden opgehaald. Als er geen groepen zijn opgegeven, worden gegevens geretourneerd voor de hele organisatie. Nee
userScopeFilterUri Wanneer allowedGroups de eigenschap niet is opgegeven, kunt u een predicaatexpressie gebruiken die wordt toegepast op de hele tenant om de specifieke rijen te filteren die moeten worden geëxtraheerd uit Microsoft 365 (Office 365). De predicaatnotatie moet overeenkomen met de queryindeling van Microsoft Graph-API's, bijvoorbeeld https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'. Nee
dateFilterColumn Naam van de kolom DateTime-filter. Gebruik deze eigenschap om het tijdsbereik te beperken waarvoor Microsoft 365-gegevens (Office 365) worden geëxtraheerd. Ja als de gegevensset een of meer datum/tijd-kolommen heeft. Raadpleeg hier de lijst met gegevenssets waarvoor dit Datum/tijd-filter is vereist.
startTime Begindatum/datum/tijd-waarde waarop u wilt filteren. Ja als dateFilterColumn is opgegeven
endTime Einddatum/tijd-waarde waarop u wilt filteren. Ja als dateFilterColumn is opgegeven
outputColumns Matrix van de kolommen die moeten worden gekopieerd naar sink. Nee

Voorbeeld:

"activities": [
    {
        "name": "CopyFromO365ToBlob",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Microsoft 365 (Office 365) input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "Office365Source",
                "dateFilterColumn": "CreatedDateTime",
                "startTime": "2019-04-28T16:00:00.000Z",
                "endTime": "2019-05-05T16:00:00.000Z",
                "userScopeFilterUri": "https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'",
                "outputColumns": [
                    {
                        "name": "Id"
                    },
                    {
                        "name": "CreatedDateTime"
                    },
                    {
                        "name": "LastModifiedDateTime"
                    },
                    {
                        "name": "ChangeKey"
                    },
                    {
                        "name": "Categories"
                    },
                    {
                        "name": "OriginalStartTimeZone"
                    },
                    {
                        "name": "OriginalEndTimeZone"
                    },
                    {
                        "name": "ResponseStatus"
                    },
                    {
                        "name": "iCalUId"
                    },
                    {
                        "name": "ReminderMinutesBeforeStart"
                    },
                    {
                        "name": "IsReminderOn"
                    },
                    {
                        "name": "HasAttachments"
                    },
                    {
                        "name": "Subject"
                    },
                    {
                        "name": "Body"
                    },
                    {
                        "name": "Importance"
                    },
                    {
                        "name": "Sensitivity"
                    },
                    {
                        "name": "Start"
                    },
                    {
                        "name": "End"
                    },
                    {
                        "name": "Location"
                    },
                    {
                        "name": "IsAllDay"
                    },
                    {
                        "name": "IsCancelled"
                    },
                    {
                        "name": "IsOrganizer"
                    },
                    {
                        "name": "Recurrence"
                    },
                    {
                        "name": "ResponseRequested"
                    },
                    {
                        "name": "ShowAs"
                    },
                    {
                        "name": "Type"
                    },
                    {
                        "name": "Attendees"
                    },
                    {
                        "name": "Organizer"
                    },
                    {
                        "name": "WebLink"
                    },
                    {
                        "name": "Attachments"
                    },
                    {
                        "name": "BodyPreview"
                    },
                    {
                        "name": "Locations"
                    },
                    {
                        "name": "OnlineMeetingUrl"
                    },
                    {
                        "name": "OriginalStart"
                    },
                    {
                        "name": "SeriesMasterId"
                    }
                ]
            },
            "sink": {
                "type": "BlobSink"
            }
        }
    }
]

Zie ondersteunde gegevensarchieven voor een lijst met gegevensarchieven die worden ondersteund als bronnen en sinks door de kopieeractiviteit.