Länkade tjänster i Azure Data Factory och Azure Synapse Analytics

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Den här artikeln beskriver vad länkade tjänster är, hur de definieras i JSON-format och hur de används i Azure Data Factory och Azure Synapse Analytics.

Mer information finns i introduktionsartikeln för Azure Data Factory eller Azure Synapse.

Översikt

Azure Data Factory och Azure Synapse Analytics kan ha en eller flera pipelines. En pipeline är en logisk gruppering av aktiviteter som tillsammans utför en uppgift. Aktiviteterna i en pipeline definierar åtgärder som ska utföras på dina data. Du kan till exempel använda en kopieringsaktivitet för att kopiera data från SQL Server till Azure Blob Storage. Sedan kan du använda en Hive-aktivitet som kör ett Hive-skript i ett Azure HDInsight-kluster för att bearbeta data från Blob Storage för att producera utdata. Till sist använder du kanske en andra kopieringsaktivitet för att kopiera utdata till Azure Synapse Analytics som Business Intelligence-rapporteringslösningar har skapats på. Mer information om pipelines och aktiviteter finns i Pipelines och aktiviteter.

Nu är en datauppsättning en namngiven vy över data som bara pekar på eller refererar till de data som du vill använda i dina aktiviteter som indata och utdata.

Innan du skapar en datauppsättning måste du skapa en länkad tjänst för att länka datalagret till Data Factory eller Synapse-arbetsytan. Länkade tjänster liknar anslutningssträng, som definierar den anslutningsinformation som krävs för att tjänsten ska kunna ansluta till externa resurser. Tänk på det så här: datauppsättningen representerar strukturen för data i de länkade datalager och den länkade tjänsten definierar anslutningen till datakällan. En länkad Azure Storage-tjänst länkar till exempel ett lagringskonto till tjänsten. En Azure Blob-datauppsättning representerar blobcontainern och mappen i det Azure Storage-konto som innehåller de indatablobar som ska bearbetas.

Här är ett exempelscenario. Om du vill kopiera data från Blob Storage till en SQL Database skapar du två länkade tjänster: Azure Storage och Azure SQL Database. Skapa sedan två datauppsättningar: Azure Blob-datauppsättning (som refererar till den länkade Azure Storage-tjänsten) och Azure SQL Table-datauppsättningen (som refererar till den länkade Azure SQL Database-tjänsten). Azure Storage- och Azure SQL Database-länkade tjänster innehåller anslutningssträng som tjänsten använder vid körning för att ansluta till din Azure Storage respektive Azure SQL Database. Azure Blob-datauppsättningen anger blobcontainern och blobmappen som innehåller indatablobbarna i bloblagringen. Azure SQL Table-datauppsättningen anger SQL-tabellen i din SQL Database som data ska kopieras till.

Följande diagram visar relationerna mellan pipeline, aktivitet, datauppsättning och länkad tjänst i tjänsten:

Relationship between pipeline, activity, dataset, linked services

Länkad tjänst med användargränssnitt

Om du vill skapa en ny länkad tjänst i Azure Data Factory Studio väljer du fliken Hantera och sedan länkade tjänster, där du kan se alla befintliga länkade tjänster som du har definierat. Välj Ny för att skapa en ny länkad tjänst.

Shows the Azure Data Factory studio Manage tab with linked services and the New button highlighted.

När du har valt Ny för att skapa en ny länkad tjänst kan du välja någon av de anslutningsappar som stöds och konfigurera dess information i enlighet med detta. Därefter kan du använda den länkade tjänsten i alla pipelines som du skapar.

Shows the new linked service window.

Länkad tjänst-JSON

En länkad tjänst definieras i JSON-format på följande sätt:

{
    "name": "<Name of the linked service>",
    "properties": {
        "type": "<Type of the linked service>",
        "typeProperties": {
              "<data store or compute-specific type properties>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

I följande tabell beskrivs egenskaper i ovanstående JSON:

Property Beskrivning Obligatoriskt
name Namnet på den länkade tjänsten. Se Namngivningsregler. Ja
type Typ av länkad tjänst. Till exempel: AzureBlobStorage (datalager) eller AzureBatch (beräkning). Se beskrivningen för typeProperties. Ja
typeProperties Typegenskaperna är olika för varje datalager eller beräkning.

Information om vilka typer av datalager som stöds och deras typegenskaper finns i artikeln översikt över anslutningsappen. Gå till artikeln om datalageranslutningsappen om du vill veta mer om typegenskaper som är specifika för ett datalager.

Information om vilka beräkningstyper som stöds och deras typegenskaper finns i Beräkningslänkade tjänster.
Ja
connectVia Integration Runtime som ska användas för att ansluta till datalagret. Du kan använda Azure Integration Runtime eller lokalt installerad integrationskörning (om ditt datalager finns i ett privat nätverk). Om den inte anges använder den standardkörningen för Azure-integrering. Nej

Exempel på länkad tjänst

Följande länkade tjänst är en länkad Azure Blob Storage-tjänst. Observera att typen är inställd på Azure Blob Storage. Typegenskaperna för den länkade Azure Blob Storage-tjänsten innehåller en anslutningssträng. Tjänsten använder den här anslutningssträng för att ansluta till datalagret vid körning.

{
    "name": "AzureBlobStorageLinkedService",
    "properties": {
        "type": "AzureBlobStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Skapa länkade tjänster

Länkade tjänster kan skapas i Azure Data Factory UX via hanteringshubben och alla aktiviteter, datauppsättningar eller dataflöden som refererar till dem.

Du kan skapa länkade tjänster med något av dessa verktyg eller SDK:er: .NET API, PowerShell, REST API, Azure Resource Manager-mall och Azure-portalen.

När du skapar en länkad tjänst behöver användaren lämplig auktorisering till den avsedda tjänsten. Om tillräcklig åtkomst inte beviljas kan användaren inte se de tillgängliga resurserna och måste använda alternativet för manuell inmatning.

Länkade tjänster för datalager

Du hittar listan över datalager som stöds i översiktsartikeln för anslutningsappen. Klicka på ett datalager för att lära dig vilka anslutningsegenskaper som stöds.

Länkade tjänster för Compute

Referensberäkningsmiljöer som stöds för information om olika beräkningsmiljöer som du kan ansluta till från din tjänst samt de olika konfigurationerna.

I följande självstudier finns stegvisa instruktioner för hur du skapar pipelines och datauppsättningar med hjälp av något av dessa verktyg eller SDK:er.