Połączone usługi w usłudze Azure Data Factory i Azure Synapse Analytics

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Napiwek

Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !

W tym artykule opisano połączone usługi, sposób ich definiowania w formacie JSON oraz sposób ich użycia w usługach Azure Data Factory i Azure Synapse Analytics.

Aby dowiedzieć się więcej, przeczytaj artykuł wprowadzający dotyczący usługi Azure Data Factory lub Azure Synapse.

Omówienie

Usługi Azure Data Factory i Azure Synapse Analytics mogą mieć jeden potok lub więcej. Potok to logiczne grupowanie działań, które razem wykonują zadanie. Działania w potoku określają akcje do wykonania na danych. Na przykład możesz użyć działania kopiowania, aby skopiować dane z programu SQL Server do usługi Azure Blob Storage. Następnie możesz użyć działania programu Hive, które uruchamia skrypt Programu Hive w klastrze usługi Azure HDInsight, aby przetwarzać dane z usługi Blob Storage w celu generowania danych wyjściowych. Na koniec można użyć drugiego działania kopiowania w celu skopiowania danych wyjściowych do usługi Azure Synapse Analytics, na podstawie której tworzone są rozwiązania raportowania analizy biznesowej (BI). Aby uzyskać więcej informacji na temat potoków i działań, zobacz Potoki i działania.

Teraz zestaw danych jest nazwanym widokiem danych, który po prostu wskazuje lub odwołuje się do danych, które mają być używane w działaniach jako dane wejściowe i wyjściowe.

Przed utworzeniem zestawu danych należy utworzyć połączoną usługę, aby połączyć magazyn danych z usługą Data Factory lub obszarem roboczym usługi Synapse. Połączone usługi są podobne do parametry połączenia, które definiują informacje o połączeniu wymagane do nawiązania połączenia z zasobami zewnętrznymi. Pomyśl o tym w ten sposób: zestaw danych reprezentuje strukturę danych w połączonych magazynach danych, a połączona usługa definiuje połączenie ze źródłem danych. Na przykład połączona usługa Azure Storage łączy konto magazynu z usługą. Zestaw danych obiektów blob platformy Azure reprezentuje kontener obiektów blob i folder w ramach tego konta usługi Azure Storage, który zawiera wejściowe obiekty blob do przetworzenia.

Oto przykładowy scenariusz. Aby skopiować dane z usługi Blob Storage do usługi SQL Database, należy utworzyć dwie połączone usługi: Azure Storage i Azure SQL Database. Następnie utwórz dwa zestawy danych: zestaw danych obiektów blob platformy Azure (odwołujący się do połączonej usługi Azure Storage) i zestaw danych tabel Azure SQL (który odnosi się do połączonej usługi Azure SQL Database). Połączone usługi Azure Storage i Azure SQL Database zawierają parametry połączenia, których usługa używa w czasie wykonywania do łączenia się z usługami Azure Storage i Azure SQL Database. Zestaw danych obiektów blob platformy Azure określa kontener obiektów blob i folder obiektów blob, który zawiera wejściowe obiekty blob w magazynie obiektów blob. Zestaw danych azure SQL Table określa tabelę SQL w usłudze SQL Database, do której mają zostać skopiowane dane.

Na poniższym diagramie przedstawiono relacje między potokiem, działaniem, zestawem danych i połączoną usługą w usłudze:

Relationship between pipeline, activity, dataset, linked services

Połączona usługa z interfejsem użytkownika

Aby utworzyć nową połączoną usługę w narzędziu Azure Data Factory Studio, wybierz kartę Zarządzanie , a następnie połączone usługi, w których można zobaczyć wszystkie istniejące zdefiniowane połączone usługi. Wybierz pozycję Nowy , aby utworzyć nową połączoną usługę.

Shows the Azure Data Factory studio Manage tab with linked services and the New button highlighted.

Po wybraniu pozycji Nowy w celu utworzenia nowej połączonej usługi będzie można wybrać dowolny z obsługiwanych łączników i odpowiednio skonfigurować jego szczegóły. Następnie możesz użyć połączonej usługi w dowolnych utworzonych potokach.

Shows the new linked service window.

Kod JSON połączonej usługi

Połączona usługa jest definiowana w formacie JSON w następujący sposób:

{
    "name": "<Name of the linked service>",
    "properties": {
        "type": "<Type of the linked service>",
        "typeProperties": {
              "<data store or compute-specific type properties>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

W poniższej tabeli opisano właściwości powyższego kodu JSON:

Właściwości Opis Wymagania
name Nazwa połączonej usługi. Zobacz Reguły nazewnictwa. Tak
type Typ połączonej usługi. Na przykład: AzureBlobStorage (magazyn danych) lub AzureBatch (obliczenia). Zobacz opis właściwości typeProperties. Tak
typeProperties Właściwości typu są różne dla każdego magazynu danych lub obliczeń.

Aby uzyskać informacje o obsługiwanych typach magazynu danych i ich właściwościach typów, zobacz artykuł Omówienie łącznika. Przejdź do artykułu łącznika magazynu danych, aby dowiedzieć się więcej o właściwościach typu specyficznych dla magazynu danych.

Aby uzyskać informacje o obsługiwanych typach obliczeniowych i ich właściwościach typów, zobacz Compute linked services (Połączone usługi obliczeniowe).
Tak
connectVia Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Możesz użyć środowiska Azure Integration Runtime lub własnego środowiska Integration Runtime (jeśli magazyn danych znajduje się w sieci prywatnej). Jeśli nie zostanie określony, używa domyślnego środowiska Azure Integration Runtime. Nie.

Przykład połączonej usługi

Następująca połączona usługa jest połączoną usługą Azure Blob Storage. Zwróć uwagę, że typ jest ustawiony na azure Blob Storage. Właściwości typu połączonej usługi Azure Blob Storage obejmują parametry połączenia. Usługa używa tego parametry połączenia do nawiązywania połączenia z magazynem danych w czasie wykonywania.

{
    "name": "AzureBlobStorageLinkedService",
    "properties": {
        "type": "AzureBlobStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Tworzenie połączonych usług

Połączone usługi można tworzyć w środowisku użytkownika usługi Azure Data Factory za pośrednictwem centrum zarządzania i wszelkich działań, zestawów danych lub przepływów danych odwołujących się do nich.

Połączone usługi można tworzyć przy użyciu jednego z następujących narzędzi lub zestawów SDK: interfejsu API platformy .NET, programu PowerShell, interfejsu API REST, szablonu usługi Azure Resource Manager i witryny Azure Portal.

Podczas tworzenia połączonej usługi użytkownik musi mieć odpowiednią autoryzację do wyznaczonej usługi. Jeśli nie udzielono wystarczającego dostępu, użytkownik nie będzie mógł wyświetlić dostępnych zasobów i będzie musiał użyć opcji ręcznego wprowadzania.

Połączone usługi magazynu danych

Listę obsługiwanych magazynów danych można znaleźć w artykule Omówienie łącznika. Kliknij magazyn danych, aby poznać obsługiwane właściwości połączenia.

Usługi połączone usługi Compute

Zapoznaj się ze środowiskami obliczeniowymi obsługiwanymi w celu uzyskania szczegółowych informacji o różnych środowiskach obliczeniowych, z którymi można nawiązać połączenie z usługi, a także z różnymi konfiguracjami.

Zapoznaj się z poniższymi samouczkami, aby uzyskać instrukcje krok po kroku dotyczące tworzenia potoków i zestawów danych przy użyciu jednego z tych narzędzi lub zestawów SDK.