Propojené služby ve službě Azure Data Factory a Azure Synapse Analytics

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Tento článek popisuje, co jsou propojené služby, jak jsou definované ve formátu JSON a jak se používají ve službě Azure Data Factory a Azure Synapse Analytics.

Další informace najdete v úvodním článku pro Azure Data Factory nebo Azure Synapse.

Přehled

Služby Azure Data Factory a Azure Synapse Analytics mohou mít jeden nebo více kanálů. Kanál je logické seskupení aktivit, které společně provádějí úlohu. Aktivity v kanálu definují akce, které se mají s daty provádět. Můžete například použít aktivitu kopírování ke kopírování dat z SQL Serveru do úložiště objektů blob v Azure. Pak můžete použít aktivitu Hive, která spouští skript Hive v clusteru Azure HDInsight ke zpracování dat z úložiště objektů blob k vytvoření výstupních dat. Nakonec můžete použít druhou aktivitu kopírování, která zkopíruje výstupní data do služby Azure Synapse Analytics. Na té jsou postavena řešení tvorby sestav business intelligence (BI). Další informace o kanálech a aktivitách najdete v tématu Kanály a aktivity.

Datová sada je pojmenované zobrazení dat, které jednoduše odkazuje na data, která chcete použít ve svých aktivitách jako vstupy a výstupy.

Než vytvoříte datovou sadu, musíte vytvořit propojenou službu , která propojí vaše úložiště dat s pracovním prostorem Data Factory nebo Synapse. Propojené služby jsou podobně jako připojovací řetězec, které definují informace o připojení potřebné pro připojení služby k externím prostředkům. Představte si to tímto způsobem: datová sada představuje strukturu dat v propojených úložištích dat a propojená služba definuje připojení ke zdroji dat. Propojená služba Azure Storage například propojila účet úložiště se službou. Datová sada Azure Blob představuje kontejner objektů blob a složku v rámci účtu služby Azure Storage, který obsahuje vstupní objekty blob, které se mají zpracovat.

Tady je ukázkový scénář. Pokud chcete kopírovat data z úložiště objektů blob do služby SQL Database, vytvoříte dvě propojené služby: Azure Storage a Azure SQL Database. Pak vytvořte dvě datové sady: datovou sadu objektů blob Azure (která odkazuje na propojenou službu Azure Storage) a datovou sadu tabulky Azure SQL (která odkazuje na propojenou službu Azure SQL Database). Propojené služby Azure Storage a Azure SQL Database obsahují připojovací řetězec, které služba používá za běhu pro připojení ke službě Azure Storage a Azure SQL Database. Datová sada Azure Blob určuje kontejner objektů blob a složku objektů blob, která obsahuje vstupní objekty blob ve vašem úložišti objektů blob. Datová sada tabulky Azure SQL určuje tabulku SQL ve službě SQL Database, do které se mají data zkopírovat.

Následující diagram znázorňuje vztahy mezi kanálem, aktivitou, datovou sadou a propojenou službou ve službě:

Relationship between pipeline, activity, dataset, linked services

Propojená služba s uživatelským rozhraním

Pokud chcete vytvořit novou propojenou službu v nástroji Azure Data Factory Studio, vyberte kartu Spravovat a pak propojené služby, kde uvidíte všechny existující propojené služby, které jste definovali. Výběrem možnosti Nový vytvoříte novou propojenou službu.

Shows the Azure Data Factory studio Manage tab with linked services and the New button highlighted.

Po výběru možnosti Nový vytvořit novou propojenou službu budete moct zvolit kterýkoli z podporovaných konektorů a odpovídajícím způsobem nakonfigurovat jeho podrobnosti. Potom můžete propojenou službu použít v libovolných kanálech, které vytvoříte.

Shows the new linked service window.

JSON propojené služby

Propojená služba je definována ve formátu JSON následujícím způsobem:

{
    "name": "<Name of the linked service>",
    "properties": {
        "type": "<Type of the linked service>",
        "typeProperties": {
              "<data store or compute-specific type properties>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Následující tabulka popisuje vlastnosti ve výše uvedeném formátu JSON:

Vlastnost Popis Povinní účastníci
name Název propojené služby. Viz pravidla pojmenování. Ano
type Typ propojené služby Příklad: AzureBlobStorage (úložiště dat) nebo AzureBatch (compute). Podívejte se na popis pro typeProperties. Ano
typeProperties Vlastnosti typu se liší pro každé úložiště dat nebo výpočetní prostředky.

Podporované typy úložiště dat a jejich vlastnosti typu najdete v článku s přehledem konektoru. V článku o konektoru úložiště dat se dozvíte o vlastnostech typů specifických pro úložiště dat.

Podporované typy výpočetních prostředků a jejich vlastnosti typu najdete v tématu Propojené služby Compute.
Ano
connectVia Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Můžete použít prostředí Azure Integration Runtime nebo místní prostředí Integration Runtime (pokud se vaše úložiště dat nachází v privátní síti). Pokud není zadaný, použije výchozí prostředí Azure Integration Runtime. No

Příklad propojené služby

Následující propojená služba je propojená služba Azure Blob Storage. Všimněte si, že typ je nastavený na Azure Blob Storage. Vlastnosti typu propojené služby Azure Blob Storage zahrnují připojovací řetězec. Služba používá tuto připojovací řetězec pro připojení k úložišti dat za běhu.

{
    "name": "AzureBlobStorageLinkedService",
    "properties": {
        "type": "AzureBlobStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Vytvoření propojených služeb

Propojené služby je možné vytvářet v uživatelském prostředí služby Azure Data Factory prostřednictvím centra pro správu a všech aktivit, datových sad nebo toků dat, které na ně odkazují.

Propojené služby můžete vytvářet pomocí jednoho z těchto nástrojů nebo sad SDK: .NET API, PowerShell, REST API, šablony Azure Resource Manageru a webu Azure Portal.

Při vytváření propojené služby potřebuje uživatel odpovídající autorizaci k určené službě. Pokud není udělen dostatečný přístup, uživatel nebude moct zobrazit dostupné prostředky a bude muset použít možnost ručního zadávání.

Propojené služby úložiště dat

Seznam podporovaných úložišť dat najdete v článku s přehledem konektoru. Kliknutím na úložiště dat se dozvíte o podporovaných vlastnostech připojení.

Propojené služby Compute

Referenční výpočetní prostředí podporovaná pro podrobnosti o různých výpočetních prostředích, ke kterému se můžete připojit z vaší služby, a také k různým konfiguracím.

Podrobné pokyny k vytváření kanálů a datových sad pomocí některého z těchto nástrojů nebo sad SDK najdete v následujících kurzech.