Kopírování dat z Greenplum pomocí Azure Data Factory nebo Synapse Analytics

PLATÍ PRO: analýza Azure Data Factory Azure Synapse

Tento článek popisuje, jak pomocí aktivity kopírování v kanálu Azure Data Factory nebo Synapse Analytics kopírovat data z Greenplumu. Vychází z článku s přehledem aktivity kopírování , který představuje obecný přehled aktivity kopírování.

Podporované funkce

Tento konektor Greenplum je podporovaný pro následující funkce:

Podporované funkce IR
aktivita Copy (zdroj/-) ① ②
Aktivita vyhledávání ① ②

(1) Prostředí Azure Integration Runtime (2) Místní prostředí Integration Runtime

Seznam úložišť dat podporovaných jako zdroje nebo jímky aktivitou kopírování najdete v tabulce Podporované úložiště dat .

Služba poskytuje integrovaný ovladač, který umožňuje připojení, a proto nemusíte ručně instalovat žádné ovladače pomocí tohoto konektoru.

Požadavky

Pokud se vaše úložiště dat nachází v místní síti, virtuální síti Azure nebo Amazon Virtual Private Cloud, musíte nakonfigurovat místní prostředí Integration Runtime pro připojení k němu.

Pokud je vaše úložiště dat spravovanou cloudovou datovou službou, můžete použít azure Integration Runtime. Pokud je přístup omezený na IP adresy schválené v pravidlech brány firewall, můžete do seznamu povolených přidat IP adresy azure Integration Runtime.

Ke přístupu k místní síti bez instalace a konfigurace místního prostředí Integration Runtime můžete také použít funkci prostředí Integration Runtime spravované virtuální sítě v Azure Data Factory.

Další informace o mechanismech zabezpečení sítě a možnostech podporovaných službou Data Factory najdete v tématu Strategie přístupu k datům.

Začínáme

K provedení aktivita Copy s kanálem můžete použít jeden z následujících nástrojů nebo sad SDK:

Vytvoření propojené služby do Greenplum pomocí uživatelského rozhraní

Pomocí následujících kroků vytvořte propojenou službu s Greenplum v uživatelském rozhraní Azure Portal.

  1. Přejděte na kartu Spravovat v pracovním prostoru Azure Data Factory nebo Synapse a vyberte Propojené služby a potom klikněte na Nový:

  2. Vyhledejte Greenplum a vyberte konektor Greenplum.

    Snímek obrazovky s konektorem Greenplum

  3. Nakonfigurujte podrobnosti o službě, otestujte připojení a vytvořte novou propojenou službu.

    Snímek obrazovky s konfigurací propojené služby pro Greenplum

Podrobnosti konfigurace konektoru

Následující části obsahují podrobnosti o vlastnostech, které slouží k definování entit služby Data Factory specifických pro konektor Greenplum.

Vlastnosti propojené služby

Pro propojenou službu Greenplum jsou podporovány následující vlastnosti:

Vlastnost Popis Povinné
typ Vlastnost typu musí být nastavena na: Greenplum Yes
připojovací řetězec Připojovací řetězec ODBC pro připojení k Greenplumu.
Můžete také zadat heslo do Azure Key Vault a vytáhnout pwd konfiguraci z připojovacího řetězce. Další podrobnosti najdete v následujících ukázkách a přihlašovacích údajích pro Store v Azure Key Vault článku.
Yes
connectVia Integration Runtime, který se má použít pro připojení k úložišti dat. Další informace najdete v části Požadavky . Pokud není zadaný, použije výchozí Integration Runtime Azure. No

Příklad:

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Příklad: Uložení hesla v Azure Key Vault

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Vlastnosti datové sady

Úplný seznam oddílů a vlastností dostupných pro definování datových sad najdete v článku o datových sadách . Tato část obsahuje seznam vlastností podporovaných datovou sadou Greenplum.

Pokud chcete kopírovat data z Greenplumu, nastavte vlastnost typu datové sady na GreenplumTable. Podporují se následující vlastnosti:

Vlastnost Popis Povinné
typ Vlastnost typu datové sady musí být nastavena na: GreenplumTable Yes
schema Název schématu. Ne (pokud je zadán dotaz ve zdroji aktivity)
tabulka Název tabulky Ne (pokud je zadán dotaz ve zdroji aktivity)
tableName Název tabulky se schématem Tato vlastnost je podporována pro zpětnou kompatibilitu. Používejte schema a table pro nové úlohy. Ne (pokud je zadán dotaz ve zdroji aktivity)

Příklad

{
    "name": "GreenplumDataset",
    "properties": {
        "type": "GreenplumTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Greenplum linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Vlastnosti aktivity kopírování

Úplný seznam oddílů a vlastností dostupných pro definování aktivit najdete v článku Pipelines . Tato část obsahuje seznam vlastností podporovaných zdrojem Greenplum.

GreenplumSource jako zdroj

Pokud chcete kopírovat data z Greenplumu, nastavte zdrojový typ v aktivitě kopírování na GreenplumSource. Ve zdroji aktivity kopírování jsou podporovány následující vlastnosti:

Vlastnost Popis Povinné
typ Vlastnost typu zdroje aktivity kopírování musí být nastavena na: GreenplumSource Yes
query Ke čtení dat použijte vlastní dotaz SQL. Příklad: "SELECT * FROM MyTable". Ne (pokud je v datové sadě zadán název tabulky)

Příklad:

"activities":[
    {
        "name": "CopyFromGreenplum",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Greenplum input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GreenplumSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Vlastnosti aktivity vyhledávání

Pokud chcete zjistit podrobnosti o vlastnostech, zkontrolujte aktivitu vyhledávání.

Další kroky

Seznam úložišť dat podporovaných jako zdroje a jímky aktivitou kopírování najdete v podporovaných úložištích dat.