Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
PLATÍ PRO: Azure Data Factory
Azure Synapse Analytics
Návod
Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.
Tento článek popisuje, jak pomocí aktivity kopírování v kanálu Azure Data Factory nebo Synapse Analytics kopírovat data z Greenplumu. Vychází z článku s přehledem aktivity kopírování, který představuje obecný přehled aktivity kopírování.
Důležité
Konektor Greenplum verze 2.0 poskytuje vylepšenou nativní podporu Greenplum. Pokud ve svém řešení používáte konektor Greenplum verze 1.0, upgradujte prosím konektor Greenplum před 31. srpnem 2025. Podrobnosti o rozdílu mezi verzí 2.0 a verzí 1.0 najdete v této části .
Podporované funkce
Tento konektor Greenplum je podporovaný pro následující funkce:
Podporované funkce | infračervené záření |
---|---|
aktivita Copy (zdroj/-) | (1) (2) |
Aktivita Lookup | (1) (2) |
(1) Prostředí Azure Integration Runtime (2) Místní prostředí Integration Runtime
Seznam úložišť dat podporovaných jako zdroje nebo jímky aktivitou kopírování najdete v tabulce Podporované úložiště dat.
Služba poskytuje integrovaný ovladač, který umožňuje připojení, takže pomocí tohoto konektoru nemusíte ručně instalovat žádný ovladač.
Požadavky
Pokud se vaše úložiště dat nachází uvnitř místní sítě, virtuální sítě Azure nebo amazonového privátního cloudu, musíte nakonfigurovat místní prostředí Integration Runtime pro připojení k němu.
Pokud je vaše úložiště dat spravovanou cloudovou datovou službou, můžete použít Azure Integration Runtime. Pokud je přístup omezený na IP adresy schválené v pravidlech brány firewall, můžete do seznamu povolených přidat IP adresy prostředí Azure Integration Runtime.
K přístupu k místní síti bez nutnosti instalace a konfigurace místního prostředí Integration Runtime můžete také použít funkci Runtime integrace spravované virtuální sítě ve službě Azure Data Factory.
Další informace o mechanismech zabezpečení sítě a možnostech podporovaných službou Data Factory najdete v tématu Strategie přístupu k datům.
Začínáme
K provedení aktivita Copy s kanálem můžete použít jeden z následujících nástrojů nebo sad SDK:
- Nástroj pro kopírování dat
- Azure Portal
- Sada .NET SDK
- Sada Python SDK
- Azure PowerShell
- Rozhraní REST API
- Šablona Azure Resource Manageru
Vytvoření propojené služby do Greenplumu pomocí uživatelského rozhraní
Pomocí následujícího postupu vytvořte propojenou službu s Greenplum v uživatelském rozhraní webu Azure Portal.
Přejděte na kartu Správa v pracovním prostoru Azure Data Factory nebo Synapse a vyberte Propojené služby a pak klikněte na Nový:
Vyhledejte Greenplum a vyberte konektor Greenplum.
Nakonfigurujte podrobnosti o službě, otestujte připojení a vytvořte novou propojenou službu.
Podrobnosti konfigurace konektoru
Následující části obsahují podrobnosti o vlastnostech, které slouží k definování entit služby Data Factory specifických pro konektor Greenplum.
Vlastnosti propojené služby
Konektor Greenplum teď podporuje verzi 2.0. V této části najdete informace o upgradu verze konektoru Greenplum z verze 1.0. Podrobnosti o nemovitosti najdete v odpovídajících oddílech.
Verze 2.0
Propojená služba Greenplum podporuje následující vlastnosti při použití verze 2.0:
Vlastnost | Popis | Povinní účastníci |
---|---|---|
typ | Vlastnost typu musí být nastavena na: Greenplum. | Ano |
verze | Zadaná verze. Hodnota je 2.0 . |
Ano |
Hostitel | Určuje název hostitele (a volitelně port), na kterém je databáze spuštěná. | Ano |
přístav | Port TCP databázového serveru. Výchozí hodnota je 5432 . |
Ne |
databáze | Databáze, ke které se chcete připojit. | Ano |
uživatelské jméno | Uživatelské jméno, se kterým se chcete spojit. Nevyžaduje se, pokud používáte IntegratedSecurity. | Ano |
Heslo | Heslo pro připojení. Nevyžaduje se, pokud používáte IntegratedSecurity. Označte toto pole jako SecureString , abyste ho bezpečně uložili. Nebo můžete odkazovat na tajný klíč uložený ve službě Azure Key Vault. | Ano |
režim SSL | Určuje, jestli se používá protokol SSL, v závislosti na podpoře serveru. - Zákaz: PROTOKOL SSL je zakázaný. Pokud server vyžaduje protokol SSL, připojení se nezdaří. - Povolit: Preferujte připojení bez SSL, pokud je server povoluje, ale povolte připojení SSL. - Preferujte: Upřednostněte připojení SSL, pokud je server umožňuje, ale povolte připojení bez SSL. - Vyžadovat: Připojení selže, pokud server nepodporuje SSL. - Verify-ca: Selhání připojení, pokud server nepodporuje SSL. Ověřuje také certifikát serveru. - Úplné ověření: Připojení selže, pokud server nepodporuje SSL. Ověřuje také certifikát serveru s názvem hostitele. Možnosti: Zakázat (0) / Povolit (1) / Preferovat (2) / Vyžadovat (3) (výchozí) / Verify-ca (4) / Verify-full (5) |
Ano |
typ autentizace | Typ ověřování pro připojení k databázi. Podporuje pouze Basic. | Ano |
connectVia | Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Další informace najdete v části Požadavky . Pokud není zadaný, použije výchozí prostředí Azure Integration Runtime. | Ne |
Další vlastnosti připojení: | ||
časový limit spojení | Doba čekání (v sekundách) při pokusu o navázání připojení před ukončením pokusu a vygenerováním chyby Výchozí hodnota je 15 . |
Ne |
časový limit příkazu | Doba čekání (v sekundách) při pokusu o spuštění příkazu před ukončením pokusu a vygenerováním chyby. Nastavte na nulu pro nekonečno. Výchozí hodnota je 30 . |
Ne |
Příklad:
{
"name": "GreenplumLinkedService",
"properties": {
"type": "Greenplum",
"version": "2.0",
"typeProperties": {
"host": "<host>",
"port": 5432,
"database": "<database>",
"username": "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"sslMode": <sslmode>,
"authenticationType": "Basic"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Příklad: Uložení hesla ve službě Azure Key Vault
{
"name": "GreenplumLinkedService",
"properties": {
"type": "Greenplum",
"version": "2.0",
"typeProperties": {
"host": "<host>",
"port": 5432,
"database": "<database>",
"username": "<username>",
"password": {
"type": "AzureKeyVaultSecret",
"store": {
"referenceName": "<Azure Key Vault linked service name>",
"type": "LinkedServiceReference"
},
"secretName": "<secretName>"
},
"sslMode": <sslmode>,
"authenticationType": "Basic"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Verze 1.0
Propojená služba Greenplum podporuje následující vlastnosti při použití verze 1.0:
Vlastnost | Popis | Povinní účastníci |
---|---|---|
typ | Vlastnost typu musí být nastavena na: Greenplum. | Ano |
připojovací řetězec | Rozhraní ODBC připojovací řetězec pro připojení k Greenplumu. Můžete také zadat heslo do služby Azure Key Vault a vytáhnout pwd konfiguraci z připojovací řetězec. Další podrobnosti najdete v následujících ukázkách a ukládání přihlašovacích údajů ve službě Azure Key Vault . |
Ano |
connectVia | Prostředí Integration Runtime , které se má použít pro připojení k úložišti dat. Další informace najdete v části Požadavky . Pokud není zadaný, použije výchozí prostředí Azure Integration Runtime. | Ne |
Příklad:
{
"name": "GreenplumLinkedService",
"properties": {
"type": "Greenplum",
"typeProperties": {
"connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;PWD=<password>"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Příklad: Uložení hesla ve službě Azure Key Vault
{
"name": "GreenplumLinkedService",
"properties": {
"type": "Greenplum",
"typeProperties": {
"connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;",
"pwd": {
"type": "AzureKeyVaultSecret",
"store": {
"referenceName": "<Azure Key Vault linked service name>",
"type": "LinkedServiceReference"
},
"secretName": "<secretName>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Vlastnosti datové sady
Úplný seznam oddílů a vlastností dostupných pro definování datových sad najdete v článku o datových sadách . Tato část obsahuje seznam vlastností podporovaných datovou sadou Greenplum.
Pokud chcete kopírovat data z Greenplumu, nastavte vlastnost typu datové sady na GreenplumTable. Podporují se následující vlastnosti:
Vlastnost | Popis | Povinní účastníci |
---|---|---|
typ | Vlastnost typu datové sady musí být nastavená na: GreenplumTable. | Ano |
schéma | Název schématu | Ne (pokud je zadán dotaz ve zdroji aktivity) |
stůl | Název tabulky. | Ne (pokud je zadán dotaz ve zdroji aktivity) |
název tabulky | Název tabulky se schématem Tato vlastnost je podporována pro zpětnou kompatibilitu. Používejte schema a table pro nové úlohy. |
Ne (pokud je zadán dotaz ve zdroji aktivity) |
Příklad
{
"name": "GreenplumDataset",
"properties": {
"type": "GreenplumTable",
"typeProperties": {},
"schema": [],
"linkedServiceName": {
"referenceName": "<Greenplum linked service name>",
"type": "LinkedServiceReference"
}
}
}
Vlastnosti aktivity kopírování
Úplný seznam oddílů a vlastností dostupných pro definování aktivit najdete v článku Pipelines . Tato část obsahuje seznam vlastností podporovaných zdrojem Greenplum.
GreenplumSource jako zdroj
Pokud chcete kopírovat data z Greenplumu, nastavte typ zdroje v aktivitě kopírování na GreenplumSource. Ve zdrojové části aktivity kopírování jsou podporovány následující vlastnosti:
Vlastnost | Popis | Povinní účastníci |
---|---|---|
typ | Vlastnost typu zdroje aktivity kopírování musí být nastavena na: GreenplumSource. | Ano |
dotaz | Ke čtení dat použijte vlastní dotaz SQL. Například: "SELECT * FROM MyTable" . |
Ne (pokud je v datové sadě zadán název tabulky) |
Příklad:
"activities":[
{
"name": "CopyFromGreenplum",
"type": "Copy",
"inputs": [
{
"referenceName": "<Greenplum input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "GreenplumSource",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Mapování datových typů pro Greenplum
Při kopírování dat z Greenplum platí následující mapování z datových typů Greenplum na interní datové typy používané službou. Informace o tom, jak aktivita kopírování mapuje zdrojové schéma a datový typ na jímku, najdete v tématu Mapování schématu a datového typu.
Datový typ Greenplum | Dočasný datový typ služby (pro verzi 2.0) | Dočasný datový typ služby (pro verzi 1.0) |
---|---|---|
SmallInt | Int16 | Int16 |
Celé číslo | Int32 | Int32 |
BigInt | Int64 | Int64 |
Desetinné číslo (přesnost <= 28) | Desetinné číslo | Desetinné číslo |
Desetinné číslo (přesnost > 28) | Desetinné číslo | Řetězec |
Numerický | Desetinné číslo | Desetinné číslo |
Reálné | Jediný | Jediný |
Dvojitý | Dvojitý | Dvojitý |
SmallSerial | Int16 | Int16 |
Seriál | Int32 | Int32 |
BigSerial | Int64 | Int64 |
Peníze | Desetinné číslo | Řetězec |
Znak | Řetězec | Řetězec |
Varchar | Řetězec | Řetězec |
Text | Řetězec | Řetězec |
Bajta | Bajt[] | Bajt[] |
Časová značka | Datum a čas | Datum a čas |
Časové razítko s časovým pásmem | Posun data a času | Řetězec |
Datum | Datum | Datum a čas |
Čas | Časový rozsah | Časový rozsah |
Čas s časovým pásmem | Posun data a času | Řetězec |
Rozmezí | Časový rozsah | Řetězec |
Boolovská logika | Boolovská logika | Boolovská logika |
Bod | Řetězec | Řetězec |
Řádek | Řetězec | Řetězec |
Iseg | Řetězec | Řetězec |
Krabice | Řetězec | Řetězec |
Cesta | Řetězec | Řetězec |
Mnohoúhelník | Řetězec | Řetězec |
Kruh | Řetězec | Řetězec |
Cider | Řetězec | Řetězec |
Sada inet | Řetězec | Řetězec |
Macaddr | Řetězec | Řetězec |
Macaddr8 | Řetězec | Řetězec |
Tsvector | Řetězec | Řetězec |
Tsquery | Řetězec | Řetězec |
Univerzálně jedinečný identifikátor (UUID) | Průvodce | Průvodce |
Json | Řetězec | Řetězec |
Jsonb | Řetězec | Řetězec |
Pole | Řetězec | Řetězec |
Bit | Bajt[] | Bajt[] |
Bit se liší | Bajt[] | Bajt[] |
XML | Řetězec | Řetězec |
IntArray | Řetězec | Řetězec |
TextArray | Řetězec | Řetězec |
NumericArray | Řetězec | Řetězec |
DateArray | Řetězec | Řetězec |
Rozmezí | Řetězec | Řetězec |
Bpchar | Řetězec | Řetězec |
Vlastnosti aktivity vyhledávání
Podrobnosti o vlastnostech najdete v aktivitě Vyhledávání.
Upgradovat konektor Greenplum
Tady jsou kroky, které vám pomůžou upgradovat konektor Greenplum:
Na stránce Upravit propojenou službu vyberte verzi 2.0 a nakonfigurujte propojenou službu odkazem na vlastnosti propojené služby verze 2.0.
Mapování datového typu propojené služby Greenplum verze 2.0 se liší od mapování datového typu pro propojenou službu Greenplum verze 1.0. Informace o nejnovějším mapování datových typů najdete v tématu Mapování datových typů pro Greenplum.
Rozdíly mezi Greenplum verze 2.0 a verzí 1.0
Konektor Greenplum verze 2.0 nabízí nové funkce a je kompatibilní s většinou funkcí verze 1.0. Následující tabulka ukazuje rozdíly mezi funkcemi verze 2.0 a verze 1.0.
Verze 2.0 | Verze 1.0 |
---|---|
Mapování z datových typů Greenplum na dočasné datové typy služby se používají následovně. Desetinné číslo (přesnost > 28) –> desítkové Peníze -> Desetinné Časové razítko s časovým pásmem –> DateTimeOffset Čas s časovým pásmem –> DateTimeOffset Interval –> časový rozsah |
Mapování z datových typů Greenplum na dočasné datové typy služby se používají následovně. Desetinné číslo (přesnost > 28) –> řetězec Peníze –> řetězec Časové razítko s časovým pásmem ->Řetězec Čas s časovým pásmem – řetězec> Interval –> řetězec |
Související obsah
Seznam úložišť dat podporovaných jako zdroje a jímky aktivitou kopírování najdete v podporovaných úložištích dat.