Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
V tomto článku se dozvíte, jak do streamu událostí přidat zdroj CDC (Database Change Data Capture) PostgreSQL.
Zdrojový konektor PostgreSQL Database Change Data Capture (CDC) pro streamy událostí Microsoft Fabric umožňuje zachytit snímek aktuálních dat v databázi PostgreSQL. V současné době se nástroj PostgreSQL Database Change Data Capture (CDC) podporuje z následujících služeb, ke které lze přistupovat veřejně:
- Azure Databáze pro PostgreSQL
- Amazon RDS for PostgreSQL
- Amazon Aurora PostgreSQL
- Google Cloud SQL for PostgreSQL
Jakmile se zdroj CDC databáze PostgreSQL přidá do eventstreamu, zaznamená změny na úrovni řádků do zadaných tabulek. Tyto změny je pak možné zpracovat v reálném čase a odeslat je do různých cílů pro další analýzu.
Požadavky
Přístup k pracovnímu prostoru v režimu kapacitní licence Fabric nebo zkušebním režimu licence s oprávněními přispěvatele nebo vyššími.
Registrovaný přístup uživatele v databázi PostgreSQL.
Vaše databáze PostgreSQL musí být veřejně přístupná a nesmí být za bránou firewall nebo zabezpečená ve virtuální síti.
Služba CDC je povolená v databázi a tabulkách PostgreSQL.
Pokud máte Azure Database for PostgreSQL, následující kroky naleznete v další části pro povolení CDC. Podrobné informace najdete v tématu Logická replikace a logické dekódování – Flexibilní server Azure Database for PostgreSQL.
Další databáze PostgreSQL najdete v tématu Konektor Debezium pro PostgreSQL :: Dokumentace k Debezium.
Pokud nemáte stream událostí, vytvořte stream událostí.
Povolení CDC v databázi PostgreSQL
V této části se jako příklad používá Azure Database for PostgreSQL.
Pokud chcete povolit CDC na flexibilním serveru Azure Database for PostgreSQL, postupujte takto:
Na stránce flexibilního serveru Azure Database for PostgreSQL na webu Azure Portal vyberte parametry serveru v navigační nabídce.
Na stránce Parametry serveru:
- Nastavte wal_level na logickou hodnotu.
- Aktualizujte max_worker_processes alespoň na 16.
Uložte změny a restartujte server.
Ověřte, že vaše instance flexibilního serveru Azure Database for PostgreSQL umožňuje veřejný síťový provoz.
Udělením oprávnění pro replikaci uživateli admin spusťte následující příkaz SQL. Pokud chcete k načtení CDC použít jiný uživatelský účet pro připojení databáze PostgreSQL, ujistěte se, že je uživatel vlastníkem tabulky .
ALTER ROLE <admin_user_or_table_owner_user> WITH REPLICATION;
Spusťte průvodce výběrem zdroje dat.
Pokud jste ještě do streamu událostí nepřidali žádný zdroj, vyberte dlaždici Použít externí zdroj .
Pokud přidáváte zdroj do již publikovaného streamu událostí, přepněte do režimu úprav . Na pásu karet vyberte Přidat zdroj>Externí zdroje.
Na stránce Vyberte zdroj dat vyhledejte a vyberte Připojit na dlaždici PostgreSQL DB (CDC).
Konfigurace a připojení ke službě PostgreSQL Database CDC
Na stránce Připojit vyberte Nové připojení.
V části Nastavení připojení zadejte následující informace.
Server: Adresa serveru vaší databáze PostgreSQL, například my-pgsql-server.postgres.database.azure.com.
Databáze: Název databáze, například my_database.
Název připojení: Zadejte název připojení.
Druh ověřování, vyberte Základní a zadejte své uživatelské jméno a heslo pro databázi.
Poznámka:
Streamy událostí Fabric v současné době podporují pouze základní ověřování.
Vyberte Připojit k dokončení nastavení připojení.
Port: Zadejte číslo portu vašeho serveru. Výchozí hodnota je 5432. Pokud je vybrané cloudové připojení nakonfigurované v Správa připojení a bran, ujistěte se, že číslo portu odpovídá tomu nastavenému tam. Pokud se neshodují, přednost má portové číslo nastavené v cloudovém připojení v Spravovat připojení a brány.
Při zachytávání změn z databázových tabulek si můžete vybrat mezi dvěma možnostmi:
- Všechny tabulky: Zachytávání změn z každé tabulky v databázi
-
Zadejte názvy tabulek: Umožňuje zadat podmnožinu tabulek pomocí seznamu odděleného čárkami. Můžete použít buď: úplné identifikátory tabulky ve formátu
schemaName.tableNamenebo platné regulární výrazy. Příklady: -
dbo.test.*: Vyberte všechny tabulky, jejichž názvy začínajítestve schématudbo. -
dbo\.(test1|test2): Vybertedbo.test1adbo.test2.
V seznamu můžete zkombinovat oba formáty. Celkový limit znaků pro celou položku je 102 400 znaků.
Název slotu (volitelné): Zadejte název logického dekódovacího slotu PostgreSQL, který byl vytvořen ke streamování změn z konkrétního pluginu pro určitou databázi nebo schéma. Server používá tento slot k streamování událostí do konektoru streamování Eventstream. Musí obsahovat jenom malá písmena, číslice a podtržítka.
- Pokud není zadaný, použije se k vytvoření slotu identifikátor GUID, který vyžaduje příslušná oprávnění k databázi.
- Pokud název zadaného slotu existuje, konektor ho použije přímo.
Pokud chcete získat přístup k dalším možnostem konfigurace zdroje CDC služby PostgreSQL Database, můžete rozbalit Rozšířená nastavení :
Název publikace: Určuje název publikace logické replikace PostgreSQL, která se má použít. Musí se shodovat s existující publikací v databázi nebo se vytvoří automaticky v závislosti na režimu automatického vytvoření. Výchozí hodnota:
dbz_publication.Poznámka:
Uživatel konektoru musí mít k vytvoření publikace oprávnění superuživatele. Před prvním spuštěním konektoru doporučujeme publikaci vytvořit ručně, abyste se vyhnuli problémům souvisejícím s oprávněními.
Režim automatického vytvoření publikace: Určuje, zda a jak se publikace automaticky vytvoří. K dispozici jsou následující možnosti:
-
Filtered(výchozí): Pokud zadaná publikace neexistuje, konektor vytvoří jednu, která obsahuje pouze vybrané tabulky (jak je uvedeno v seznamu zahrnutí tabulky). -
AllTables: Pokud zadaná publikace existuje, konektor ji použije. Pokud neexistuje, konektor vytvoří jednu, která obsahuje všechny tabulky v databázi. -
Disabled: Konektor nevytvoří publikaci. Pokud zadaná publikace chybí, konektor vyvolá výjimku a zastaví se. V takovém případě musí být publikace ručně vytvořena v databázi.
Další informace najdete v dokumentaci k Debezium v režimu automatického vytváření publikace.
-
Režim zpracování desetinných hodnot: Určuje, jak konektor zpracovává hodnoty PostgreSQL sloupců
DECIMALaNUMERIC:-
Precise: Představuje hodnoty používající přesné desetinné typy (například JavaBigDecimal) k zajištění úplné přesnosti a přesnosti v reprezentaci dat. -
Double: Převede hodnoty na čísla s dvojitou přesností. Tím se zlepší použitelnost a výkon, ale může dojít ke ztrátě přesnosti. -
String: Zakóduje hodnoty jako formátované řetězce. Díky tomu se snadno spotřebovávají v podřízených systémech, ale ztratí sémantické informace o původním číselném typu.
-
Režim snímku: Zadejte kritéria pro provedení snímku při spuštění konektoru:
-
Initial: Konektor spustí snímek pouze v případě, že nebyly zaznamenány žádné posuny pro název logického serveru nebo pokud zjistí, že se dřívější snímek nepodařilo dokončit. Po dokončení snímku konektor začne streamovat záznamy událostí pro následné změny databáze. -
InitialOnly: Konektor spustí snímek pouze tehdy, když pro logický název serveru nejsou zaznamenány žádné offsety. Po dokončení snímku se konektor zastaví. Neprovádí přechod na streamování, aby se načetly události změn z binlogu. -
NoData: Konektor spustí snímek, který zachycuje pouze schéma, ale ne žádná data tabulky. Tuto možnost nastavte, pokud nepotřebujete konzistentní snímek dat, ale od spuštění konektoru potřebujete jenom změny, ke které dochází.
-
Dotaz akce srdcového signálu: Určuje dotaz, který konektor spustí ve zdrojové databázi, když konektor odešle zprávu srdcového signálu.
Výjimka příkazu SELECT pro snímek: Určuje řádky tabulky, které se mají zahrnout do snímku. Vlastnost použijte, pokud chcete, aby snímek zahrnoval pouze podmnožinu řádků v tabulce. Tato vlastnost má vliv pouze na snímky. Nevztahuje se na události, které konektor čte z protokolu.
Na stránce Zkontrolovat a připojit zkontrolujte souhrn a pak vyberte Přidat.
Zobrazení aktualizovaného streamu událostí
Zdroj CDC databáze PostgreSQL přidaný do streamu událostí můžete zobrazit v režimu úprav.
Pokud chcete implementovat nově přidaný zdroj CDC databáze PostgreSQL, vyberte Publikovat. Po dokončení těchto kroků je zdroj CDC databáze PostgreSQL dostupný pro vizualizaci v živém zobrazení.
Související obsah
Další konektory:
- Datové proudy Amazon Kinesis
- Azure Cosmos DB
- Azure Event Hubs
- Azure Service Bus
- Azure IoT Hub
- Azure SQL Database Change Data Capture (zachycení změny dat) (CDC)
- Confluent Kafka
- Vlastní koncový bod
- Google Cloud Pub/Sub
- MySQL databáze pro zachytávání změn dat (CDC)
- Databáze PostgreSQL – CDC
- Ukázková data
- Události služby Azure Blob Storage
- Událost pracovního prostoru Fabric