Sdílet prostřednictvím


Vytvoření Azure Synapse Link pro Dataverse pomocí Azure Synapse Workspace

Použijte Azure Synapse Link k připojení vašich dat Microsoft Dataverse k Azure Synapse Analytics za účelem prozkoumání vašich dat a urychlení času na získání statistik. Tento článek popisuje, jak provést následující úlohy:

  1. Připojte svá data Dataverse do vašeho pracovního prostoru Azure Synapse Analytics pomocí služby Azure Synapse Link.
  2. Správa tabulek Dataverse obsažených v Azure Synapse Link.
  3. Monitorování Azure Synapse Link.
  4. Odpojení Azure Synapse Link.
  5. Opětovné připojení Azure Synapse Link.
  6. Zobrazte svá data v Azure Synapse Analytics.

Poznámka:

Služba Azure Synapse Link pro Microsoft Dataverse byla dříve známá jako Export do služby Data Lake. Služba byla s účinností od května 2021 přejmenována a bude i nadále exportovat data do Azure Data Lake a také do Azure Synapse Analytics.

Předpoklady

  • Dataverse: Musíte mít roli zabezpečení Správce systému Dataverse. Kromě toho musí mít tabulky, které chcete exportovat prostřednictvím Azure Synapse Link, povolenou vlastnost Sledovat změny. Více informací: Rozšířené možnosti

Požadavky Azure Data Lake Storage Gen2

Musíte mít účet Azure Data Lake Storage Gen2 a následující role:

  • Owner
  • Přispěvatel dat služby Storage Blob
  • Vlastník dat služby Storage Blob

Požadavek role vlastníka: Role Vlastník je povinná, protože přidání spravované identity služby Azure Synapse Link do účtu úložiště je privilegovaná operace. Tato spravovaná identita umožňuje službě provádět synchronizaci z Dataverse do Synapse. V současné době je pro tento krok vyžadována role Vlastník, a vlastní role s podobnými oprávněními nejsou podporovány.

Oprávnění pro spravovanou identitu:

  • Vlastník a přispěvatel účtu úložiště: Vyžadováno pouze při prvním nastavení k vytvoření systému souborů v účtu úložiště a přiřazení k účtu úložiště. Po nastavení je možné tato oprávnění odebrat, aniž by to mělo vliv na operace synchronizace.
  • Přispěvatel dat objektů blob úložiště: Je vyžadován pro standardní operace s objekty blob během pravidelné synchronizace.
  • Vlastník dat objektů blob úložiště: V současné době se vyžaduje pro správu dat a oprávnění k přístupu ve scénářích zahrnujících Azure Data Lake Storage Gen2.

Váš účet úložiště musí mít povolený hierarchický obor názvů jak pro počáteční nastavení, tak i pro rozdílovou synchronizaci.

Povolit přístup ke klíči účtu úložiště je vyžadován pouze pro počáteční nastavení, protože služba používá autorizaci pomocí privilegovaného klíče k provádění privilegovaných operací, jako je vytvoření systému souborů a vytvoření propojení před přepnutím na ověřování spravované identity. Po nastavení už není potřeba přístup založený na klíčích.

Váš účet úložiště musí mít povolený obor pro operace kopírování nastavené na Z libovolného účtu úložiště.

  • Pracovní prostor Synapse: Musíte mít pracovní prostor Synapse a přístup k rolím Správce synapse v Synapse Studio. Pracovní prostor Synapse musí být ve stejné oblasti jako váš Účet Azure Data Lake Storage Gen2. Účet úložiště musí být přidán jako propojená služba v rámci Synapse Studio. Chcete-li vytvořit pracovní prostor Synapse, přejděte na Vytvoření pracovního prostoru Synapse.

Poznámka:

  • Účet úložiště a pracovní prostor Synapse musejí být vytvořeny ve stejném klientovi Microsoft Entra jako váš klient Power Apps.
  • Pokud chcete nastavit zapnuto z vybraných virtuálních sítí a IP adres pro propojený účet úložiště a pracovní prostor, musíte vytvořit Azure Synapse Link se spravovanými identitami. Další informace: Použití spravovaných identit pro Azure s úložištěm Azure Data Lake Storage (bez nastavení spravovaných identit musíte povolit přístup k veřejné síti pro prostředky Azure pro počáteční nastavení i rozdílovou synchronizaci.)
  • Pracovní prostory Synapse obsahující spravované privátní koncové body, ochranu před exfiltrací dat nebo spravované virtuální sítě nejsou podporovány.
  • Musíte mít roli Čtenář pro přístup do skupiny prostředků pomocí účtu úložiště a pracovního prostoru Synapse.
  • Když do pracovního prostoru synapse přidáte více uživatelů, musí mít Správce Synapse přístup k rolím v rámci Synapse Studio a roli Přispěvatel dat objektu blob úložiště pro účet Azure Data Lake Storage Gen2.
  • Vytvoření profilů Synapse Link v rámci jednoho prostředí DV je omezeno na maximálně 10.

Připojení Dataverse do pracovního prostoru Synapse

  1. Přihlaste se k Power Apps a vyberte preferované prostředí.

  2. V levém navigačním podokně vyberte Azure Synapse Link. Pokud se Azure Synapse Link nenachází v postranním podokně, vyberte …Více a vyberte možnost Objevit vše. Vyberte Azure Synapse Link v sekci Správa dat.

  3. Na panelu příkazů zvolte tlačítko + Nový odkaz.

  4. Vyberte volbu Připojit k Azure Synapse Workspace.

  5. Vyberte Předplatné, Skupina zdrojů, Název pracovního prostoru, a Účet úložiště. Zajistěte, aby pracovní prostor a účet úložiště Synapse splňovaly požadavky uvedené v části Předpoklady. Vyberte Další.

    Připojení k pracovnímu prostoru.

    Poznámka:

    V rámci propojení prostředí k datovému jezeru udělíte službě Azure Synapse Link přístup k vašemu účtu úložiště. Vždy postupujte podle předpokladů pro vytvoření a konfiguraci účtu úložiště Azure Data Lake Storage a udělení sami sobě role vlastníka účtu úložiště. Navíc udělujete svému účtu úložiště přístup ke službě datových toků Power Platform. Další informace: Samoobslužná příprava dat s datovými toky.

  6. Zvolte tabulky, které chcete exportovat, buď tak, že je vyberete jednu po druhé, nebo do vyhledávacího pole zadáte seznam tabulek oddělených čárkami, a pak vyberte Uložit. Exportovat lze pouze tabulky s aktivní vlastností Sledovat změny. Více informací: Rozšířené možnosti.

    Přidat tabulky.

Chcete-li vytvořit odkaz z jednoho prostředí do více pracovních prostorů Azure Synapse Analytics a datových jezer Azure ve vašem předplatném Azure, přidejte podle následujících kroků datové jezero Azure jako propojenou službu do pracovního prostoru Synapse. Obdobně můžete vytvořit odkaz z více prostředí do stejného pracovního prostoru Azure Synapse Analytics a datového jezera Azure, vše v rámci jednoho klienta.

Poznámka:

Služba Azure Synapse Link pro Dataverse je plynule integrována do Power Platform jako předpřipravená funkce. Splňuje standardy zabezpečení a správy stanovené pro uchovávání a správu dat Power Platform. Další informace: Ukládání a zásady správného řízení dat

Data exportovaná službou Azure Synapse Link se při přenosu šifrují pomocí protokolu TLS (Transport Layer Security) 1.2 nebo vyššího a jsou šifrována při ukládání do Azure Data Lake Storage Gen2. Kromě toho jsou přechodná data v úložišti objektů blob také v klidu šifrována. Šifrování v Azure Data Lake Storage Gen2 vám pomáhá chránit vaše data, implementovat zásady zabezpečení podniku a splňovat požadavky na dodržování předpisů. Další informace: Šifrování dat Azure v klidu Další informace: Konfigurace bran firewall a virtuálních sítí Azure Storage

Správa dat tabulky v pracovním prostoru Synapse

Po nastavení služby Azure Synapse Link můžete tabulky, které se exportují, spravovat dvěma způsoby:

  • V oblasti Azure Synapse Link Power Apps (make.powerapps.com) vyberte Spravovat tabulky na panelu příkazů pro přidání nebo odebrání jedné nebo více propojených tabulek.

  • V portálu tvůrce Power Apps, v oblasti Tabulky, vyberte ... vedle tabulky a pak vyberte propojené datové jezero, do kterého chcete exportovat data tabulky.

    Výběr tabulky pro export.

Poté, co jste nastavili Azure Synapse Link, můžete Azure Synapse Link sledovat na kartě Tabulky.

Sledování Azure Synapse Link

  • Zobrazí se seznam tabulek, které jsou součástí vybraného propojení Azure Synapse Link.
  • Stav synchronizace prochází různými fázemi. Nespuštěno označuje, že tabulka čeká na synchronizaci. Jakmile je počáteční synchronizace tabulky Dokončena, proběhne fáze následného zpracování, kde nebudou probíhat přírůstkové aktualizace. V závislosti na velikosti dat to může trvat i několik hodin. Jakmile začnou probíhat přírůstkové aktualizace, bude datum poslední synchronizace pravidelně aktualizováno.
  • Sloupec Počet ukazuje počet zapsaných řádků. Když je vlastnost Jen připojit nastavena na Ne, jde o celkový počet záznamů. Když je vlastnost Jen připojit nastavena na Ano, jde o celkový počet změn.
  • Sloupce Pouze připojit a Strategie dělení ukazují využití různých pokročilých konfigurací.
  1. Vyberte propojení Azure Synapse Link, které chcete odpojit.

  2. V panelu příkazů vyberte Odpojit.

  3. Chcete-li odstranit souborový systém datového jezera i databázi Synapse, zadejte název odkazu jako potvrzení.

  4. Vyberte Ano a počkejte několik minut, než bude vše odpojeno a odstraněno.

Důležité

Vlastní databázové objekty, které vytvoříte v rámci databáze Azure Synapse Link, budou po dokončení odpojení odstraněny.

Budete muset implementovat vlastní správu verzí vlastních skriptů databázových objektů, abyste měli jistotu, že mají zálohu.

Pokud jste při odpojování odstranili systém souborů, připojte stejný pracovní prostor Synapse a datové jezero znovu podle výše uvedených kroků. Pokud jste při odpojování neodstranili systém souborů, musíte data vymazat a znovu je propojit:

  1. Přejděte do Azure Synapse Analytics.

  2. Vyberte položku ... pro nepropojenou databázi a poté Nový notebook>Prázdný notebook.

  3. Připojte notebook k fondu Apache Spark výběrem fondu z rozevírací nabídky. Pokud nemáte fond Apache Spark, vyberte Spravovat fondy k jeho vytvoření.

  4. Zadejte následující skript, ve kterém část <DATABASE_NAME> nahraďte názvem databáze, kterou chcete odpojit, a spusťte notebook.

    %%sql
    DROP DATABASE <DATABASE_NAME> CASCADE
  1. Po spuštění notebooku obnovte seznam databází v levém panelu. Pokud databáze stále existuje, zkuste na ni kliknout pravým tlačítkem a vybrat příkaz Odstranit.

  2. Přejděte do Power Apps a znovu propojte pracovní prostor Synapse a datové jezero.

Přístup k datům téměř v reálném čase a k datům snímků pouze pro čtení

Po vytvoření Azure Synapse Link budou ve výchozím nastavení synchronizovány dvě verze dat tabulky Azure Synapse Analytics nebo Azure Data Lake Storage Gen2 ve vašem předplatném Azure, abyste zajistili, že můžete kdykoli spolehlivě využívat aktualizovaná data v jezeře:

  • Data téměř v reálném čase: Poskytuje kopii dat synchronizovaných z Dataverse přes Azure Synapse Link účinným způsobem detekcí, jaká data se změnila od doby, kdy byla původně extrahována nebo naposledy synchronizována.
  • Data snímku: Poskytuje kopii dat téměř v reálném čase pouze pro čtení, která se aktualizuje v pravidelných intervalech (v tomto případě každou hodinu). 

Poznámka:

Chcete-li vytvořit data snímku pouze ke čtení, ujistěte se, že nastavení Povolený rozsah pro operace kopírování je konfigurován jako Z libovolného účtu úložiště. Další informace: Konfigurace povoleného rozsahu pro operace kopírování

  1. Vyberte požadované propojení Azure Synapse Link a poté v horním panelu vyberte Přejít do pracovního prostoru Azure Synapse Analytics.
  2. Rozbalte Databáze jezera v levém panelu, vyberte dataverse-environmentName-organizationUniqueName a rozbalte Tabulky.

Všechny Tabulky dat téměř v reálném čase jsou uvedeny a dostupné pro analýzu s konvencí pojmenování DataverseTableName. Všechny Tabulky dat snímku jsou uvedeny a dostupné pro analýzu s konvencí pojmenování DataverseTableName_partitioned.

Tabulka téměř v reálném čase a snímek

Co dál?

Po úspěšném použití služby Azure Synapse Link pro Dataverse zjistěte, jak můžete analyzovat a spotřebovávat svá data, v centru zjišťování. Pro přístup do centra zjišťování jděte na Power Apps>Azure Synapse Link. Vyberte svou propojenou službu a poté vyberte záložku Centrum analýz. Zde najdete doporučené nástroje a připravenou dokumentaci, které vám pomohou získat maximum z vašich dat. Centrum analýz.

Viz také

Konfigurace Azure Synapse Link pro Dataverse s Azure Data Lake

Rozšířená konfigurace Azure Synapse Link pro Dataverse

Azure SynapseAdresa FAQ propojení

Blog: Představujeme Azure Synapse Link pro Dataverse