Použití Azure Synapse Analytics s cloudovou analýzou

Azure Synapse Analytics je zřízená integrovaná analytická služba, která zrychluje dobu přehledu napříč datovými sklady a systémy pro velké objemy dat. Azure Synapse Analytics spojuje:

  • Nejlepší technologie SQL používané v podnikových datových skladech.
  • Technologie Sparku používané pro velké objemy dat
  • Kanály pro datovou aplikaci (v souladu se zdrojem) a extrakci, transformaci a načítání (ETL) nebo extrakci, načítání a transformaci (ELT).

Azure Synapse Studio je nástroj v Azure Synapse, který poskytuje jednotné prostředí pro správu, monitorování, kódování a zabezpečení. Synapse Studio má hlubokou integraci s dalšími službami Azure, jako jsou Power BI, Azure Cosmos DB a Azure Machine Učení.

Poznámka

Cílem této části je popsat předepsané konfigurace, které jsou specifické pro analýzy v cloudovém měřítku. Je to kompliment oficiální dokumentace ke službě Azure Synapse Analytics.

Přehled

Během počátečního nastavení cílové zóny dat můžete nasadit jeden pracovní prostor Azure Synapse Analytics pro použití všemi analytiky a datovými vědci. Můžete vytvořit více pracovních prostorů pro konkrétní integrace dat nebo datové produkty.

Pokud váš datový produkt potřebuje přístup ke standardizovaným datům se zabezpečením na úrovni řádků a sloupců, budete možná potřebovat další pracovní prostory služby Azure Synapse Analytics. Tyto pracovní prostory můžete poskytnout fondům Azure Synapse. Týmy datových produktů mohou vyžadovat vlastní pracovní prostor pro vytváření datových produktů a samostatný pracovní prostor, který je určený jenom pro produktové týmy s vymezeným přístupem pro vývoj.

Nastavení služby Azure Synapse Analytics

Prvním krokem při nasazení azure Synapse Analytics je nastavení pracovního prostoru Azure Synapse, který je připojený k účtu Azure Purview.

Sítě Azure Synapse Analytics

Cílová zóna dat vytváří pracovní prostory se spravovanou virtuální sítí Azure Synapse Analytics. Komunikace s Azure Synapse probíhá prostřednictvím tří koncových bodů, které zveřejňuje: fond SQL, SQL na vyžádání a koncový bod pro vývoj.

Na úrovni sítě využívají analýzy na úrovni cloudu spravované privátní koncové body synapse. Tyto koncové body zajišťují veškerý provoz mezi virtuální sítí cílové zóny dat a pracovními prostory Azure Synapse zcela přes páteřní síť Microsoftu.

Řízení přístupu k datům Azure Synapse

Pomocí seznamů řízení přístupu s průchozí službou Microsoft Entra ve službě Azure Synapse Analytics můžete spravovat přístup k souborům v datovém jezeře.

Pro data, u kterých potřebujete omezit vrácené sloupce a řádky, doporučujeme zabezpečení na úrovni řádků a sloupců omezit přístup k datům v tabulkách ve vyhrazeném nebo bezserverovém fondu Azure Synapse SQL. Zabezpečení na úrovni řádků a zabezpečení na úrovni sloupců se implementuje na úrovni databáze a kromě databázových rolí.

Zabezpečení na úrovni řádků například zajišťuje, aby uživatelé v konkrétní datové aplikaci (zarovnané zdroji) nebo datovém produktu viděli jenom svá vlastní data. I když tabulka obsahuje data pro celý podnik.

Zabezpečení na úrovni řádků můžete kombinovat se zabezpečením na úrovni sloupců, abyste omezili přístup ke sloupcům s citlivými daty. Tímto způsobem platí, že zabezpečení na úrovni řádků i zabezpečení na úrovni sloupců používá logiku omezení přístupu na úrovni databáze místo aplikační vrstvy. Oprávnění se vyhodnocuje při každém pokusu o přístup k datům z libovolné vrstvy.

Poznámka

Bezserverový fond SQL Azure Synapse podporuje zabezpečení na úrovni sloupců pro zobrazení a ne pro externí tabulky. V případě externích tabulek můžete vytvořit logické zobrazení nad externí tabulkou a použít zabezpečení na úrovni sloupce. V případě zabezpečení na úrovni řádků je možné jako alternativní řešení použít vlastní zobrazení.

Další informace najdete v tématu Řízení přístupu k datům Azure Synapse Analytics.

Řízení přístupu k datům Azure Synapse v Azure Data Lake

Při nasazování pracovního prostoru Azure Synapse Analytics potřebujete účet Azure Data Lake Storage z předplatného nebo ručně pomocí adresy URL účtu úložiště. Zadaný účet úložiště je nastavený jako primární pro nasazený pracovní prostor Azure Synapse pro ukládání dat. Azure Synapse ukládá data do kontejneru, který obsahuje tabulky Apache Sparku a protokoly aplikací Spark ve složce s názvem /synapse/{workspaceName}. Má také kontejner pro správu všech knihoven, které se rozhodnete nainstalovat.

Tip

Doporučujeme použít vyhrazený kontejner ve vývojové vrstvě nebo ve třech účtech Data Lake. Tento kontejner se používá jako primární úložiště k ukládání metadat Sparku.

Informace o nastavení přístupu k datům najdete v tématu Řízení přístupu k datům Ve službě Azure Synapse Analytics.

Další kroky