Azure Synapse Analytics gebruiken met analyses op cloudschaal

Artikel
10/07/2023

Azure Synapse Analytics is de ingerichte, geïntegreerde analyseservice waarmee u sneller inzicht krijgt in datawarehouses en big data-systemen. Azure Synapse Analytics brengt het volgende samen:

De beste SQL-technologieën die worden gebruikt in datawarehousing voor ondernemingen.
Spark-technologieën die worden gebruikt voor big data.
Pijplijnen voor gegevenstoepassing (bron uitgelijnd) en extraheren, transformeren en laden (ETL) of extraheren, laden en transformeren (ELT).

Azure Synapse Studio is een hulpprogramma in Azure Synapse dat een uniforme ervaring biedt voor beheer, bewaking, codering en beveiliging. Synapse Studio is diep geïntegreerd met andere Azure-services, zoals Power BI, Azure Cosmos DB en Azure Machine Learning.

Notitie

Deze sectie is bedoeld om voorgeschreven configuraties te beschrijven die specifiek zijn voor analyses op cloudschaal. Het is een aanvulling op de officiële Documentatie van Azure Synapse Analytics.

Overzicht

Tijdens de eerste installatie van een gegevenslandingszone kunt u één Azure Synapse Analytics-werkruimte implementeren voor gebruik door alle analisten en gegevenswetenschappers. U kunt meer werkruimten maken voor specifieke gegevensintegraties of gegevensproducten.

Mogelijk hebt u extra Azure Synapse Analytics-werkruimten nodig als uw gegevensproduct toegang moet bieden tot de gestandaardiseerde gegevens met beveiliging op rij- en kolomniveau. U kunt deze werkruimten voorzien van Azure Synapse-pools. Teams voor gegevensproducten vereisen mogelijk hun eigen werkruimte voor het maken van gegevensproducten en een afzonderlijke werkruimte die alleen geschikt is voor productteams met toegang tot ontwikkelingsbereik.

Azure Synapse Analytics instellen

De eerste stap in de implementatie van Azure Synapse Analytics is het instellen van een Azure Synapse-werkruimte die is verbonden met een Azure Purview-account.

Azure Synapse Analytics-netwerken

Een gegevenslandingszone maakt werkruimten met een beheerd virtueel netwerk van Azure Synapse Analytics. Communicatie met Azure Synapse vindt plaats via de drie eindpunten die het beschikbaar maakt: SQL-pool, SQL on-demand en het ontwikkelingseindpunt.

Op netwerkniveau maakt analyse op cloudschaal gebruik van door Synapse beheerde privé-eindpunten. Deze eindpunten zorgen ervoor dat al het verkeer tussen het virtuele netwerk van de gegevenslandingszone en Azure Synapse-werkruimten volledig wordt verplaatst via het Microsoft-backbonenetwerk.

Toegangsbeheer voor Azure Synapse-gegevens

Gebruik toegangsbeheerlijsten met Microsoft Entra Pass Through in Azure Synapse Analytics om de toegang tot de bestanden in de data lake te beheren.

Voor gegevens waarvoor u kolommen en rijen moet beperken die worden geretourneerd, raden we u aan beveiliging op rij- en kolomniveau te beperken om de toegang tot gegevens in de tabellen in toegewezen of serverloze Azure Synapse SQL-pool te beperken. Beveiliging op rijniveau en beveiliging op kolomniveau worden geïmplementeerd op databaseniveau en naast de databaserollen.

Beveiliging op rijniveau zorgt er bijvoorbeeld voor dat gebruikers in een specifieke gegevenstoepassing (bron uitgelijnd) of gegevensproduct alleen hun eigen gegevens zien. Zelfs als de tabel gegevens voor de hele onderneming bevat.

U kunt beveiliging op rijniveau combineren met beveiliging op kolomniveau om de toegang tot kolommen met gevoelige gegevens te beperken. Op deze manier passen zowel beveiliging op rijniveau als beveiliging op kolomniveau de logica voor toegangsbeperking toe op de databaselaag in plaats van op de toepassingslaag. De machtiging wordt geëvalueerd telkens wanneer toegang tot gegevens wordt geprobeerd vanuit elke laag.

Notitie

Serverloze SQL-pool van Azure Synapse ondersteunt beveiliging op kolomniveau voor weergaven en niet voor externe tabellen. In het geval van externe tabellen kunt u een logische weergave maken boven op de externe tabel en dan beveiliging op kolomniveau toepassen. In het geval van beveiliging op rijniveau kunnen aangepaste weergaven worden gebruikt als tijdelijke oplossing.

Zie Azure Synapse Analytics-toegangsbeheer voor gegevens voor meer informatie.

Toegangsbeheer voor Azure Synapse-gegevens in Azure Data Lake

Bij het implementeren van een Azure Synapse Analytics-werkruimte hebt u een Azure Data Lake Storage-account nodig uit het abonnement of handmatig met behulp van de URL van het opslagaccount. Het opgegeven opslagaccount is ingesteld als primair voor de geïmplementeerde Azure Synapse-werkruimte om de gegevens op te slaan. Azure Synapse slaat gegevens op in een container met Apache Spark-tabellen en Spark-toepassingslogboeken in een map met de naam /synapse/{workspaceName}. Het bevat ook een container voor het beheren van bibliotheken die u wilt installeren.

Fooi

U wordt aangeraden een toegewezen container te gebruiken in de ontwikkelingslaag of data lake drie accounts. Deze container wordt gebruikt als primaire opslag voor het opslaan van Spark-metagegevens.

Raadpleeg Het toegangsbeheer voor gegevenstoegang van Azure Synapse Analytics voor aanbevelingen voor het instellen van gegevenstoegang.

Volgende stappen

Controlelijst voor gereedheid van Azure Purview voor analyses op cloudschaal