Inzicht in de mogelijkheden en gebruiksvoorbeelden van een serverloze SQL-pool van Azure Synapse

Voltooid

Azure Synapse Analytics is een geïntegreerde analyseservice die een breed scala aan veelgebruikte technologieën combineert voor het verwerken en analyseren van gegevens op schaal. Een van de meest voorkomende technologieën die worden gebruikt in gegevensoplossingen is SQL: een standaardtaal voor de industrie voor het opvragen en bewerken van gegevens.

Serverloze SQL-pools in Azure Synapse Analytics

Azure Synapse SQL is een gedistribueerd querysysteem in Azure Synapse Analytics dat twee soorten runtime-omgevingen biedt:

  • Serverloze SQL-pool: verwerking van SQL-query's op aanvraag, voornamelijk gebruikt voor het werken met gegevens in een data lake.
  • Toegewezen SQL-pool: relationele database-exemplaren op ondernemingsniveau die worden gebruikt voor het hosten van datawarehouses waarin gegevens worden opgeslagen in relationele tabellen.

In deze module richten we ons op serverloze SQL-pool. Dit biedt een eindpunt voor betalen per query om query's uit te voeren op de gegevens in uw Data Lake. De voordelen van het gebruik van een serverloze SQL-pool zijn onder andere:

  • Een vertrouwde Transact-SQL-syntaxis voor het uitvoeren van query's op gegevens zonder dat u gegevens hoeft te kopiëren of te laden in een speciaal archief.
  • Geïntegreerde connectiviteit van een breed scala aan hulpprogramma's voor business intelligence en ad-hocquery's, waaronder de populairste stuurprogramma's.
  • Gedistribueerde queryverwerking die is gebouwd voor grootschalige gegevens en rekenkundige functies, wat resulteert in snelle queryprestaties.
  • Ingebouwde fouttolerantie voor queryuitvoering, wat resulteert in hoge betrouwbaarheid en slagingspercentages, zelfs voor langlopende query's met betrekking tot grote gegevenssets.
  • Er is geen infrastructuur voor het instellen of onderhouden van clusters. Er wordt een ingebouwd eindpunt voor deze service geboden binnen elke Azure Synapse-werkruimte, zodat u gegevens kunt opvragen zodra de werkruimte is gemaakt.
  • Er worden geen kosten in rekening gebracht voor gereserveerde resources. Er worden alleen kosten in rekening gebracht voor de gegevens die worden verwerkt door query's die u uitvoert.

Wanneer gebruikt u serverloze SQL-pools?

Serverloze SQL-pool is afgestemd op het uitvoeren van query's op de gegevens die zich in de data lake bevinden, dus naast het elimineren van beheerlast, hoeft u zich geen zorgen te maken over het opnemen van de gegevens in het systeem. U wijst de query alleen naar de gegevens die zich al in het lake bevindt en voert deze uit.

Serverloos Synapse SQL-resourcemodel is ideaal voor niet-geplande of bursty workloads die kunnen worden verwerkt met behulp van het altijd on-on serverloze SQL-eindpunt in uw Azure Synapse Analytics-werkruimte. Het gebruik van de serverloze pool helpt wanneer u exacte kosten moet weten voor elke query die wordt uitgevoerd om de kosten te bewaken en toe te kennen.

Notitie

Serverloze SQL-pool is een analysesysteem en wordt niet aanbevolen voor OLTP-workloads, zoals databases die door toepassingen worden gebruikt voor het opslaan van transactionele gegevens. Werkbelastingen die milliseconden nodig hebben en die één rij in een gegevensset willen aanwijzen, zijn niet geschikt voor een serverloze SQL-pool.

Veelvoorkomende gebruiksvoorbeelden voor serverloze SQL-pools zijn:

  • Gegevensverkenning: gegevensverkenning omvat het bladeren door de data lake om initiële inzichten over de gegevens te krijgen en is eenvoudig mogelijk met Azure Synapse Studio. U kunt door de bestanden in uw gekoppelde Data Lake Storage bladeren en de ingebouwde serverloze SQL-pool gebruiken om automatisch een SQL-script te genereren om TOP 100 rijen te selecteren uit een bestand of map, net zoals u zou doen met een tabel in SQL Server. Van daaruit kunt u projecties, filteren, groeperen en de meeste bewerkingen toepassen op de gegevens alsof de gegevens zich in een gewone SQL Server-tabel bevinden.
  • Gegevenstransformatie: Hoewel Azure Synapse Analytics geweldige mogelijkheden voor gegevenstransformaties biedt met Synapse Spark, kunnen sommige data engineers gegevenstransformatie gemakkelijker vinden om te bereiken met behulp van SQL. Met een serverloze SQL-pool kunt u gegevenstransformaties op basis van SQL uitvoeren; interactief of als onderdeel van een geautomatiseerde gegevenspijplijn.
  • Logisch datawarehouse: Na de eerste verkenning van de gegevens in de data lake kunt u externe objecten, zoals tabellen en weergaven, definiëren in een serverloze SQL-database. De gegevens blijven opgeslagen in de Data Lake-bestanden, maar worden geabstraheerd door een relationeel schema dat kan worden gebruikt door clienttoepassingen en analytische hulpprogramma's om query's uit te voeren op de gegevens, zoals in een relationele database die wordt gehost in SQL Server.