Logiskt informationslager med Azure Synapse serverlösa SQL-pooler

Azure Cosmos DB
Azure Data Factory
Azure Data Lake
Azure Synapse Analytics
Power BI

Lösningsidéer

Den här artikeln är en lösningsidé. Om du vill att vi ska utöka innehållet med mer information, till exempel potentiella användningsfall, alternativa tjänster, implementeringsöverväganden eller prisvägledning, kan du meddela oss genom att ge GitHub feedback.

LDW-mönstret (Logical Data Warehouse) lägger ett enkelt virtualiserat relationslager ovanpå data som lagras i en datasjö eller databas. Det här virtualiseringslagret ger informationslageråtkomst utan att kräva dataflytt. Den här lösningen kan kombinera OLTP-data (Online Transaction Processing) med analysdata från datasjöar för ett lågkomplexitets- och lågsvarstidssätt för att hantera arbetsbelastningar med business intelligence (BI) och analys.

Apache Spark™ är ett varumärke som tillhör Apache Software Foundation i USA och/eller andra länder/regioner. Inget godkännande från Apache Software Foundation underförstås av användningen av det här märket.

Arkitektur

Diagram som visar ett dataflöde från vänster till höger som beskrivs i stegen.

Ladda ned en PowerPoint-fil med alla diagram i den här artikeln.

Dataflöde

  1. Azure Data Factory integrerar data från källsystem i företagsdatasjön.

  2. Enhets- och sensordata strömmar också från gränsenheter till molnet via Azure IoT Hub. Azure Stream Analytics bearbetar data och skickar dem till företagsdatasjön.

  3. Azure Synapse serverlösa SQL-pooler definierar en LDW som har logiska tabeller och vyer som är tillgängliga via Azure Synapse serverlös SQL-pool på begäran.

  4. Azure Synapse Link för Azure Cosmos DB frågar transaktionsdata i realtid via Azure Synapse serverlösa SQL-pooler. Dessa data kopplas till kall batch- och frekvent strömmande data från företagsdatasjön för att skapa logiska vyer.

  5. Rapporterings-, BI- och andra analysprogram får åtkomst till LDW-data och vyer med hjälp av Azure Synapse serverlös SQL-slutpunkt på arbetsytan.

    Anteckning

    Den serverlösa SQL-slutpunkten Azure Synapse arbetsyta är tillgänglig från alla verktyg eller tjänster som stöder TDS-anslutningar (Tabular Data Stream) till SQL Server.

Komponenter

Scenarioinformation

Genom att använda en LDW med Azure Synapse serverlösa SQL-pooler kan du koppla kalla batchdata, direktuppspelningsdata och livetransaktionsdata i en enda T-SQL-fråga eller vydefinition.

Den här lösningen undviker att flytta data via komplexa, dyra och latensbenägna pipelines för extrahering, transformering och belastning (ETL). LDW-konceptet liknar ett data lakehouse, men LDW med Azure Synapse Analytics innehåller stöd för hybridtransaktions-/analysbearbetning (HTAP). HTAP använder Azure Synapse serverlösa SQL-pooler för att köra frågor mot OLTP-data som lagras i Azure Cosmos DB.

En Azure Synapse Analytics LDW baseras på serverlösa SQL-pooler som är tillgängliga med alla Azure Synapse arbetsytor. En förbättrad version av funktionen OPENROWSET gör det möjligt för serverlösa SQL-pooler att komma åt data i Data Lake Storage.

Med den här dataåtkomsten kan du skapa relationsdatabasobjekt som tabeller och vyer över samlingar av datafiler som representerar logiska entiteter, till exempel produkter, kunder och försäljningstransaktioner. BI-verktyg som ansluter med hjälp av en standardslutpunkt SQL Server kan använda dessa logiska entiteter som dimensioner och faktatabeller.

Diagram som visar en jämförelse sida vid sida av den konceptuella LDW-designen bredvid en implementering av LDW med Azure Synapse Analytics serverlös SQL-pool.

Möjligheten att komma åt transaktionsdatalager som Azure Cosmos DB via Azure Synapse Link för Azure Cosmos DB utökar dessa funktioner. Åtkomst till OLTP-data med hjälp av HTAP-arkitekturen ger omedelbara uppdateringar utan att störa livetransaktioner.

Diagram som visar flödet av externa data till rapporteringslagret med Azure Synapse Analytics serverlös SQL-pool.

Varje Azure Synapse arbetsyta innehåller en SQL-slutpunkt på begäran. Med slutpunkten kan SQL Server administratörer och utvecklare använda välbekanta miljöer för att arbeta med LDW:er som Azure Synapse definiera serverlösa SQL-pooler.

Följande skärmbild visar SQL Server Management Studio (SSMS) som är ansluten till en Azure Synapse serverlös SQL-pool.

Skärmbild som visar SSMS ansluten till Azure Synapse SQL Server slutpunkten.

Azure Synapse serverlösa SQL-pooler stöder följande filformat:

  • Avgränsad text, till exempel CSV, TSV och TXT
  • JSON
  • Parquet

Azure Synapse serverlösa SQL-pooler stöder också Delta Lake-formatet. Det här stödet tillåter mönster som berikar i Spark, fungerar med SQL, där Apache Spark-tjänster™ som Azure Databricks eller Apache Spark-pooler i Azure Synapse teknikerdata för att skapa kurerade datauppsättningar i datasjön. I stället för att behöva läsa in dessa datauppsättningar i ett fysiskt informationslager kan du definiera en LDW över datasjön för att tillhandahålla modell-/serverlagret för rapportering.

Diagram som visar flödet av externa data till rapporteringslagret med Azure Synapse Analytics serverlös SQL-pool.

LDW med Azure Synapse serverlösa SQL-pooler är en implementering av Data Lakehouse-mönstret. Att använda Databricks SQL för att implementera en LDW är en alternativ lösning. Databricks SQL saknar dock HTAP-funktionen för Azure Synapse Link för Cosmos DB.

Potentiella användningsfall

Det här mönstret är användbart i följande fall:

  • Informationslager som betjänar lager för BI och andra analysanvändningsfall.
  • Ad hoc-utforskning av rådata i en datasjö.
  • Kostnadseffektiv dataströmning till en datasjö som inte kräver egna beräkningsresurser för att skriva data. En logisk databastabell, vy eller ad hoc-T-SQL-fråga kan komma åt data direkt från datasjön.
  • Omedelbar åtkomst till Transaktionsdata i Azure Cosmos DB för att skapa aggregeringspipelines i realtid eller ansluta till analysdata som lagras i datasjön.

Deltagare

Den här artikeln underhålls av Microsoft. Den skrevs ursprungligen av följande deltagare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg