Dela via


Analys och Business Intelligence (BI) på dina Azure Cosmos DB-data

Azure Cosmos DB erbjuder olika alternativ för att aktivera storskalig analys och BI-rapportering av dina driftdata.

För att få meningsfulla insikter om dina Azure Cosmos DB-data kan du behöva köra frågor mot flera partitioner, samlingar eller databaser. I vissa fall kan du kombinera dessa data med andra datakällor i din organisation, till exempel Azure SQL Database, Azure Data Lake Storage Gen2 osv. Du kan också fråga med aggregerade funktioner som summa, antal osv. Sådana frågor behöver tung beräkningskraft, vilket sannolikt förbrukar fler enheter för begäranden (RU:er) och därför kan dessa frågor potentiellt påverka prestanda för din verksamhetskritiska arbetsbelastning.

För att isolera transaktionsarbetsbelastningar från prestandapåverkan av komplexa analysfrågor matas databasdata in varje natt till en central plats med hjälp av komplexa ETL-pipelines (Extract-Transform-Load). Sådana ETL-baserade analyser är komplexa, kostsamma med fördröjda insikter om affärsdata.

Azure Cosmos DB hanterar dessa utmaningar genom att tillhandahålla kostnadseffektiva analyserbjudanden utan ETL.

No-ETL, nära realtidsanalys på Azure Cosmos DB

Azure Cosmos DB erbjuder no-ETL, nära realtidsanalys på dina data utan att påverka prestandan för dina transaktionsarbetsbelastningar eller enheter för begäranden (RU:er). Dessa erbjudanden tar bort behovet av komplexa ETL-pipelines, vilket gör dina Azure Cosmos DB-data sömlöst tillgängliga för analysmotorer. Med kortare svarstid till insikter kan du ge förbättrad kundupplevelse och reagera snabbare på förändringar i marknadsförhållanden eller företagsmiljöer. Här följer några exempelscenarier som du kan uppnå med snabba insikter om dina data.

Du kan aktivera no-ETL-analys och BI-rapportering i Azure Cosmos DB med hjälp av följande alternativ:

  • Spegla dina data i Microsoft Fabric
  • Aktivera Azure Synapse Link för åtkomst till data från Azure Synapse Analytics

Alternativ 1: Spegla dina Azure Cosmos DB-data i Microsoft Fabric

Med spegling kan du sömlöst föra in dina Azure Cosmos DB-databasdata i Microsoft Fabric. Utan ETL kan du få omfattande affärsinsikter om dina Azure Cosmos DB-data med hjälp av Fabrics inbyggda funktioner för analys, BI och AI.

Dina Cosmos DB-driftdata replikeras stegvis till Fabric OneLake nästan i realtid. Data i OneLake lagras i Delta Parquet-format med öppen källkod och görs tillgängliga för alla analysmotorer i Fabric. Med öppen åtkomst kan du använda den med olika Azure-tjänster, till exempel Azure Databricks, Azure HDInsight med mera. OneLake hjälper också till att förena din dataegendom för dina analytiska behov. Speglade data kan kopplas till andra data i OneLake, till exempel Lakehouses, Warehouses eller genvägar. Du kan också ansluta Azure Cosmos DB-data till andra speglade databaskällor som Azure SQL Database och Snowflake. Du kan fråga mellan Azure Cosmos DB-samlingar eller databaser som speglas i OneLake.

Med spegling i Infrastruktur behöver du inte pussla ihop olika tjänster från flera leverantörer. I stället kan du njuta av en mycket integrerad produkt från slutpunkt till slutpunkt och lätt att använda som är utformad för att förenkla dina analysbehov. Du kan använda T-SQL för att köra komplexa aggregerade frågor och Spark för datautforskning. Du kan sömlöst komma åt data i notebook-filer, använda datavetenskap för att skapa maskininlärningsmodeller och skapa Power BI-rapporter med Direct Lake som drivs av omfattande Copilot-integrering.

Diagram över Azure Cosmos DB-spegling i Microsoft Fabric.

Om du letar efter analys av dina driftdata i Azure Cosmos DB tillhandahåller spegling:

  • No-ETL, kostnadseffektiv analys i nära realtid på Azure Cosmos DB-data utan att påverka ru-förbrukningen (request unit)
  • Enkel att föra data över olika källor till Fabric OneLake.
  • Förbättrad frågeprestanda för SQL-motorn som hanterar deltatabeller med V-orderoptimeringar
  • Förbättrad starttid för Spark-motorn med djup integrering med ML/notebook-filer
  • Enklicksintegrering med Power BI med Direct Lake och Copilot
  • Bättre appintegrering för åtkomst till frågor och vyer med GraphQL
  • Öppna åtkomst till och från andra tjänster som Azure Databricks

Kom igång med spegling genom att gå till "Kom igång med speglingsguiden".

Azure Synapse Link för Azure Cosmos DB skapar en nära sömlös integrering mellan Azure Cosmos DB och Azure Synapse Analytics, vilket möjliggör no-ETL, nära realtidsanalys av dina driftdata. Transaktionsdata synkroniseras sömlöst till analysarkivet, som lagrar data i kolumnformat som är optimerat för analys.

Azure Synapse Analytics kan komma åt dessa data i analysarkivet utan ytterligare förflyttning med hjälp av Azure Synapse Link. Affärsanalytiker, datatekniker och dataexperter kan nu använda Synapse Spark eller Synapse SQL omväxlande för att köra pipelines för business intelligence, analys och maskininlärning i nära realtid.

Följande bild visar Azure Synapse Link-integreringen med Azure Cosmos DB och Azure Synapse Analytics:

Diagram över Azure Cosmos DB Synapse Link.

Viktigt!

Spegling i Microsoft Fabric är nu tillgängligt som förhandsversion för NoSql API. Den här funktionen ger alla funktioner i Azure Synapse Link med bättre analysprestanda, möjlighet att förena din dataegendom med Fabric OneLake och öppna åtkomsten till dina data i OneLake med Delta Parquet-format. Om du överväger Azure Synapse Link rekommenderar vi att du provar spegling för att utvärdera den övergripande anpassningen för din organisation. Kom igång med spegling genom att klicka här.

Kom igång med Azure Synapse Link genom att gå till Komma igång med Azure Synapse Link.

Realtidsanalys och BI i Azure Cosmos DB: Andra alternativ

Det finns några andra alternativ för att aktivera realtidsanalys på Azure Cosmos DB-data:

Även om dessa alternativ ingår för fullständighet och fungerar bra med enskilda partitionsfrågor i realtid, har dessa metoder följande utmaningar för analysfrågor:

  • Prestandapåverkan på din arbetsbelastning:

    Analytiska frågor tenderar att vara komplexa och förbrukar betydande beräkningskapacitet. När dessa frågor körs direkt mot dina Azure Cosmos DB-data kan prestanda försämras för dina transaktionsfrågor.

  • Kostnadspåverkan:

    När analytiska frågor körs direkt mot din databas eller dina samlingar ökar behovet av allokerade enheter för begäranden, eftersom analysfrågor tenderar att vara komplexa och behöver mer beräkningskraft. Ökad RU-användning kommer sannolikt att leda till betydande kostnadspåverkan över tid, om du kör aggregerade frågor.

I stället för de här alternativen rekommenderar vi att du använder spegling i Microsoft Fabric eller Azure Synapse Link, som inte tillhandahåller ETL-analys, utan att påverka transaktionsbelastningens prestanda eller enheter för begäranden.