Share via


Spejling af Azure Cosmos DB (prøveversion)

Spejling i Microsoft Fabric giver en problemfri no-ETL-oplevelse, så du kan integrere dine eksisterende Azure Cosmos DB-data med resten af dine data i Microsoft Fabric. Du kan løbende replikere dine Azure Cosmos DB-data direkte til Fabric OneLake i næsten realtid uden at påvirke ydeevnen af dine transaktionsarbejdsbelastninger.

Data i OneLake gemmes i deltaformatet med åben kildekode og gøres automatisk tilgængelige for alle analysemotorer på Fabric.

Du kan bruge T-SQL til at køre komplekse aggregerede forespørgsler og Spark til dataudforskning. Du kan problemfrit få adgang til dataene i notesbøger, bruge datavidenskab til at bygge modeller til maskinel indlæring og oprette business intelligence-rapporter ved hjælp af Direct Lake drevet af Copilot integration.

Vigtigt

Spejling til Azure Cosmos DB er i øjeblikket en prøveversion. Produktionsarbejdsbelastninger understøttes ikke under prøveversionen. I øjeblikket understøttes kun Azure Cosmos DB for NoSQL-konti.

Hvorfor bruge spejling i Fabric?

Med Mirroring i Fabric behøver du ikke at samle forskellige tjenester fra flere leverandører. I stedet kan du nyde godt af et yderst integreret, færdigt og brugervenligt produkt, der er designet til at forenkle dine analysebehov og udviklet til åbenhed.

Hvis du leder efter analyser af dine driftsdata i Azure Cosmos DB, indeholder spejling:

  • No-ETL, omkostningseffektiv analyse i nærheden af realtid på Azure Cosmos DB-data uden at påvirke dit enhedsforbrug af din anmodning
  • Let at overføre data på tværs af forskellige kilder til Fabric OneLake
  • Delta-tabeloptimeringer med v-rækkefølge til lynhurtige læsninger
  • Integration med et enkelt klik med Power BI med Direct Lake og Copilot
  • Omfattende forretningsindsigt ved at samle data på tværs af forskellige kilder
  • Bedre appintegration for at få adgang til forespørgsler og visninger

OneLake-data gemmes i Delta Lake-formatet med åben kildekode, så du kan bruge dem med forskellige løsninger i og uden for Microsoft. Dette dataformat hjælper med at gøre det nemmere at bygge en enkelt dataejendom til dine analytiske behov.

Hvilke analyseoplevelser er indbygget?

Spejlede databaser er et element i Fabric Synapse Data Warehousing , der adskiller sig fra slutpunktet for Warehouse og SQL Analytics.

Diagram over Fabric Mirroring til Azure Cosmos DB.

Alle spejlede Azure Cosmos DB-databaser indeholder tre elementer, du kan interagere med i dit Fabric-arbejdsområde:

  • Det spejlede databaseelement. Spejling administrerer replikering af data til OneLake og konvertering til Parquet i et format, der er klar til analyse. Dette muliggør downstreamscenarier, f.eks. datakonstruktion, datavidenskab og meget mere.
  • SQL-analyseslutpunkt, som genereres automatisk
  • Standard semantisk model, som genereres automatisk

Spejlet database

Den spejlede database viser replikeringsstatus og de kontrolelementer, der skal stoppe eller starte replikering i Fabric OneLake. Du kan også få vist din kildedatabase i skrivebeskyttet tilstand ved hjælp af Azure Cosmos DB-dataoversigten. Ved hjælp af Data Explorer kan du få vist dine objektbeholdere i din kilde Azure Cosmos DB-database og forespørge dem. Disse handlinger bruger anmodningsenheder fra din Azure Cosmos DB-konto. Eventuelle ændringer af kildedatabasen afspejles straks i Fabric's kildedatabasevisning. Det er ikke tilladt at skrive til kildedatabasen fra Fabric, da du kun kan få vist dataene.

SQL Analytics-slutpunkt

Hver spejlede database har et automatisk genereret SQL-analyseslutpunkt, der giver en omfattende analyseoplevelse oven på OneLakes Delta-tabeller, der er oprettet af spejlingsprocessen. Du har adgang til velkendte T-SQL-kommandoer, der kan definere og forespørge om dataobjekter, men ikke manipulere dataene fra SQL-analyseslutpunktet, da det er en skrivebeskyttet kopi.

Du kan udføre følgende handlinger i SQL Analytics-slutpunktet:

  • Udforsk Delta Lake-tabeller ved hjælp af T-SQL. Hver tabel er knyttet til en objektbeholder fra din Azure Cosmos DB-database.
  • Opret forespørgsler og visninger uden kode, og udforsk dem visuelt uden at skrive en kodelinje.
  • Joinforbind og forespørg om data i andre spejlede databaser, lagre og Lakehouses i det samme arbejdsområde.

Ud over Microsoft Fabric SQL Power Query-editor er der et bredt økosystem af værktøjer. Disse værktøjer omfatter Visual Studio Code, Azure Data Studio, SQL Server Management Studio og endda GitHub Copilot. Du kan kompresse analyse og indsigtsgenerering ud fra det værktøj, du vælger.

Semantisk model

Den semantiske standardmodel er en automatisk klargjort Semantisk Power BI-model. Denne funktion gør det muligt at oprette, dele og genbruge forretningsmetrik. Du kan få flere oplysninger under semantiske modeller.

Hvordan fungerer replikering i næsten realtid?

Når du aktiverer spejling på din Azure Cosmos DB-database, indsættes, opdateres og slettes handlinger på dine OLTP-data (online transaction processing) løbende replikeres til Fabric OneLake til analyseforbrug.

Funktionen til kontinuerlig sikkerhedskopiering er en forudsætning for spejling. Du kan aktivere enten 7-dages eller 30-dages kontinuerlig sikkerhedskopiering på din Azure Cosmos DB-konto.

Bemærk

Spejling bruger ikke Azure Cosmos DB's analyselager eller ændringsfeed som en kilde til hentning af ændringsdata. Du kan fortsætte med at bruge disse funktioner uafhængigt af hinanden sammen med spejling.

Det kan tage et par minutter at replikere dine Azure Cosmos DB-data til Fabric OneLake. Afhængigt af dine datas indledende snapshot eller hyppigheden af opdateringer/sletninger kan replikering også tage længere tid i nogle tilfælde. Replikering påvirker ikke de anmodningsenheder (RU'er), du har allokeret til dine transaktionsarbejdsbelastninger.

Hvad du kan forvente af spejling

Der er et par overvejelser og understøttede scenarier, du bør overveje, før du spejler.

Overvejelser i forbindelse med konfiguration

Hvis du vil spejle en database, skal den allerede klargøres i Azure. Du skal aktivere fortløbende sikkerhedskopiering af kontoen som en forudsætning.

  • Du kan kun spejle hver database enkeltvist ad gangen. Du kan vælge, hvilken database der skal spejles.
  • Du kan spejle den samme database flere gange i det samme arbejdsområde. Som bedste praksis kan en enkelt kopi af databasen genbruges på tværs af lakehouses, lagre eller andre spejlede databaser. Du behøver ikke at konfigurere flere spejle til den samme database.
  • Du kan også spejle den samme database på tværs af forskellige Fabric-arbejdsområder eller -lejere.
  • Ændringer af Azure Cosmos DB-objektbeholdere, f.eks. tilføjelse af nye objektbeholdere og sletning af eksisterende objektbeholdere, replikeres problemfrit til Fabric. Du kan f.eks. begynde at spejle en tom database uden objektbeholdere, og hvis du spejler, hentes de objektbeholdere, der tilføjes på et senere tidspunkt.

Understøttelse af indlejrede data

Indlejrede data vises som en JSON-streng i SQL Analytics-slutpunktstabeller. Du kan bruge OPENJSON, CROSS APPLYog OUTER APPLY i T-SQL-forespørgsler eller -visninger til at udvide disse data selektivt. Hvis du bruger Power Query, kan du også anvende funktionen ToJson til at udvide disse data.

Bemærk

Fabric har en begrænsning for strengkolonner på 8 KB. Du kan få flere oplysninger under Begrænsninger for data warehouse.

Håndter skemaændringer

Spejling replikerer automatisk egenskaber på tværs af Azure Cosmos DB-elementer med skemaændringer. Alle nye egenskaber, der registreres i et element, vises som nye kolonner, og de manglende egenskaber repræsenteres som null i Fabric.

Hvis du omdøber en egenskab i et element, bevarer Fabric-tabeller både de gamle og nye kolonner. Den gamle kolonne viser null, og den nye viser den seneste værdi for alle elementer, der replikeres efter omdøbningshandlingen.

Hvis du ændrer datatypen for en egenskab i Azure Cosmos DB-elementer, understøttes ændringerne for kompatible datatyper, der kan konverteres. Hvis datatyperne ikke er kompatible til konvertering i Delta, vises de som null-værdier.

SQL Analytics-slutpunktstabeller konverterer Delta-datatyper til T-SQL-datatyper.

Duplikerede kolonnenavne

Azure Cosmos DB understøtter kolonnenavne, hvor der ikke skelnes mellem store og små bogstaver, baseret på JSON-standarden. Spejling understøtter disse duplikerede kolonnenavne ved at føje _n til kolonnenavnet, hvor n ville være en numerisk værdi.

Hvis Azure Cosmos DB-elementet f.eks. har addressName og AddressName som entydige egenskaber, har Fabric-tabeller tilsvarende addressName og AddressName_1 kolonner. Du kan få flere oplysninger under replikeringsbegrænsninger.

Sikkerhed

Forbind ioner til din kildedatabase er baseret på kontonøgler til dine Azure Cosmos DB-konti. Hvis du roterer eller genopretter nøglerne, skal du opdatere forbindelserne for at sikre, at replikering fungerer. Du kan få flere oplysninger under Forbindelser.

Kontonøgler er ikke direkte synlige for andre Fabric-brugere, når forbindelsen er oprettet. Du kan begrænse, hvem der har adgang til de forbindelser, der er oprettet i Fabric. Skrivninger er ikke tilladt til Azure Cosmos DB-databasen, hverken fra dataoversigten eller analyseslutpunktet i din spejlede database.

Spejling understøtter i øjeblikket ikke godkendelse ved hjælp af skrivebeskyttede kontonøgler, enkeltlogon (SSO) med Microsoft Entra-id'er og rollebaseret adgangskontrol eller administrerede identiteter.

Når dataene er replikeret til Fabric OneLake, skal du sikre adgang til disse data.

Funktioner til databeskyttelse

Detaljeret sikkerhed kan konfigureres i den spejlede database i Microsoft Fabric. Du kan finde flere oplysninger under Detaljerede tilladelser i Microsoft Fabric.

Du kan sikre kolonnefiltre og prædikatbaserede rækkefiltre i tabeller til roller og brugere i Microsoft Fabric:

Du kan også maskere følsomme data fra brugere, der ikke er administratorer, ved hjælp af dynamisk datamaskering:

Netværkssikkerhed

Spejling understøtter i øjeblikket ikke private slutpunkter eller kundeadministrerede nøgler (CMK) på OneLake. Spejling understøttes ikke for Azure Cosmos DB-konti med netværkssikkerhedskonfigurationer, der er mindre tilladte end alle netværk, ved hjælp af tjenesteslutpunkter, ved hjælp af private slutpunkter, ved hjælp af IP-adresser eller ved hjælp af andre indstillinger, der kan begrænse adgangen til kontoen på det offentlige netværk. Azure Cosmos DB-konti skal være åbne for alle netværk for at arbejde med spejling.

Ventetid for it-katastrofeberedskab og replikering

I Fabric kan du udrulle indhold til datacentre i andre områder end det lokale område for Fabric-lejeren. Du kan få flere oplysninger under Understøttelse af flere geografiske områder.

For en Azure Cosmos DB-konto med et primært skriveområde og flere læseområder vælger spejling det læseområde i Azure Cosmos DB, der er tættest på det område, hvor Fabric-kapaciteten er konfigureret. Dette valg hjælper med at levere replikering med lav ventetid til spejling.

Når du skifter din Azure Cosmos DB-konto til et genoprettelsesområde, vælger spejling automatisk det nærmeste Azure Cosmos DB-område igen.

Bemærk

Spejling understøtter ikke konti med flere skriveområder.

Dine Cosmos DB-data, der er replikeret til OneLake, skal konfigureres til at håndtere afbrydelser for hele området. Du kan få flere oplysninger under It-katastrofeberedskab i OneLake.

Udforsk dine data med spejling

Du kan få direkte vist og få adgang til spejlede data i OneLake. Du kan også få problemfri adgang til spejlede data uden yderligere dataflytning.

Få mere at vide om, hvordan du får adgang til OneLake ved hjælp af ADLS Gen2 API'er eller SDK, OneLake File Explorer og Azure Storage Explorer.

Du kan oprette forbindelse til SQL-analyseslutpunktet fra værktøjer som SQL Server Management Studio (SSMS) eller bruge drivere som Microsoft Open Database Forbind ivity (ODBC) og Java Database Forbind ivity (JDBC). Du kan finde flere oplysninger under Forbindelse til SQL Analytics-slutpunkter.

Du kan også få adgang til spejlede data med tjenester som:

  • Azure-tjenester som Azure Databricks, Azure HDInsight eller Azure Synapse Analytics
  • Fabric Lakehouse ved hjælp af genveje til datakonstruktion og datavidenskabsscenarier
  • Andre spejlede databaser eller lagre i Fabric-arbejdsområdet

Du kan også bygge løsninger til medaljonsarkitektur, rense og transformere de data, der lander i en spejlet database, som bronzelaget. Du kan få flere oplysninger under Understøttelse af medaljonsarkitektur i Fabric.

Prisfastsættelse

Der er i øjeblikket ingen omkostninger for spejlingsfunktionen eller lagring af spejlede data i Fabric under den offentlige prøveversion. Beregningsforbruget for forespørgsler om data via SQL, Power BI eller Spark opkræves stadig på baggrund af Fabric Capacity. Du kan finde flere oplysninger under Ofte stillede spørgsmål: Priser.

Hvis du bruger dataoversigten i Fabric-spejling, påløber du typiske omkostninger baseret på brug af anmodningsenhed (RU) for at udforske objektbeholderne og forespørge elementerne i azure Cosmos DB-kildens database. Funktionen til løbende sikkerhedskopiering af Azure Cosmos DB er en forudsætning for spejling: Der gælder standardgebyrer for løbende sikkerhedskopiering. Der er ingen ekstra gebyrer for spejling ved løbende sikkerhedskopiering af fakturering. Du kan finde flere oplysninger under Priser på Azure Cosmos DB.

Næste trin