Del via


Eventhouse OneLake-tilgjengelighet

Du kan opprette en logisk kopi av KQL-databasedata i et hendelseshus ved å slå på OneLake-tilgjengelighet. Hvis du aktiverer OneLake-tilgjengelighet , kan du spørre etter dataene i KQL-databasen i Delta Lake-format via andre Fabric-motorer, for eksempel Direct Lake-modus i Power BI, Warehouse, Lakehouse, Notebooks og mer.

Delta Lake er et enhetlig data lake-tabellformat som oppnår sømløs datatilgang på tvers av alle databehandlingsmotorer i Microsoft Fabric. Hvis du vil ha mer informasjon om Delta Lake, kan du se Hva er Delta Lake?.

I denne artikkelen lærer du hvordan du slår på tilgjengeligheten av KQL-databasedata i OneLake.

Se hvordan det fungerer

Du kan aktivere OneLake-tilgjengelighet på database- eller tabellnivå. Når de aktiveres på databasenivå, gjøres alle nye tabeller og deres data tilgjengelige i OneLake. Når du aktiverer funksjonen, kan du også velge å bruke dette alternativet på eksisterende tabeller ved å velge alternativet Bruk på eksisterende tabeller. Hvis du aktiverer på tabellnivå, blir bare tabellen og dataene tilgjengelige i OneLake. Policyen for dataoppbevaring av KQL-databasen, brukes også på dataene i OneLake. Data som fjernes fra KQL-databasen på slutten av oppbevaringsperioden, fjernes også fra OneLake. Hvis du deaktiverer OneLake-tilgjengelighet, slettes data fra OneLake.

Selv om OneLake-tilgjengelighet er aktivert, kan du ikke gjøre følgende oppgaver:

  • Gi nytt navn til tabeller
  • Endre tabellskjemaer
  • Bruk sikkerhet på radnivå i tabeller
  • Data kan ikke slettes, avkortes eller fjernes

Hvis du trenger å gjøre noen av disse oppgavene, kan du bruke følgende fremgangsmåte:

Viktig

Hvis du slår av OneLake-tilgjengelighet slettes dataene fra OneLake. Når du aktiverer tilgjengelighet igjen, blir bare nye data tilgjengelig i OneLake uten tilbakefylling av de slettede dataene.

  1. Slå av OneLake-tilgjengelighet.

  2. Utfør den ønskede oppgaven.

  3. Slå på OneLake-tilgjengelighet.

Viktig

Hvis du vil ha mer informasjon om tiden det tar for data å vises i OneLake, kan du se adaptiv virkemåte.

Det er ingen ekstra lagringskostnader å slå på OneLake-tilgjengelighet. Hvis du vil ha mer informasjon, kan du se ressursforbruket.

Forutsetning

Slå på OneLake-tilgjengelighet

Du kan aktivere OneLake-tilgjengelighet enten på en KQL-database eller et tabellnivå.

  1. Hvis du vil aktivere OneLake-tilgjengelighet, blar du til OneLake-delen i detaljruten i KQL-databasen eller -tabellen.

  2. Angi tilgjengelighet til .

    Skjermbilde av OneLake-delen av databasedetaljerruten som viser tilgjengelighetsalternativet uthevet.

  3. Databasen oppdateres automatisk.

    Skjermbilde av OneLake-inndelingsdetaljene i Real-Time Intelligence når Tilgjengelighet er satt til På. Alternativet for å vise data til OneLake er aktivert.

Du har aktivert OneLake-tilgjengelighet i KQL-databasen. Du kan nå få tilgang til alle de nye dataene som er lagt til i databasen på den angitte OneLake-banen i Delta Lake-format. Du kan også velge å opprette en OneLake-snarvei fra et Lakehouse, Data Warehouse eller spørre dataene direkte via Power BI Direct Lake-modus.

Adaptiv virkemåte

Eventhouse tilbyr en robust mekanisme som intelligent grupperer innkommende datastrømmer i én eller flere Parquet-filer, strukturert for analyse. Gruppering av datastrømmer er viktig når du arbeider med å lure data. Å skrive mange små Parquet-filer i sjøen kan være ineffektivt, noe som resulterer i høyere kostnader og dårlig ytelse.

Eventhouses adaptive mekanisme kan forsinke skriveoperasjoner hvis det ikke er nok data til å opprette optimale Parquet-filer. Dette sikrer at Parquet-filer er optimale i størrelse og overholder anbefalte fremgangsmåter for Delta Lake. Eventhouse adaptive mekanisme sikrer at Parquet-filene er primet for analyse og balanserer behovet for rask datatilgjengelighet med kostnads- og ytelseshensyn.

Merk

  • Som standard kan skriveoperasjonen ta opptil 3 timer eller til filer med tilstrekkelig størrelse (vanligvis 200-256 MB) opprettes.
  • Du kan justere forsinkelsen til en verdi mellom 5 minutter og 3 timer.

Bruk for eksempel følgende kommando til å angi forsinkelsen til 5 minutter:

.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);

Forsiktig!

Hvis du justerer forsinkelsen til en kortere periode, kan det føre til en deloptimal deltatabell med et stort antall små filer, noe som kan føre til ineffektiv spørringsytelse. Den resulterende tabellen i OneLake er skrivebeskyttet og kan ikke optimaliseres etter oppretting.

Du kan overvåke hvor lenge siden nye data ble lagt til i sjøen ved å kontrollere ventetiden ved hjelp av kommandoen .show table mirroring operations.

Resultatene måles fra forrige gang data ble lagt til. Når Ventetid resulterer i 00:00:00, er alle dataene i KQL-databasen tilgjengelige i OneLake.

Vis filer

Når du aktiverer OneLake-tilgjengelighet på en tabell, opprettes en deltaloggmappe sammen med eventuelle tilsvarende JSON- og Parquet-filer. Du kan vise filene som ble gjort tilgjengelige i OneLake og deres egenskaper mens de ble værende i sanntidsintelligens.

  • Hvis du vil vise filene, holder du pekeren over en tabell i Explorer-ruten og velger deretter Mer-menyen [...]>Vis filer.

    Skjermbilde av Explorer-ruten som viser rullegardinlisten Mer-menyen i en tabell.

  • Hvis du vil vise egenskapene for deltaloggmappen eller de individuelle filene, holder du pekeren over mappen eller filen og velger deretter Mer-menyen [...]>Egenskaper.

  • Slik viser du filene i deltaloggmappen:

    1. Velg mappen _delta_log.
    2. Velg en fil for å vise tabellmetadataene og -skjemaet. Redigeringsprogrammet som åpnes, er i skrivebeskyttet format.

Få tilgang til speilingspolicy

Når OneLake-tilgjengelighet er aktivert som standard, aktiveres en speilingspolicy. Du kan bruke policyen til å overvåke dataventetid eller endre den til partisjonsdeltatabeller.

Merk

Hvis du deaktiverer OneLake-tilgjengelighet, er speilingspolicyens IsEnabled egenskap satt til usann (IsEnabled=false).

Partisjonsdeltatabeller

Du kan partisjonere deltatabellene for å forbedre spørringshastigheten. Hvis du vil ha informasjon om når du skal partisjonere OneLake-filer, kan du se Når du skal partisjonere tabeller. Hver partisjon representeres som en egen kolonne ved hjelp av PartitionName oppført i Partisjoner-listen . Dette betyr at OneLake-kopien har flere kolonner enn kildetabellen.

Hvis du vil partisjonere deltatabellene, bruker du kommandoen .alter-merge table mirroring .