Tietojen säilyttäminen Fabric tietovarasto (Esikatselu)

Koskee:✅ Microsoft Fabric -varasto

Microsoft Fabric -ohjelmassa varasto säilyttää ja ylläpitää automaattisesti erilaisia versioita datasta määritettyjen säilytysaikojen perusteella. Tämä säilytysaika määrittää, kuinka kauas ajassa taaksepäin voit suorittaa aikamatkustuskyselyitä , luoda taulukkoklooneja, käyttää palautuspisteitä ja luoda varaston snapshotteja.

Tietojen säilytys alkaa automaattisesti, kun luot varaston. Oletuksena varastot säilyttävät datahistorian 30 kalenteripäivän ajan. Voit määrittää säilytysajan arvoon 1–120 päivää. Järjestelmä poistaa vanhentuneet tiedostot automaattisesti säilytysajan päätyttyä.

Varasto säilyttää kaikki lisäykset, päivitykset ja poistot määritetyn säilytysajan puitteissa.

  • Säilytysajan pidentäminen tarjoaa pidemmän ikkunan aikamatkustuskyselyille, taulukkoklooneille menneisyydestä, palautuspisteille ja varaston tilannekuville. Pidempi säilytysaika kuitenkin lisää varastointikulutusta ja siihen liittyviä kustannuksia.
  • Säilytysajan lyhentäminen vähentää tallennuskustannuksia, mutta rajoittaa sitä, kuinka kauas taaksepäin voit kysellä tai palauttaa historiallista dataa.

Miten tietojen säilyttäminen toimii

Kun dataa muokataan, varasto ei heti hylkää aiempaa versiotilaa. Sen sijaan aiemmat versiot datasta säilytetään osana Delta Laken tapahtumalokia. Tämä versiointimekanismi mahdollistaa aikamatkailun, taulukkokloonit, palautuspisteet ja varastokuvat.

Kun historialliset dataversiot ylittävät määritetyn säilytysajan, taustalla oleva roskien keräysprosessi poistaa vanhentuneet tiedostot automaattisesti OneLakesta. Tämä puhdistusprosessi toimii asynkronisesti eikä vaikuta aktiivisiin kyselyihin tai käynnissä oleviin tapahtumiin.

Varasto mittaa säilytetyn datan iän absoluuttisina kalenteripäivinä siitä hetkestä lähtien, kun dataversio luotiin, mukaan lukien aina kun Microsoft Fabric -kapasiteetti on pysäytetty.

Säilymisaikaväli

Jos et määritä säilytysaikaa erikseen, olemassa olevat varastot käyttävät oletusaikaa 30 kalenteripäivää. Voit määrittää tietojen säilytysajan 1 päivästä 120 päivään.

Tietojen säilytyksen määrittäminen

Aseta varaston tietojen säilytysaika käyttämällä ALTER-TIETOKANTAA ... ASETA T-SQL-komento. Lisätietoja ja vaiheita löytyy osoitteesta How to configure data retention in Fabric tietovarasto.

Käyttäytyminen säilytysajan muuttamisessa

Käyttäytymisen ymmärtäminen säilytysajan muuttamisen yhteydessä auttaa suunnittelemaan muutoksia, jotta vältetään odottamattomat tietojen menetykset tai tallennustilan kasvu.

Pidennä säilytysaikaa

Kun pidennät säilytysaikaa, uusi asetus astuu voimaan välittömästi. Kuitenkaan et voi palauttaa historiallista dataa, jonka järjestelmä on jo puhdistanut edellisen lyhyemmän säilytysajan aikana. Vain ne dataversiot, jotka ovat vielä olemassa OneLakessa muutoksen aikaan, hyötyvät pidennetystä säilytysajasta.

Esimerkiksi, jos varastollasi on tällä hetkellä 7 päivän säilytysaika ja nostat sen 60 päivään, muutos on voimassa siitä eteenpäin. Järjestelmä on jo puhdistanut dataversioita ennen muutosta (yli 7 päivää), joita ei voi palauttaa. Kuitenkin kaikki dataversiot, jotka olivat vielä 7 päivän ikkunassa muutoksen aikaan, sekä mahdolliset uudet versiot jatkossa, säilytetään enintään 60 päivän ajan.

Lyhennä säilytysaikaa

Kun säilytysaikaa lyhennetään, dataversiot, jotka nyt jäävät uuden lyhyemmän säilytysajan ulkopuolelle, tulevat puhdistettaviksi. Siivousprosessi toimii taustalla asynkronisesti eikä tapahdu välittömästi. Aktiiviset kyselyt, jotka ovat jo käynnissä, eivät muutu.

Esimerkiksi, jos varastollasi on 30 päivän säilytysaika ja lyhennät sen 7 päivään, 8–30 päivää vanhat dataversiot ovat kelpoisia taustapuhdistukseen.

Important

Säilytysajan lyhentäminen on peruuttamatonta datan saatavuuden näkökulmasta.

Vaikka pidentäisit säilytysaikaa uudelleen pian sen jälkeen, lyhyemmän aikavälin ulkopuolelle jääneisiin tietoihin ei enää pääse käsiksi. Ennen säilytysajan lyhentämistä varmista, että uusi säilytysaika täyttää organisaatiosi tietojen palautus- ja vaatimustenmukaisuusvaatimukset.

Säilytyspäivän rajapäivä

time_travel_retention_cutoff_date kataloginäkymän sarake heijastaa aikaisinta päivämäärää, josta aikamatkustusdata on saatavilla, ei nykyistä konfiguroitua säilytysaikaa. Vanhimmat todelliset tiedot voivat poiketa konfiguroidusta säilytysajasta.

Käyttäjän määrittämä säilytysaika määrittelee, kuinka monta päivää historiaa järjestelmän tulisi säilyttää jatkossa. Todellinen palautettavissa oleva historia riippuu kuitenkin siitä, mitä tietoja säilytettiin ennen säilytysmuutoksia.

Kaksi tilannetta aiheuttavat eron konfiguroidun säilytyksen ja todellisen saatavilla olevan historian välillä:

  • Säilytystä vähennettiin – Varasto merkitsee välittömästi historialliset tiedot, jotka ovat vanhempia kuin uusi jätehuoltoaika ja poistaa ne pysyvästi.
  • Säilytystä lisättiin myöhemmin – varasto ei voi palauttaa poistettua historiaa. Sen täytyy odottaa, että uusi historia kertyy ennen kuin täysi konfiguroitu ikkuna on saatavilla.

Tietojen säilytystilanteet

Harkitse seuraavia skenaarioita päättäessäsi, miten pidätysaikasi konfiguroidaan:

Säännösten noudattaminen ja valvonta

Organisaatiot, joilla on sääntely- tai vaatimustenmukaisuusvaatimuksia, saattavat joutua säilyttämään tietoja pidempiä aikoja täyttääkseen tilintarkastusvelvoitteensa. 90 tai 120 päivän säilytysajan määrittäminen voi tarjota tarkastajille laajemman historiallisen ikkunan tarkastella datan muutoksia ajan myötä.

Kehitys ja testaus

Kehitys- tai testaustyötiloissa, joissa historiallinen data on vähemmän tärkeää, lyhyempi 1–7 päivän säilytysaika voi vähentää tallennuskustannuksia. Tämä reduktio on hyödyllinen, kun työtilaa käytetään nopeaan prototyyppiseen tai iteratiiviseen kehitykseen.

Kustannusten optimointi

Jos varastosi kokee usein laajamittaisia datamuutoksia (kuten päivittäiset täydet kuormat), säilytetyn historiallisen datan määrä voi kasvaa merkittävästi. Näissä tilanteissa säilytysajan lyhentäminen auttaa hallitsemaan varastointikustannuksia samalla kun se säilyttää kohtuullisen palautusikkunan.

Tietojen palautusvalmius

Tuotantovarastoissa pidempi säilytysaika tarjoaa enemmän joustavuutta datan palautukseen palautuspisteiden, taulukkokloonien ja aikamatkustuskyselyiden kautta, jos datan vahingossa korruptoituminen tapahtuu.

Miten konfiguroitava säilytys vaikuttaa riippuviin ominaisuuksiin

Konfiguroitu säilytysaika pätee tasaisesti seuraaville ominaisuuksille Fabric tietovarasto. Säilytysajan muuttaminen vaikuttaa suoraan näiden ominaisuuksien saatavuuteen ja käyttäytymiseen.

Aikamatkustus

Aikamatkailu mahdollistaa datan kyselyn sellaisena kuin se oli olemassa aiemmassa ajankohdassa säilytysjakson aikana. Kyselyvihje FOR TIMESTAMP AS OF voi hakea dataa mistä tahansa pisteestä konfiguroidun säilytysajan aikana.

Esimerkiksi, jos säilytysaika on asetettu 15 päivään, voit hakea tietoja kuten ne olivat olemassa jopa 15 kalenteripäivää aiemmin.

Kloonitaulukko

Pöytäkloonit luottavat säilymisjaksoon. Voit luoda kloonin taulusta menneisyydestä vain konfiguroidun säilytysajan puitteissa. Jos pyydät kloonia säilymisajan jälkeen, tapahtuu virhe.

Palautuspisteet

Käytä palautuspisteitä varaston palauttamiseen. Järjestelmä säilyttää sekä järjestelmän luomat että käyttäjän määrittelemät palautuspisteet konfiguroidun säilytysajan ajan. Kun säilytysaika päättyy, järjestelmä poistaa automaattisesti palautuspisteet.

  • Varasto luo automaattisesti järjestelmän luomat palautuspisteet kahdeksan tunnin välein. Nämä palautuspisteet ovat käytettävissä konfiguroidun säilytysajan ajan.
  • Käyttäjän määrittelemät palautuspisteet ovat käytettävissä konfiguroidulle säilytysajalle. Järjestelmä poistaa nämä palautuspisteet automaattisesti niiden voimassaolon jälkeen.

Fabric ylläpitää vähimmäismäärää palautuspisteitä varmistaakseen, että riittävät palautuspisteet ovat aina saatavilla.

Varastotilannevedokset

Varaston snapshotit voivat viitata dataan konfiguroidun säilytysajan puitteissa. Snapshot-aikaleima voidaan asettaa mihin tahansa pisteeseen konfiguroidun säilytysajan sisällä tai tietokannan luontiajalle, kumpi on myöhempi kumpi tahansa.

Tallennustilalaskutus

Tietojen säilytys vaikuttaa suoraan OneLake-tallennuksen kulutukseen. Jokainen säilytetty versio datasta vie tallennustilaa, ja pidemmät säilytysajat keräävät enemmän historiallisia versioita.

Säilytyskonfiguraatiota suunnitellessasi ota huomioon pidemmän datahistorian käytön ja siihen liittyvien tallennuskustannusten kompromissi. Lisätietoja tallennuksen seurannasta löytyy Laskutuksen ja käyttöoikeuden raportointi Fabric tietovarasto:ssa.

  • Säilytetyt tietotiedostot: OneLakeen parquet-tiedostoina tallennetut historialliset dataversiot kuluttavat tallennustilaa. Tallennuskustannus on verrannollinen datan muutosten määrään ja tiheyteen säilytysajan aikana.
  • Palautuspisteet: Järjestelmän luomien ja käyttäjän määrittämien palautuspisteiden metatiedot kuluttavat myös tallennustilaa. Palautuspisteet kuitenkin pääasiassa tallentavat metatietoja ja viittaavat olemassa oleviin tietotiedostoihin, joten niiden tallennuskulut ovat suhteellisen pieniä.
  • Ei laskentamaksuja säilytyksestä: Pelkästään historiallisten tietojen säilyttämisestä ei peritä laskentamaksuja. Laskentamaksut peritään vain, kun aktiivisesti haet tai palautat dataa.

Arvioidaksesi säilytysajan muutoksen tallennusvaikutusta, tarkastella:

  • Keskimääräinen päivittäinen datamuutosten määrä varastossasi.
  • Nykyinen säilytysaika ja ehdotettu uusi säilytysaika.
  • Kahden jakson välinen delta kerrottuna keskimääräisellä päivittäisellä muokkausmäärällä antaa likimääräisen muutoksen varastonkulutuksessa.

Huomioitavaa suunnittelussa

  • Määritä säilytysaika organisaatiosi tietojen palautuksen, vaatimustenmukaisuuden ja kustannusvaatimusten mukaan. Oletus 30 päivää tarjoaa tasapainon datan saatavuuden ja tallennuskustannusten välillä useimmille työkuormille.
  • Sovita säilytysajan muutokset varmuuskopiointi- ja katastrofipalautusstrategiasi kanssa. Varmista, että pysyvyysaika vastaa palautuspistetavoitteitasi (RPO).
  • Seuraa OneLake-tallennuksen kulutusta säilytysajan muuttamisen jälkeen, jotta ymmärrät vaikutuksen tallennuskustannuksiin.
  • Suunnitelmien pysyvyysaika muuttuu mahdollisimman vähäaktiivisina aikoina, jotta käyttäjä ei vaikuta siihen.
  • Säilytysaika määräytyy varastotasolla. Jos tarvitset erilaisia säilytysaikoja eri aineistoille, harkitse niiden järjestämistä erillisiksi varastoiksi. Yksittäisiä taulukkotason säilytysasetuksia ei tällä hetkellä tueta.

Rajoitukset

  • Määritä säilytysaika kokonaisina päivinä. Murtolukuja ei tueta.
  • Säilytysajan lyhentäminen ei heti palauta tallennustilaa. Vanhentuneiden tietojen siivous tapahtuu taustalla asynkronisesti.
  • Microsoft Fabric -kapasiteetin pysäyttäminen vaikuttaa jätteiden siivoustoimintaan. Prosessi ei poista historiallista dataa, joka on vanhempaa kuin nykyiset tietojen säilytysasetukset, kun kapasiteetti on tauolla. Siivoustoimet alkavat saavuttaa tilanteen, kun kapasiteetti palautuu.
  • Säilytysasetus koskee vain varastoja. Lakehousen SQL-analytiikkapäätepiste ei ole tuettu.
  • Query Insights ja SQL-auditointilokit eivät kuulu tämän tietojen säilytyskäytännön piiriin, vaan niitä hallinnoidaan erikseen.

Pudotettu esineiden säilytys (esikatselu)

Pudotetun esineen säilytys säilyttää varastot ja niihin liittyvät taulukot, skeemat, snapshotit, oikeudet ja tallennetut kyselyt konfiguroitavaksi ajaksi niiden poistamisen tai poistamisen jälkeen. Tämä varmistaa, etteivät vahingossa tapahtuneet poistot aiheuta pysyviä tietojen menetyksiä tai liiketoimintaan vaikuttavia katkoksia. Poistettu säilytys takaa vähintään 7 kalenteripäivän pidätyskauden, ja sillä on erillinen vuokralaistason säilytyskonfiguraatio. Voit määrittää pudonneiden esineiden säilytysajan Item Recovery -vuokralaisasetuksissa.

Seuraava vaihe

Miten konfiguroida tietojen säilytys Fabric tietovarasto

  • Kunnosta varasto paikalleen Microsoft Fabric